Informacje na temat Projektu 2 – Statystyka Stosowana
Transkrypt
Informacje na temat Projektu 2 – Statystyka Stosowana
Informacje na temat Projektu 2 – Statystyka Stosowana Zajęcia laboratoryjne 1. Cel projektu Celem projektu jest wykonanie analizy statystycznej dla jednej cechy opisującej dwie niezależne (różne) populacje A i B na podstawie wylosowanych dwóch prób {X1, X2,…,Xn}, {Y1, Y2,…,Ym} o licznościach odpowiednio n i m. Zakładamy, że rozkład badanej cechy jest normalny. 2. Źródło danych Dane w postaci surowych danych (nie przetworzonych) do analiz mogą być pozyskane z Internetu lub innych źródeł. Raport powinien zawierać informację na temat źródła pozyskanych danych. Oczywiście niezależne próby muszą dotyczyć tej samej badanej cechy i powinny być wybrane losowo. Przykładowo takimi próbami mogą być wylosowane głosy w dwóch różnych województwach podczas wyborów. Innym przykładem mogą być wyniki testów na inteligencję uczniów w dwóch różnych szkołach. Wybór tematyki zależy od inwencji autora projektu. Poprawność i oryginalność wyboru próbek do analizy będzie również przedmiotem oceny projektu. 3. Zakres analiz (w analizach przyjąć poziom istotności α=0,05) a. uzasadnienie, że próby zostały wybrane losowo (musi to wynikać z opisów) b. sprawdzenie, czy próbki mają przybliżony rozkład normalny c. wyznaczyć dwa przedziały ufności dla średnich badanej cechy w populacjach A i B.. d. wyznaczyć dwa przedziały ufności dla wariancji badanej cechy w populacjach A i B. e. przeprowadzić test statystyczny z hipotezą zerową, że wartości średnie w obydwu populacjach A i B, z których zostały pobrane próbki, są takie same (hipoteza alternatywna może być jednostronna lub dwustronna). Obliczyć p-wartość dla tego testu. 1 f. w przypadku odrzucenia hipotezy zerowej wykonać kolejny test statystyczny, w którym hipoteza zerowa stwierdza, że różnica średnich w dwóch populacjach jest równa określonej konkretnej wartości (jakiej ?) g. wyznaczyć przedział ufności dla różnicy wartości przeciętnych populacji A i B (𝑋̅ − 𝑌̅). 4. Prezentacja własnych wniosków Zwięzłe wnioski powinny być zaprezentowane w punktach na końcu raportu. Długie eseje literackie i spekulacje nie będą mile widziane (będę odejmował punkty w takiej sytuacji). 5. Sposób oceny raportu. a. przeprowadzenie analiz statystycznych – 3 pkt b. jakość wniosków – 2 pkt 6. Uwagi a. Analizy mogą być wykonane w Excelu i/lub w programie „statistica”. b. Proszę w raporcie nie umieszczać tabel i wykresów, z których nic nie wynika c. Aby uzyskać więcej punktów za wnioski, warto znaleźć ciekawe dane do analiz, które mogą prowadzić do sensownych wniosków. Jeśli analiza statystyczna nie prowadzi do żadnych wniosków, jest bezwartościowa d. Raport w formie pliku pdf w objętości nie większej niż 4 strony (proszę sobie wybrać taką tematykę, którą można zaprezentować na 4 stronach) formatu A4 (czcionka min 12 pkt) proszę przesłać najpóźniej do 31.05.2016 r. Raporty wysłane po tym terminie nie będą sprawdzane. Proszę nie wysyłać więcej niż jeden plik pdf. Jerzy Legut 2