Informacje na temat Projektu 2 – Statystyka Stosowana

Transkrypt

Informacje na temat Projektu 2 – Statystyka Stosowana
Informacje na temat Projektu 2 – Statystyka Stosowana
Zajęcia laboratoryjne
1. Cel projektu
Celem projektu jest wykonanie analizy statystycznej dla jednej cechy
opisującej dwie niezależne (różne) populacje A i B na podstawie
wylosowanych dwóch prób {X1, X2,…,Xn}, {Y1, Y2,…,Ym} o licznościach
odpowiednio n i m. Zakładamy, że rozkład badanej cechy jest normalny.
2. Źródło danych
Dane w postaci surowych danych (nie przetworzonych) do analiz mogą
być pozyskane z Internetu lub innych źródeł. Raport powinien zawierać
informację na temat źródła pozyskanych danych. Oczywiście niezależne
próby muszą dotyczyć tej samej badanej cechy i powinny być wybrane
losowo. Przykładowo takimi próbami mogą być wylosowane głosy w
dwóch różnych województwach podczas wyborów. Innym przykładem
mogą być wyniki testów na inteligencję uczniów w dwóch różnych
szkołach. Wybór tematyki zależy od inwencji autora projektu.
Poprawność i oryginalność wyboru próbek do analizy będzie również
przedmiotem oceny projektu.
3. Zakres analiz (w analizach przyjąć poziom istotności α=0,05)
a. uzasadnienie, że próby zostały wybrane losowo (musi to wynikać z
opisów)
b. sprawdzenie, czy próbki mają przybliżony rozkład normalny
c. wyznaczyć dwa przedziały ufności dla średnich badanej cechy w
populacjach A i B..
d. wyznaczyć dwa przedziały ufności dla wariancji badanej cechy w
populacjach A i B.
e. przeprowadzić test statystyczny z hipotezą zerową, że wartości
średnie w obydwu populacjach A i B, z których zostały pobrane
próbki, są takie same (hipoteza alternatywna może być
jednostronna lub dwustronna). Obliczyć p-wartość dla tego testu.
1
f. w przypadku odrzucenia hipotezy zerowej wykonać kolejny test
statystyczny, w którym hipoteza zerowa stwierdza, że różnica
średnich w dwóch populacjach jest równa określonej konkretnej
wartości (jakiej ?)
g. wyznaczyć przedział ufności dla różnicy wartości przeciętnych
populacji A i B (𝑋̅ − 𝑌̅).
4. Prezentacja własnych wniosków
Zwięzłe wnioski powinny być zaprezentowane w punktach na końcu
raportu. Długie eseje literackie i spekulacje nie będą mile widziane (będę
odejmował punkty w takiej sytuacji).
5. Sposób oceny raportu.
a. przeprowadzenie analiz statystycznych – 3 pkt
b. jakość wniosków – 2 pkt
6. Uwagi
a. Analizy mogą być wykonane w Excelu i/lub w programie
„statistica”.
b. Proszę w raporcie nie umieszczać tabel i wykresów, z których nic
nie wynika
c. Aby uzyskać więcej punktów za wnioski, warto znaleźć ciekawe
dane do analiz, które mogą prowadzić do sensownych wniosków.
Jeśli analiza statystyczna nie prowadzi do żadnych wniosków, jest
bezwartościowa
d. Raport w formie pliku pdf w objętości nie większej niż 4 strony
(proszę sobie wybrać taką tematykę, którą można zaprezentować
na 4 stronach) formatu A4 (czcionka min 12 pkt) proszę przesłać
najpóźniej do 31.05.2016 r. Raporty wysłane po tym terminie nie
będą sprawdzane. Proszę nie wysyłać więcej niż jeden plik pdf.
Jerzy Legut
2