Statystyka chi2.

Transkrypt

Statystyka chi2.
Autor: Dariusz Piwczyński
1
2006-05-22
Ćwiczenie: Statystyka chi2
Przykład (EXCEL): (Wprowadzenie do statystyki dla przyrodników, Adam Łomnicki):
Czy istnieje związek między wiekiem ślimaków a skłonnością do przebywania w określonym
siedlisku? (EXCEL)
fo
(otrzymane)
Młode (M)
Dorosłe (D)
Σsiedlisk
odkryty grunt
(G)
52
108
160
Roślinność
zielona (R)
43
15
58
pnie drzew
(D)
17
74
91
Σwieku
112
197
309
Liczba stopni swobody df=(k-1)*(w-1)
Χ2 = 49,163 Χ20,05=5,991 df=2. Odrzucamy hipotezę zerową.
Jeżeli jakakolwiek wartość oczekiwana w tablicy czteropolowej jest mniejsza od 10, to
stosujemy poprawkę Yatesa.
Wartość oczekiwaną obliczamy z proporcji:
f2/(suma dla kolumny w której ona występuje)=(suma dla wiersza, w którym fe
występuje)/suma wszystkich obserwacji
W naszym zadaniu wartość oczekiwaną liczby ślimaków młodych na odkrytym gruncie
obliczamy następująco:
fe/160=112/309, czyli fe=(160*112)/309
Przykład (SAS):
W folderze S:\USM_STAT\BAZY_XLS znajduje się plik skora.xls. Importuj go do SAS, a
następnie sprawdź czy istnieje zależność między paleniem papierosów (palenie) a niektórymi
dolegliwościami skórnymi oraz płcią osób.
libname skora 'f:\grupa\nazwisko';
run;
ods rtf body='f:\grupa\nazwisko\skora.rtf';
proc freq data=skora.skora;
tables plec*(palenie--grudki_i)/ chisq exact;
run;
ods rtf close;
W przypadku, gdy wartość oczekiwana jest mniejsza od 5, należy zrezygnować z testu
Χ2 . Należy zastosować wtedy test Fishera.
Materiały pomocnicze do przedmiotu „Metody statystyczne w naukach biologicznych”
Autor: Dariusz Piwczyński
2
2006-05-22
Tabela pleć na palenie
płeć
palenie
Liczność
Procent
% wiersza
% kolumny
0
1
Razem
kobieta
58
58.00
81.69
84.06
13
13.00
18.31
41.94
71
71.00
mężczyzna
11
11.00
37.93
15.94
18
18.00
62.07
58.06
29
29.00
69
69.00
31
31.00
100
100.00
Razem
Statystyka
DF
Wartość
Prawdop.
Chi-kwadrat
1
18.4324
<.0001**
Chi-kw. ilorazu wiarogodn.
1
17.7236
<.0001**
Poprawka uciągl. Chi-kwadrat
1
16.4434
<.0001**
Chi-kwadrat Mantela-Haenszela
1
18.2481
<.0001**
Współczynnik FI
0.4293
Współczynnik wielodzielczości
0.3945
V Cramera
0.4293
Ścisły test Fishera
Komórka (1,1) Liczność (F)
Lewostronne Pr <= F
58
1.0000
Prawostronne Pr >= F
3.459E-05
Tabela prawdopodobieństwa (P)
3.031E-05
Obustronne Pr <= P
3.651E-05
χ2 ** - zależność między czynnikami wysoko istotna statystycznie (p≤0,01)
χ2 * - zależność między czynnikami istotna statystycznie (p≤0,05)
Poddana ankietyzacji populacja ludzi złożona była z 71 kobiet oraz 29 mężczyzn. Jak
wynika z uzyskanych wyników, kobiety zdecydowanie rzadziej sięgały po papierosy aniżeli
mężczyźni, tylko 18,31 % z nich przyznawało się do palenia. W grupie mężczyzn powyższy
odsetek wyniósł aż 62,07 %. Zaobserwowana, większa skłonność mężczyzn niż kobiet do
palenia papierosów została statystycznie potwierdzona. Zależność płci oraz stosunku do
palenia można uznać jako wysoko istotną statystycznie
Obliczone współczynniki zależności (korelacji) dowodzą przeciętnej zależności między
płcią a paleniem papierosów.
Materiały pomocnicze do przedmiotu „Metody statystyczne w naukach biologicznych”
Autor: Dariusz Piwczyński
3
2006-05-22
Zadania (SAS, EXCEL):
1.
Sprawdź czy istnieje związek między płcią, systemem studiów a odczuwaniem
szczęścia, paleniem papierosów etc.
2.
Poddaje ocenie zależność między rodzajem zakładu przemysłowego a wybranymi
gatunkami mechowców:
C_sch_r
Chamobates schuetzi
E_obl_r
Eremaeus oblongus
E_tor_r
Eupelops torulosus
Wcześniej jednak dokonaj przekodowania powyższych kolumn, tzn. stwórz 3 nowe kolumny
zawierające „1” i „0”. „1” ma wystąpić w sytuacji, gdy dany gatunek mechowców wystąpił,
zaś „0”, gdy był nieobecny w próbie.
Potrzebne do rozwiązania potrzebnych problemów pliki (ankieta_2006.xls, roztocze.xls)
znajdują się w: S:\USM_STAT\BAZY_XLS.
Materiały pomocnicze do przedmiotu „Metody statystyczne w naukach biologicznych”