Statystyka chi2.
Transkrypt
Statystyka chi2.
Autor: Dariusz Piwczyński 1 2006-05-22 Ćwiczenie: Statystyka chi2 Przykład (EXCEL): (Wprowadzenie do statystyki dla przyrodników, Adam Łomnicki): Czy istnieje związek między wiekiem ślimaków a skłonnością do przebywania w określonym siedlisku? (EXCEL) fo (otrzymane) Młode (M) Dorosłe (D) Σsiedlisk odkryty grunt (G) 52 108 160 Roślinność zielona (R) 43 15 58 pnie drzew (D) 17 74 91 Σwieku 112 197 309 Liczba stopni swobody df=(k-1)*(w-1) Χ2 = 49,163 Χ20,05=5,991 df=2. Odrzucamy hipotezę zerową. Jeżeli jakakolwiek wartość oczekiwana w tablicy czteropolowej jest mniejsza od 10, to stosujemy poprawkę Yatesa. Wartość oczekiwaną obliczamy z proporcji: f2/(suma dla kolumny w której ona występuje)=(suma dla wiersza, w którym fe występuje)/suma wszystkich obserwacji W naszym zadaniu wartość oczekiwaną liczby ślimaków młodych na odkrytym gruncie obliczamy następująco: fe/160=112/309, czyli fe=(160*112)/309 Przykład (SAS): W folderze S:\USM_STAT\BAZY_XLS znajduje się plik skora.xls. Importuj go do SAS, a następnie sprawdź czy istnieje zależność między paleniem papierosów (palenie) a niektórymi dolegliwościami skórnymi oraz płcią osób. libname skora 'f:\grupa\nazwisko'; run; ods rtf body='f:\grupa\nazwisko\skora.rtf'; proc freq data=skora.skora; tables plec*(palenie--grudki_i)/ chisq exact; run; ods rtf close; W przypadku, gdy wartość oczekiwana jest mniejsza od 5, należy zrezygnować z testu Χ2 . Należy zastosować wtedy test Fishera. Materiały pomocnicze do przedmiotu „Metody statystyczne w naukach biologicznych” Autor: Dariusz Piwczyński 2 2006-05-22 Tabela pleć na palenie płeć palenie Liczność Procent % wiersza % kolumny 0 1 Razem kobieta 58 58.00 81.69 84.06 13 13.00 18.31 41.94 71 71.00 mężczyzna 11 11.00 37.93 15.94 18 18.00 62.07 58.06 29 29.00 69 69.00 31 31.00 100 100.00 Razem Statystyka DF Wartość Prawdop. Chi-kwadrat 1 18.4324 <.0001** Chi-kw. ilorazu wiarogodn. 1 17.7236 <.0001** Poprawka uciągl. Chi-kwadrat 1 16.4434 <.0001** Chi-kwadrat Mantela-Haenszela 1 18.2481 <.0001** Współczynnik FI 0.4293 Współczynnik wielodzielczości 0.3945 V Cramera 0.4293 Ścisły test Fishera Komórka (1,1) Liczność (F) Lewostronne Pr <= F 58 1.0000 Prawostronne Pr >= F 3.459E-05 Tabela prawdopodobieństwa (P) 3.031E-05 Obustronne Pr <= P 3.651E-05 χ2 ** - zależność między czynnikami wysoko istotna statystycznie (p≤0,01) χ2 * - zależność między czynnikami istotna statystycznie (p≤0,05) Poddana ankietyzacji populacja ludzi złożona była z 71 kobiet oraz 29 mężczyzn. Jak wynika z uzyskanych wyników, kobiety zdecydowanie rzadziej sięgały po papierosy aniżeli mężczyźni, tylko 18,31 % z nich przyznawało się do palenia. W grupie mężczyzn powyższy odsetek wyniósł aż 62,07 %. Zaobserwowana, większa skłonność mężczyzn niż kobiet do palenia papierosów została statystycznie potwierdzona. Zależność płci oraz stosunku do palenia można uznać jako wysoko istotną statystycznie Obliczone współczynniki zależności (korelacji) dowodzą przeciętnej zależności między płcią a paleniem papierosów. Materiały pomocnicze do przedmiotu „Metody statystyczne w naukach biologicznych” Autor: Dariusz Piwczyński 3 2006-05-22 Zadania (SAS, EXCEL): 1. Sprawdź czy istnieje związek między płcią, systemem studiów a odczuwaniem szczęścia, paleniem papierosów etc. 2. Poddaje ocenie zależność między rodzajem zakładu przemysłowego a wybranymi gatunkami mechowców: C_sch_r Chamobates schuetzi E_obl_r Eremaeus oblongus E_tor_r Eupelops torulosus Wcześniej jednak dokonaj przekodowania powyższych kolumn, tzn. stwórz 3 nowe kolumny zawierające „1” i „0”. „1” ma wystąpić w sytuacji, gdy dany gatunek mechowców wystąpił, zaś „0”, gdy był nieobecny w próbie. Potrzebne do rozwiązania potrzebnych problemów pliki (ankieta_2006.xls, roztocze.xls) znajdują się w: S:\USM_STAT\BAZY_XLS. Materiały pomocnicze do przedmiotu „Metody statystyczne w naukach biologicznych”