Wykład: Statystyka matematyczna – wprowadzenie
Transkrypt
Wykład: Statystyka matematyczna – wprowadzenie
Metody statystyczne w naukach biologicznych 2008-04-25 21:34 Wykład: Założenia analizy wariancji. Analiza wariancji złożona i testy wielokrotnych porównań. Założenia analizy wariancji: Niezależność zmiennych objaśniających (czynników). Homogeniczność wariancji (równość wariancji): porównywane grupy nie różnią się zmiennością. Jeśli nie ma homogeniczności, to możliwe są logarytmiczne transformacje zmiennych lub też usunięcie grupy, która pod względem zmienności wyraźnie odstaje od pozostałych. Normalność: Rozkład cechy w każdej z grup winien być normalny. W praktyce często badamy czy czynnik losowy, tj. eij posiada rozkład normalny. W celu sprawdzenia tego założenia, od każdego pomiaru odejmujemy średnią wartość grupy, z której ten pomiar pochodzi, a następnie badamy rozkład tychże różnic. Jeśli reszty nie mają rozkładu normalnego, to zaleca się transformacje zmiennych. Model liniowy analizy wariancji: Każda obserwacja przedstawiana jest jako suma efektów czynników, jakie zostały uwzględnione w analizie zmienności. Yij=µ + αi + eij Czynnik stały (modele stałe): Z reguły liczba poziomów czynnika stałego jest niewielka. W badaniach uwzględniamy z góry określone poziomy czynnika. Wnioski odnosimy wyłącznie do tych poziomów czynnika, które zostały uwzględnione w analizie. Przykładem czynnika stałego może być: płeć, grupa żywieniowa, rasa, rok badań, stado, sezon doju próbnego. Czynnik losowy (modele losowe): Liczba poziomów czynnika losowego jest zwykle duża. Badaniom poddany jest losowy podzbiór wszystkich poziomów czynnika. Nasze wnioski odnosimy do wszystkich poziomów czynnika, nawet tych, które nie zostały uwzględnione w eksperymencie, np. twierdzimy, że rasa wpływ na udział tłuszczu w mleko. Przykładem czynnika losowego jest efekt matki, ojca, grupy genetycznej, rasy. Różnica między czynnikami stałymi oraz losowymi jest dość płynna, w dużej mierze zależy od postawionego do rozwiązania problemu. Obs 1 2 3 4 5 14 15 16 17 18 NrZwierzecia 409634790 409634662 409633917 509090241 509013003 409633917 409634662 409634790 509083260 509127404 KgMleka 3075.9 3355.3 3658 3821.2 4474.4 3312 3549.8 3593.9 3743.6 3765.4 Reszty -1463.26 -1183.86 -881.16 -717.96 -64.76 -1105.28 -867.48 -823.38 -673.68 -651.88 Predykcja 4539.16 4539.16 4539.16 4539.16 4539.16 4417.28 4417.28 4417.28 4417.28 4417.28 Model I analizy wariancji Yij=µ + αi + eij gdzie: Yij – wartość cechy u j-tego obiektu pochodzącego z i-tej grupy, µ - średnia ogólna, obliczona dla całej populacji, αi- stały efekt i-tej grupy, tj. różnica między średnią dla i-tej grupy i dla całej populacji. Można ten efekt traktować jako przewagę i-tej grupy nad przeciętną dla całej populacji. Autor: Dariusz Piwczyński 1 Metody statystyczne w naukach biologicznych 2008-04-25 21:34 eij – błąd losowy, resztowy. Błąd losowy jest odchyleniem danej obserwacji od średniej grupy, z jakiej ona pochodzi. Spowodowany jest zmiennością przypadkową, a ta dotyczy konkretnej obserwacji. Błąd jest to taka część obserwowanej zmienności, która nie jest wytłumaczona za pomocą modelu. Model II analizy wariancji Yij=µ + Ai + eij gdzie: Ai- losowy efekt i-tej grupy, tj. różnica między średnią dla i-tej grupy i dla całej populacji, Model dwuczynnikowy z interakcją. Analiza wariancji w układzie krzyżowym. Yijk=µ + αi + βj + (αβ)ij + eijk gdzie: (αβ)ij – efekt interakcji pomiędzy czynnikami (poprawka ze względu na interakcję). Zaleca się, aby z modelu wyeliminować takie interakcje, które są nieistotne statystycznie. Zwiększa się tym samym siłę działania czynników głównych. Jest to tym bardziej uzasadnione, jeśli: liczba stopni swobody dla błędu jest mniejsza aniżeli 5 oraz średni kwadrat odchyleń dla interakcji podzielony przez wariancję błędu jest mniejszy aniżeli 2. Interakcja, czyli współdziałanie czynników ze sobą. Jeśli interakcja jest istotna, to nie możemy porównywać średnich dla czynników głównych, konieczne jest wtedy indywidualne porównanie poszczególnych podgrup, np. strefa odległości „1” zakładu azotowego ze strefą odległości „1” w cementowni. Autor: Dariusz Piwczyński 2 Metody statystyczne w naukach biologicznych 2008-04-25 21:34 Model dwuczynnikowy, analiza wariancji w układzie hierarchicznym. Jest to sytuacja, w której określone poziomy czynnika rozważane są w obrębie czynnika nadrzędnego. np. kozioł czy też tryk kryje samice w wyłącznie w wybranych stadach. Yijk=µ + αi + βij + eijk gdzie: αi – efekt stada, βij – czynnik zagnieżdżony, tj. wpływ ojca. Autor: Dariusz Piwczyński 3 Metody statystyczne w naukach biologicznych 2008-04-25 21:34 Przykład: Samce A i B kryły samice w następującym stadach: Stado 1 A Stado 2 B Stado 3 A B Wynik analizy wariancji dwuczynnikowej z interakcją (SAS) Zmienna zależna: nGat Źródło St. sw. Suma kwadratów Średnia kwadratów Model 23 8289.47088 360.41178 Błąd 933 8743.15608 9.37101 Razem skorygowane 956 17032.62696 Wartość F 38.46 Pr > F <.0001 R-kwadrat Wsp. war. Pierwiastek MSE Średnia nGat 0.486682 21.72956 3.061211 14.08777 Źródło St. Sw. Type III Suma kw. Średnia kwadratów Wartość F Pr > F Zaklad 5 3094.331294 618.866259 66.04 <.0001 Strefa 3 3371.342609 1123.780870 119.92 <.0001 1782.901984 118.860132 12.68 <.0001 Zaklad*Strefa 15 Dependent Variable: nGat nGat, po angielsku Source DF Sum of Squares Mean Square F Value Model 23 8289.47088 360.41178 38.46 Error 933 8743.15608 9.37101 Corrected Total 956 17032.62696 R-Square Coeff Var Root MSE nGat Mean 0.486682 21.72956 3.061211 14.08777 Source DF Type III SS Mean Square F Value Zaklad 5 3094.331294 618.866259 66.04 Autor: Dariusz Piwczyński 4 Pr > F <.0001 Pr > F <.0001 Metody statystyczne w naukach biologicznych 2008-04-25 21:34 Source DF Type III SS Mean Square F Value Strefa 3 3371.342609 1123.780870 119.92 <.0001 15 1782.901984 118.860132 12.68 <.0001 Zaklad*Strefa Pr > F W sytuacji, gdy wyniki analizy wariancji dają podstawę do odrzucenia hipotezy zerowej, wykonujemy tzw. testy niezaplanowane, zwane inaczej testami a posteriori. Niedopuszczalne jest stosowanie testu t-Studenta w przypadku większej liczby porównywanych średnich (więcej niż 2), gdyż drastycznie rośnie błąd I rodzaju dla całego doświadczenia. Przy jednej parze błąd ten wynosić może 0,05, ale przy 4 średnich (6 możliwych porównań) prawdopodobieństwo, że się pomylimy wynosi: 1-0,956, czyli aż 0.26. Testy wielokrotnych porównań możemy je podzielić na 3 grupy: Analiza kontrastów (test Scheffego) Testy oparte na studentyzowanym rozstępie umożliwiające grupowanie średniach (NIR, Newmana-Keulsa, Tukey, Duncan,) Wnioskowanie na podstawie przedziałów ufności (test Scheffego, Benferroniego, test Dunneta) Testy wielokrotnych porównań wykonujemy wtedy, gdy na podstawie analizy wariancji stwierdzimy, iż czynnik wpływa istotnie na badaną cechę!!!! Autor: Dariusz Piwczyński 5 Metody statystyczne w naukach biologicznych 2008-04-25 21:34 Grupy jednorodne: są to takie grupy średnich, które nie różnią się statystycznie ze sobą. Procedury, które zmierzają do wyróżnienia grup jednorodnych nazywają się procedurami porównań wielokrotnych, procedurami jednoczesnego wnioskowania lub post-hoc. Testy te wykorzystujemy przy analizie wariancji wykonywanej w ramach Modelu I. Test Duncana jest oparty na studentyzowanym rozstępie. Poziom istotności dla całego doświadczenia wynosi 1-(1-α)n-1. W sytuacji, gdy n rośnie do nieskończoności poziom ten rośnie do jedności. W związku z czym, przy dużej liczbie porównywanych średnich prawdopodobieństwo popełnienia błędu drastycznie rośnie. Test ten stosowany jest raczej jako test towarzyszący innym testom. Test Duncana umożliwia tworzenie grup jednorodnych, czyli takich, pomiędzy którymi nie występują różnice istotne statystycznie na podstawie prób niezależnych. Kolejność działań przy wykonywaniu testu Duncana: 1. Porządkujemy rosnąco ciąg uzyskanych średnich arytmetycznych 2. Wybieramy parę średnich do porównania 3. Odczytujemy z tabel testu Duncana wartości krytyczne. Uzależnione są one od poziomu istotności, liczby stopni swobody oraz typu rozstępu. Typ rozstępu - liczba wartości średnich zawartych w jednym ciągu pomiędzy porównywanymi średnimi. 4. Wyliczamy tzw. istotny obszar zmienności: D*Sd D – odczytujemy w zależności od liczby stopni swobody (zmienność wewnątrzgrupowa) oraz typu rozstępu. Sd = 2 S w2 n gr S2w – wariancja dla zmienności wewnątrzgrupowej; ngr – przeciętna liczebność grupy ni2 1 ∑ n gr = * ∑ ni − n k − 1 ∑ i k – liczba grup doświadczalnych, ni – liczebność grupy Jeżeli |xi - xj| ≥ Sd*D0,05 to różnica pomiędzy średnimi jest istotna statystycznie; Jeżeli |xi - xj| ≥ Sd*D0,01 to różnica pomiędzy średnimi jest wysoko istotna statystycznie; Jeżeli |xi - xj| < Sd*D0,05 to różnica pomiędzy średnimi jest nieistotna statystycznie. Test NIR [test najmniejszych istotnych różnic] (LSD [least significant differences]). Jest najstarszym historycznie testem wielokrotnych porównań. Zaproponowany przez Fishera w 1949. Jego idea polega na wyznaczeniu tzw. najmniejszych istotnych różnic i porównaniu ich z różnicami średnich. Jest to test najmniej odporny na wzrost liczby wielokrotnych porównań, ponieważ poziom istotności odnosi się do pojedynczego porównania. W takim przypadku bardzo szybko wzrasta poziom istotności całego eksperymentu. Wobec powyższych test NIR stosowany jest jako test towarzyszący innym testom. Jeśli bezwzględna wartość różnicy średnich z próby jest większa aniżeli tzw. najmniejsza istotna różnica (NIR), to możemy stwierdzić, iż jest ona istotna statystycznie. Test Tukeya jest oparty o studentyzowany rozkład. Jest to test najbardziej polecany do porównania par średnich. Pozwala on wyznaczać grupy średnich jednorodnych. Występuje w dwóch odmianach: równa liczebność próbek, nierówna liczebność próbek (test Spjotvolla i Stolinea). Test Tukea jest bardziej konserwatywny aniżeli NIR, lecz mniej niż test Scheffego. Błąd pierwszego rodzaju jest przy tym teście mniejszy aniżeli w przypadku NIR, Duncan,a ponadto gwarantuje on jednakowy poziom istotności dla wszystkich porównywanych par. Autor: Dariusz Piwczyński 6 Metody statystyczne w naukach biologicznych 2008-04-25 21:34 Test Scheffe jest testem najbardziej konserwatywnym, co oznacza, że rzadziej będziemy odrzucać pojedyncze porównania niż w przypadku innych testów. Test Scheffe zapewnia łączny poziom istotności dla wszystkich porównywanych par. Test ten doskonale nadaje się nie tylko do porównania par cech, ale również uwzględnia wszelkie kontrasty. To test najbardziej zachowawczy, gdyż błąd pierwszego rodzaju jest najmniejszy. Analizę wariancji możemy wykonać w SAS za pomocą procedur ANOVA oraz GLM. ANOVA – Analysis of variance (Analiza wariancji) General Linear Models (Ogólne modele liniowe) Procedura anova w przypadku klasyfikacji pojedynczej (analiza jednoczynnikowa) oraz w przypadku układów ortogonalnych daje identyczne rezultaty, jak GLM. GLM zalecana jest w odniesieniu do klasyfikacji wieloczynnikowej, o niejednakowej wielkości grup doświadczalnych. Przykład użycia procedury anova (glm): proc anova data=biblioteka.tabela; class czynnik; model cecha = czynnik; means czynnik/ tukey; run;quit; Objaśnienia: class - nazwy czynników doświadczalnych/ model - tworzymy model analizy, zmienne zależne = zmienne niezależne (czynniki) means - wskazujemy dla jakich grup mają być wyliczone średnie i jakie testy użyte do weryfikacji różnic Autor: Dariusz Piwczyński 7 Metody statystyczne w naukach biologicznych 2008-04-25 21:34 Jak czytać istotności? System SAS The ANOVA Procedure 17:24 Monday, April 19, 2004 65 Test zakresu studentyzowanego Tukeya (HSD) dla pr_tloszac UWAGA: Ten test sprawdza wartość błędu rodzaju I eksperymentalnie. Alpha 0.01 Niepoprawne stopnie swobody 58 Kwadrat błędu średniej 11.11895 Wartość krytyczna zakresu studentyzowanego 4.60093 Porównania znaczące na poziomie 0.01 są wskazywane przez '***'. Poniżej znajduje się efekt działania opcji „CLDIFF”. Porównywane grupy dobrane są parami, przy każdej różnicy średnich znajduje się jej przedział ufności oraz informacja czy różnica jest istotna statystycznie. Jak dowodzą rezultaty testu Tukey, jagnięta rasy merynos polski różnią się wysoko istotnie z pozostałymi grupami genotypowymi. Nie stwierdzono różnic istotnych statystycznie między grupami jagniąt z udziałem rasy suffolk, stanowią one grupę jednorodną. Difference gen Comparison su su su R3 R3 R3 R2 R2 R2 mp mp mp - R3 R2 mp su R2 mp su R3 mp su R3 R2 Jednoczesny Between 99% Confidence Means Limits 1.108 2.622 6.308 -1.108 1.514 5.200 -2.622 -1.514 3.686 -6.308 -5.200 -3.686 -2.377 -1.171 1.698 -4.593 -2.154 0.693 -6.414 -5.181 -1.063 -10.918 -9.707 -8.436 4.593 6.414 10.918 2.377 5.181 9.707 1.171 2.154 8.436 -1.698 -0.693 1.063 *** *** *** *** Różnice wysoko istotne statystycznie istnieją między grupami: su i mp oraz R3 i mp. The ANOVA Procedure Test zakresu studentyzowanego Tukeya (HSD) dla pr_tloszac UWAGA: Ten test sprawdza wartość błędu rodzaju I eksperymentalnie, lecz ma wyższą wartość błędu rodzaju II niż REGWQ. Alpha 0.01 Niepoprawne stopnie swobody 58 Kwadrat błędu średniej 11.11895 Wartość krytyczna zakresu studentyzowanego 4.60093 Różnica minimalnie znacząca 4.1653 Średnia harmoniczna rozmiarów komórek 13.56662 UWAGA: Rozmiary komórek nie są równe. Means with the same letter are not significantly different. Poniżej znajduje się efekt działania opcji „LINES”. Porównywane grupy uporządkowane są malejąco. Średnie, przy których znajduje się ta sama litera stanowią, tzw. grupę średnich jednorodnych, tzn. które nie różnią się ze sobą. Porównaj z wynikami istotności różnic powyżej. Bezwzględnie należy zwrócić uwagę, iż wzrost w genotypie jagniąt udziału rasy suffolk korzystnie wpływa na procentowy udział wyrębów wartościowych w tuszy zwierząt. Tukey Grouping Autor: Dariusz Piwczyński Mean 8 N gen Metody statystyczne w naukach biologicznych 2008-04-25 21:34 A A A A A B B B 19.976 18 su 18.868 21 R3 17.354 15 R2 13.668 8 mp Różnice wysoko istotne statystycznie istnieją między grupami: su i mp oraz R3 i mp, ponieważ grupy te oznaczone są różnymi literami lub też… Średnie, przy których znajduje się te same litery stanowią grupę średnich, które nie różnią się ze sobą. Litera „A” znajduje się przy średnich grup su, R3 i mp, czyli te grupy nie różnią się ze sobą statystycznie. Litera „B” znajdująca się przy grupach R2 i su również znaczy, że nie ma między nimi różnicy istotnej. Autor: Dariusz Piwczyński 9