anova - Wydział Leśny SGGW
Transkrypt
anova - Wydział Leśny SGGW
Doświadczalnictwo leśne Wydział Leśny SGGW Studia II stopnia Wykład • Analiza wariancji (ANOVA) POPULACJA PRÓBA Próbkowanie POPULACJA PRÓBA Wnioskowanie Parametr Statystyka Estymator Źródła pozyskiwania danych • Obserwacja (brak ingerencji w badany obiekt) • Eksperyment (KONIECZNOŚĆ ingerencji w przedmiot badania) – wykonanie pomiarów w sposób eliminujący wpływ czynników nieistotnych ANOVA • Analiza wariancji (ANOVA = ANalysis Of VAriance) – metoda statystyczna słuŜąca do weryfikacji hipotezy o równości dwóch lub większej liczby wartości średnich arytmetycznych • Średnie mogą pochodzić z róŜnych populacji lub być wynikiem działania czynnika (czynników) na jedną populację ANOVA • Metodę stworzył Ronald Fisher pracując w rolniczej stacji badawczej Rothamsted (południowa Anglia) w latach 1919-1933 • Metoda uwaŜana przez wielu za najwaŜniejszą metodę statystyczną • Fisher otrzymał z rąk królowej angielskiej tytuł szlachecki za wkład w rozwój statystyki i nauk biologicznych Sir Ronald Fisher • 17.02.1890 – 29.07.1962 ANOVA • H0: µ1 = µ2 • H0: µ1 = µ2 = ... = µn • Teoretycznie moŜna by było zastosować wielokrotnie test t dla porównania średnich „kaŜda z kaŜdą”, ale... ANOVA • ... powoduje to zwiększenie ryzyka popełnienia błędu, bo... • przy α=0.05 odrzucając H0 mylimy się średnio 1 raz na 20 razy • Jedno porównanie: prawd. , Ŝe się nie mylimy w Ŝadnym = 0.95 • Dwa porównania: prawdopodobieństwo 0.952=0.9025 • Pięć porównań: 0.955=0.77 ... ANOVA • Z tego powodu konieczna jest inna procedura polegająca na analizie zmienności (sumy kwadratów odchyleń, wariancji) wewnątrz i pomiędzy wariantami doświadczenia Trzy oszacowania wariancji • ogólna suma kwadratów odchyleń od średniej ogólnej / ogólne oszacowanie wariancji • wewnątrzgrupowa suma kwadratów odchyleń od średnich w grupach / wewnątrzgrupowe oszacowanie wariancji • międzygrupowa suma kwadratów odchyleń / międzygrupowe oszacowanie wariancji Rozkład F Sumy kwadratów • Ogólna suma kwadratów = wewnątrzgrupowa suma kwadratów + międzygrupowa suma kwadratów Sumy kwadratów • Ostatni wiersz Strefy 1 = 595 • Średnia ogólna = 518,69 • Średnia dla Strefy 1 = 582,27 • Stąd mamy: – 595-518,69=76,31 – 595-582,27=12,73 – 582,27-518,69=63,58 • czyli 76,31=12,73+63,58 Testy post-hoc / a posteriori • JeŜeli analiza wariancji wykaŜe istotne róŜnice między średnimi, musimy odpowiedzićna pytanie: które średnie są róŜne? • Testy wielokrotnych porównań, ale dopiero „po fakcie” stwierdzenia braku równości średnich Testy post-hoc / a posteriori • • • • • Test LSD (NIR) Fischera Test Tukeya (HSD) Test Benferorriego Test Scheffe ... ZałoŜenia ANOVA • • • • NiezaleŜność grup Addytywność Homogeniczność wariancji Normalność rozkładu reszt ZałoŜenia ANOVA • Addytywność: – czynnik wpływa na średnie wartości w grupach, natomiast nie ma wpływu na wariancję ZałoŜenia ANOVA • Addytywność: – czynnik wpływa na średnie wartości w grupach, natomiast nie ma wpływu na wariancję – w wielu wypadkach efekt czynnika zaleŜy od wartości wyjściowej cechy (np. wzrost) – model multiplikatywny - problem! ZałoŜenia ANOVA • Homogeniczność wariancji: – poszczególne grupy nie róŜnią się zmiennością (wariancjami) – problem! choć statystyka F jest odporna na niejednorodność wariancji ZałoŜenia ANOVA • Normalność rozkładu reszt • Test F dość odporny na odchylenia od normalności • problem zwłaszcza przy małych próbach • przy duŜych próbach średnie z rozkładów odbiegających od normalnych mają rozkład normalny (patrz wykład o estymacji statystycznej) Jedno- i wieloczynnikowa ANOVA • Więcej, niŜ jeden działający czynnik, np. wpływ nie tylko strefy uszkodzenia, ale i klasy wieku na gęstość drewna • Model: Konieczność uwzględnienia interakcji Dziekuje za uwagę!