Wykład 7 - Wydział Leśny SGGW
Transkrypt
Wykład 7 - Wydział Leśny SGGW
Statystyka matematyczna dla leśników Wydział Leśny Kierunek „leśnictwo” Studia Stacjonarne I Stopnia Rok akademicki 2013/2014 Wykład 7 Analiza wariancji • • • • • Wprowadzenie Różne oszacowanie zmienności cech Sumy kwadratów ANOVA Testy post-hoc Źródła pozyskiwania danych • Obserwacja – brak ingerencji w badany obiekt • Eksperyment – KONIECZNOŚĆ ingerencji w przedmiot badania – wykonanie pomiarów w sposób eliminujący wpływ czynników nieistotnych ANOVA • Analiza wariancji (ANOVA = ANalysis Of VAriance) – metoda statystyczna służąca do weryfikacji hipotezy o równości dwóch lub większej liczby wartości średnich arytmetycznych • Średnie mogą pochodzić z różnych populacji lub być wynikiem działania czynnika (czynników) na jedną populację ANOVA • Metodę stworzył Ronald Fisher pracując w rolniczej stacji badawczej Rothamsted (południowa Anglia) w latach 1919-1933 • Metoda uważana przez wielu za najważniejszą metodę statystyczną • Fisher otrzymał z rąk królowej angielskiej tytuł szlachecki za wkład w rozwój statystyki i nauk biologicznych Sir Ronald Fisher • 17.02.1890 – 29.07.1962 ANOVA • H0: µ1 = µ2 • H0: µ1 = µ2 = ... = µn • Teoretycznie można by było zastosować wielokrotnie test t dla porównania średnich „każda z każdą”, ale... ANOVA • ... powoduje to zwiększenie ryzyka popełnienia błędu, bo... • przy α=0.05 odrzucając H0 mylimy się średnio 1 raz na 20 razy • Jedno porównanie: prawd. , że się nie mylimy w żadnym = 0.95 • Dwa porównania: prawdopodobieństwo 0.952=0.9025 • Pięć porównań: 0.955=0.77 ... ANOVA • Z tego powodu konieczna jest inna procedura polegająca na analizie zmienności (sumy kwadratów odchyleń, wariancji) wewnątrz i pomiędzy wariantami doświadczenia Trzy oszacowania wariancji • ogólna suma kwadratów odchyleń od średniej ogólnej / ogólne oszacowanie wariancji • wewnątrzgrupowa suma kwadratów odchyleń od średnich w grupach / wewnątrzgrupowe oszacowanie wariancji • międzygrupowa suma kwadratów odchyleń / międzygrupowe oszacowanie wariancji ANOVA • Parametryczny test istotności badający hipotezy o równości średnich w wariantach doświadczenia / dla różnych poziomów czynnika • Hipoteza zerowa: H0: µ1 = µ2 = ... = µn • Hipoteza alternatywna: przynajmniej jednak średnia jest różna od pozostałych • Wykorzystuje statystykę testową mającą rozkład F Rozkład F Rozkład F Sumy kwadratów • Ogólna suma kwadratów = wewnątrzgrupowa suma kwadratów + międzygrupowa suma kwadratów Testy post-hoc / a posteriori • Jeżeli analiza wariancji wykaże istotne różnice między średnimi, musimy odpowiedzićna pytanie: które średnie są różne? • Testy wielokrotnych porównań, ale dopiero „po fakcie” stwierdzenia braku równości średnich Testy post-hoc / a posteriori • Test LSD (NIR) Fischera • Test Tukeya (HSD) • ... Jedno- i wieloczynnikowa ANOVA • Więcej, niż jeden działający czynnik, np. wpływ nie tylko strefy uszkodzenia, ale i klasy wieku na gęstość drewna • Model: Konieczność uwzględnienia interakcji Dziękuję za uwagę!