anova - Wydział Leśny SGGW

Transkrypt

anova - Wydział Leśny SGGW
Doświadczalnictwo leśne
Wydział Leśny SGGW
Studia II stopnia
Wykład
• Analiza wariancji (ANOVA)
POPULACJA
PRÓBA
Próbkowanie
POPULACJA
PRÓBA
Wnioskowanie
Parametr
Statystyka
Estymator
Źródła pozyskiwania danych
• Obserwacja (brak ingerencji w badany
obiekt)
• Eksperyment (KONIECZNOŚĆ ingerencji
w przedmiot badania)
– wykonanie pomiarów w sposób eliminujący
wpływ czynników nieistotnych
ANOVA
• Analiza wariancji (ANOVA = ANalysis Of
VAriance) – metoda statystyczna słuŜąca
do weryfikacji hipotezy o równości dwóch
lub większej liczby wartości średnich
arytmetycznych
• Średnie mogą pochodzić z róŜnych
populacji lub być wynikiem działania
czynnika (czynników) na jedną populację
ANOVA
• Metodę stworzył Ronald Fisher pracując
w rolniczej stacji badawczej Rothamsted
(południowa Anglia) w latach 1919-1933
• Metoda uwaŜana przez wielu za
najwaŜniejszą metodę statystyczną
• Fisher otrzymał z rąk królowej angielskiej
tytuł szlachecki za wkład w rozwój
statystyki i nauk biologicznych
Sir Ronald Fisher
• 17.02.1890 – 29.07.1962
ANOVA
• H0: µ1 = µ2
• H0: µ1 = µ2 = ... = µn
• Teoretycznie moŜna by było zastosować
wielokrotnie test t dla porównania średnich
„kaŜda z kaŜdą”, ale...
ANOVA
• ... powoduje to zwiększenie ryzyka
popełnienia błędu, bo...
• przy α=0.05 odrzucając H0 mylimy się
średnio 1 raz na 20 razy
• Jedno porównanie: prawd. , Ŝe się nie
mylimy w Ŝadnym = 0.95
• Dwa porównania: prawdopodobieństwo
0.952=0.9025
• Pięć porównań: 0.955=0.77 ...
ANOVA
• Z tego powodu konieczna jest inna
procedura polegająca na analizie
zmienności (sumy kwadratów odchyleń,
wariancji) wewnątrz i pomiędzy wariantami
doświadczenia
Trzy oszacowania wariancji
• ogólna suma kwadratów odchyleń od
średniej ogólnej / ogólne oszacowanie
wariancji
• wewnątrzgrupowa suma kwadratów
odchyleń od średnich w grupach /
wewnątrzgrupowe oszacowanie wariancji
• międzygrupowa suma kwadratów
odchyleń / międzygrupowe oszacowanie
wariancji
Rozkład F
Sumy kwadratów
• Ogólna suma kwadratów =
wewnątrzgrupowa suma kwadratów +
międzygrupowa suma kwadratów
Sumy kwadratów
• Ostatni wiersz Strefy 1 = 595
• Średnia ogólna = 518,69
• Średnia dla Strefy 1 = 582,27
• Stąd mamy:
– 595-518,69=76,31
– 595-582,27=12,73
– 582,27-518,69=63,58
• czyli 76,31=12,73+63,58
Testy post-hoc / a posteriori
• JeŜeli analiza wariancji wykaŜe istotne
róŜnice między średnimi, musimy
odpowiedzićna pytanie: które średnie są
róŜne?
• Testy wielokrotnych porównań, ale
dopiero „po fakcie” stwierdzenia braku
równości średnich
Testy post-hoc / a posteriori
•
•
•
•
•
Test LSD (NIR) Fischera
Test Tukeya (HSD)
Test Benferorriego
Test Scheffe
...
ZałoŜenia ANOVA
•
•
•
•
NiezaleŜność grup
Addytywność
Homogeniczność wariancji
Normalność rozkładu reszt
ZałoŜenia ANOVA
• Addytywność:
– czynnik wpływa na średnie wartości w
grupach, natomiast nie ma wpływu na
wariancję
ZałoŜenia ANOVA
• Addytywność:
– czynnik wpływa na średnie wartości w
grupach, natomiast nie ma wpływu na
wariancję
– w wielu wypadkach efekt czynnika zaleŜy od
wartości wyjściowej cechy (np. wzrost) –
model multiplikatywny - problem!
ZałoŜenia ANOVA
• Homogeniczność wariancji:
– poszczególne grupy nie róŜnią się
zmiennością (wariancjami)
– problem! choć statystyka F jest odporna na
niejednorodność wariancji
ZałoŜenia ANOVA
• Normalność rozkładu reszt
• Test F dość odporny na odchylenia od
normalności
• problem zwłaszcza przy małych próbach
• przy duŜych próbach średnie z rozkładów
odbiegających od normalnych mają
rozkład normalny (patrz wykład o
estymacji statystycznej)
Jedno- i wieloczynnikowa
ANOVA
• Więcej, niŜ jeden działający czynnik, np.
wpływ nie tylko strefy uszkodzenia, ale i
klasy wieku na gęstość drewna
• Model:
Konieczność uwzględnienia interakcji
Dziekuje za uwagę!

Podobne dokumenty