Wykład 7 - Wydział Leśny SGGW

Transkrypt

Wykład 7 - Wydział Leśny SGGW
Statystyka matematyczna
dla leśników
Wydział Leśny
Kierunek „leśnictwo”
Studia Stacjonarne I Stopnia
Rok akademicki 2013/2014
Wykład 7
Analiza wariancji
•
•
•
•
•
Wprowadzenie
Różne oszacowanie zmienności cech
Sumy kwadratów
ANOVA
Testy post-hoc
Źródła pozyskiwania danych
• Obserwacja
– brak ingerencji w badany obiekt
• Eksperyment
– KONIECZNOŚĆ ingerencji w przedmiot badania
– wykonanie pomiarów w sposób eliminujący wpływ
czynników nieistotnych
ANOVA
• Analiza wariancji (ANOVA = ANalysis Of
VAriance) – metoda statystyczna służąca do
weryfikacji hipotezy o równości dwóch lub
większej liczby wartości średnich
arytmetycznych
• Średnie mogą pochodzić z różnych populacji
lub być wynikiem działania czynnika
(czynników) na jedną populację
ANOVA
• Metodę stworzył Ronald Fisher pracując w
rolniczej stacji badawczej Rothamsted
(południowa Anglia) w latach 1919-1933
• Metoda uważana przez wielu za najważniejszą
metodę statystyczną
• Fisher otrzymał z rąk królowej angielskiej tytuł
szlachecki za wkład w rozwój statystyki i nauk
biologicznych
Sir Ronald Fisher
• 17.02.1890 – 29.07.1962
ANOVA
• H0: µ1 = µ2
• H0: µ1 = µ2 = ... = µn
• Teoretycznie można by było zastosować
wielokrotnie test t dla porównania średnich
„każda z każdą”, ale...
ANOVA
• ... powoduje to zwiększenie ryzyka
popełnienia błędu, bo...
• przy α=0.05 odrzucając H0 mylimy się średnio 1
raz na 20 razy
• Jedno porównanie: prawd. , że się nie mylimy w
żadnym = 0.95
• Dwa porównania: prawdopodobieństwo
0.952=0.9025
• Pięć porównań: 0.955=0.77 ...
ANOVA
• Z tego powodu konieczna jest inna procedura
polegająca na analizie zmienności (sumy
kwadratów odchyleń, wariancji) wewnątrz i
pomiędzy wariantami doświadczenia
Trzy oszacowania wariancji
• ogólna suma kwadratów odchyleń od średniej
ogólnej / ogólne oszacowanie wariancji
• wewnątrzgrupowa suma kwadratów odchyleń
od średnich w grupach / wewnątrzgrupowe
oszacowanie wariancji
• międzygrupowa suma kwadratów odchyleń /
międzygrupowe oszacowanie wariancji
ANOVA
• Parametryczny test istotności badający hipotezy o
równości średnich w wariantach doświadczenia /
dla różnych poziomów czynnika
• Hipoteza zerowa:
H0: µ1 = µ2 = ... = µn
• Hipoteza alternatywna: przynajmniej jednak
średnia jest różna od pozostałych
• Wykorzystuje statystykę testową mającą rozkład F
Rozkład F
Rozkład F
Sumy kwadratów
• Ogólna suma kwadratów = wewnątrzgrupowa
suma kwadratów + międzygrupowa suma
kwadratów
Testy post-hoc / a posteriori
• Jeżeli analiza wariancji wykaże istotne różnice
między średnimi, musimy odpowiedzićna
pytanie: które średnie są różne?
• Testy wielokrotnych porównań, ale dopiero „po
fakcie” stwierdzenia braku równości średnich
Testy post-hoc / a posteriori
• Test LSD (NIR) Fischera
• Test Tukeya (HSD)
• ...
Jedno- i wieloczynnikowa ANOVA
• Więcej, niż jeden działający czynnik, np. wpływ
nie tylko strefy uszkodzenia, ale i klasy wieku
na gęstość drewna
• Model:
Konieczność uwzględnienia interakcji
Dziękuję za uwagę!