Wykład 4 - Netstrefa.pl

Transkrypt

Wykład 4 - Netstrefa.pl
STATYSTYKA I DOŚWIADCZALNICTWO
Wykład 4
Jednoczynnikowa analiza wariancji (one-way ANOVA)
w układzie całkowicie losowym
oraz porównania wielokrotne średnich
Przykładowy schemat doświadczenia jednoczynnikowego z czterema poziomami
czynnika (4 obiekty: A1, A2, A3, A4) oraz trzema powtórzeniami
Układ całkowicie losowy
A1
A2
A1
A2
A3
A4
A3
A1
A3
A4
A2
A4
Obiekty rozlosowane na obszarze całego doświadczenia w sposób losowy
Celem analizy wariancji (ANOVA) jest porównanie średnich w wielu
populacjach o rozkładzie normalnym
Założenia:
zmienne mają rozkład normalny Xi~N(m,σ2)
wariancje (a tym samym odchylenia standardowe) dla badanych
populacji są równe σ1 = σ2 = σ3 = ... = σi
Hipoteza zerowa H0: m1 = m2 = m3 =...= mi (średnie nie różnią się)
Hipoteza alternatywna H1: mi ≠ mi’ (co najmniej dwie średnie różnią się)
Przykłady zastosowań:
Porównanie wielkości plonu kilku odmian
jabłoni
Porównanie zawartości cukru w owocach
pomidorów uprawianych na różnych
podłożach
Wyniki analizy wariancji przedstawiane są najczęściej w formie następującej tabeli
sumy
kwadratów
(SS)
stopnie
swobody
(df)
średnie
kwadraty
(MS)
F
czynnik
(między grupami)
SSA
a-1
MSA
MSA/MSE
błąd
(wewnątrz grup)
SSE
N-a
MSE
całkowita
SST
N-1
źródła
zmienności
p
a – liczba poziomów czynnika
N – łączna liczebność prób
Jeżeli p<α to hipotezę zerowa odrzucamy i przyjmujemy hipotezę alternatywną, czyli
stwierdzamy, że co najmniej dwie średnie różnią się istotnie i przechodzimy do porównań
wielokrotnych, czyli porównań wszystkich możliwych par średnich.
SSE
SSA
SST
SSA + SSE = SST
Porównania wielokrotne (szczegółowe) – jest to metoda pozwalająca
określić, które średnie różnią się istotnie a które się nie róznią.
Wydzielamy grupy jednorodne, czyli podzbiory średnich, które można
uznać za takie same (nie różniące się istotnie).
Procedury porównań wielokrotnych: Tukeya, Scheff´ego,
Bonfferroniego, Duncana, Newmana–Kuelsa i inne. Wybór procedury
jest często dość dowolny (zależy od badacza).
Najczęściej wynikiem analiz jest wartość NIR ( najmniejsza istotna różnica).
Jeżeli
X i − X j ≥ NIR
to uznajemy, że średnie różnią się (różnica istotna statystycznie).
W program statystycznym Statistica zamiast wartości NIR podawany jest od razu
podział na grupy jednorodne oraz wartości p dla porównań wszystkich możliwych par
średnich (podobnie tak jak w testowaniu innych hipotez, jeśli p<α to odrzucamy
hipotezę o równości średnich czyli stwierdzamy że różnią się one istotnie)
Obliczanie NIR wg procedury Tukey’a
Wartość NIR zwiększa się wraz ze wzrostem rozproszenia
wartości w obrębie jednego obiektu (poziomu czynnika – jednej
populacji), natomiast zmniejsza się wraz ze wzrostem liczby
powtórzeń dla poszczególnych poziomów czynnika
Test Kruskala-Wallisa – jednoczynnikowa ANOVA nieparametryczna
Stosujemy jako alternatywę dla jednoczynnikowej analizy wariancji,
przy niespełnieniu założeń o normalności rozkładu
Zakłada się jednak, że rozkłady zmiennych są podobnego kształtu tj.
nie powinno się stosować tej metody gdy rozkład zmiennej zależnej w
jednej populacji jest np. prawostronnie asymetryczny a w drugiej
populacji lewostronnie asymetryczny
10
12
9
10
8
7
8
6
5
6
4
4
3
2
2
1
0
0
1
2
3
4
5
6
7
8
9
10
9
10
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
8
7
7
6
6
5
5
4
4
3
3
2
2
1
1
0
0
1
2
3
4
5
6
7
8
9
10
Hipoteza zerowa - H0: rozkłady porównywanych populacji są takie same