Wykład 4 - Netstrefa.pl
Transkrypt
Wykład 4 - Netstrefa.pl
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Jednoczynnikowa analiza wariancji (one-way ANOVA) w układzie całkowicie losowym oraz porównania wielokrotne średnich Przykładowy schemat doświadczenia jednoczynnikowego z czterema poziomami czynnika (4 obiekty: A1, A2, A3, A4) oraz trzema powtórzeniami Układ całkowicie losowy A1 A2 A1 A2 A3 A4 A3 A1 A3 A4 A2 A4 Obiekty rozlosowane na obszarze całego doświadczenia w sposób losowy Celem analizy wariancji (ANOVA) jest porównanie średnich w wielu populacjach o rozkładzie normalnym Założenia: zmienne mają rozkład normalny Xi~N(m,σ2) wariancje (a tym samym odchylenia standardowe) dla badanych populacji są równe σ1 = σ2 = σ3 = ... = σi Hipoteza zerowa H0: m1 = m2 = m3 =...= mi (średnie nie różnią się) Hipoteza alternatywna H1: mi ≠ mi’ (co najmniej dwie średnie różnią się) Przykłady zastosowań: Porównanie wielkości plonu kilku odmian jabłoni Porównanie zawartości cukru w owocach pomidorów uprawianych na różnych podłożach Wyniki analizy wariancji przedstawiane są najczęściej w formie następującej tabeli sumy kwadratów (SS) stopnie swobody (df) średnie kwadraty (MS) F czynnik (między grupami) SSA a-1 MSA MSA/MSE błąd (wewnątrz grup) SSE N-a MSE całkowita SST N-1 źródła zmienności p a – liczba poziomów czynnika N – łączna liczebność prób Jeżeli p<α to hipotezę zerowa odrzucamy i przyjmujemy hipotezę alternatywną, czyli stwierdzamy, że co najmniej dwie średnie różnią się istotnie i przechodzimy do porównań wielokrotnych, czyli porównań wszystkich możliwych par średnich. SSE SSA SST SSA + SSE = SST Porównania wielokrotne (szczegółowe) – jest to metoda pozwalająca określić, które średnie różnią się istotnie a które się nie róznią. Wydzielamy grupy jednorodne, czyli podzbiory średnich, które można uznać za takie same (nie różniące się istotnie). Procedury porównań wielokrotnych: Tukeya, Scheff´ego, Bonfferroniego, Duncana, Newmana–Kuelsa i inne. Wybór procedury jest często dość dowolny (zależy od badacza). Najczęściej wynikiem analiz jest wartość NIR ( najmniejsza istotna różnica). Jeżeli X i − X j ≥ NIR to uznajemy, że średnie różnią się (różnica istotna statystycznie). W program statystycznym Statistica zamiast wartości NIR podawany jest od razu podział na grupy jednorodne oraz wartości p dla porównań wszystkich możliwych par średnich (podobnie tak jak w testowaniu innych hipotez, jeśli p<α to odrzucamy hipotezę o równości średnich czyli stwierdzamy że różnią się one istotnie) Obliczanie NIR wg procedury Tukey’a Wartość NIR zwiększa się wraz ze wzrostem rozproszenia wartości w obrębie jednego obiektu (poziomu czynnika – jednej populacji), natomiast zmniejsza się wraz ze wzrostem liczby powtórzeń dla poszczególnych poziomów czynnika Test Kruskala-Wallisa – jednoczynnikowa ANOVA nieparametryczna Stosujemy jako alternatywę dla jednoczynnikowej analizy wariancji, przy niespełnieniu założeń o normalności rozkładu Zakłada się jednak, że rozkłady zmiennych są podobnego kształtu tj. nie powinno się stosować tej metody gdy rozkład zmiennej zależnej w jednej populacji jest np. prawostronnie asymetryczny a w drugiej populacji lewostronnie asymetryczny 10 12 9 10 8 7 8 6 5 6 4 4 3 2 2 1 0 0 1 2 3 4 5 6 7 8 9 10 9 10 8 9 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 0 1 2 3 4 5 6 7 8 9 10 Hipoteza zerowa - H0: rozkłady porównywanych populacji są takie same