Analiza wariancji - teoria - E-SGH
Transkrypt
Analiza wariancji - teoria - E-SGH
ANALIZA WARIANCJI Analiza wariancji służy weryfikacji hipotezy czy na badaną zmienną (zwaną zmienną objaśnianą) mają wpływ jakieś czynniki – np. jak rodzaj stosowanego nawozu (załóżmy że mamy 3 rodzaje nawozów A, B, C) wpływa na wielkość plonów, itp. Jeśli czynnik wpływa na zmienną objaśnianą to średnie wartości tej zmiennej powinny istotnie się różnić w zależności od wariantu tego czynnika (tj. przeciętna wysokość plonów rośliny nawożonej nawozem A jest istotnie wyższa niż przeciętna wielkość plonów roślin nawożonych nawozami B czy C). Gdy weryfikujemy wpływ jednego czynnika na zmienną objaśnianą mamy do czynienia z analizą wariancji z klasyfikacją pojedynczą, gdy weryfikujemy wpływ kilku czynników na zmienną objaśnianą mamy do czynienia z wielowymiarową analizą wariancji. Jednoczynnikowa analiza wariancji W celu zbadania wpływu czynnika na zmienną objaśnianą dzielimy populację na r klas (gdzie r - liczba poziomów czynnika) opisanych za pomocą zmiennych Yi (i=1,...,r) o rozkładzie normalnym z wartościami oczekiwanymi mi (i=1,...,r) i jednakowymi wariancjami σ2. Z każdej populacji pobieramy niezależną próbę ni-elementową. W następnym kroku weryfikujemy hipotezę: H 0 : mi = m j H 0 : mi ≠ m j ∀ij (a więc czynnik nie ma wpływu na zmienną objaśnianą) ∃ij (czynnik ma wpływ na zmienną objaśnianą) Do weryfikacji hipotezy służy statystyka F: F= MSB , MSE 2 gdzie MSB = r SSB , SSB = ∑ ( y i − y ) ⋅ ni , SSB - zmienność międzygrupowa, y i r −1 i =1 średnia wartość zmiennej objaśnianej w i-tej klasie w próbie. MSE = r ni SSE , SSE = ∑∑ ( yki − yi ) 2 , SSE – zmienność wewnątrzgrupowa n−r i =1 k =1 r ni SSB+SSE=SST, gdzie SST = ∑∑ ( y ki − y ) 2 = S y2 ⋅ (n − 1) i =1 k =1 Jeśli prawdziwa jest H0 to statystyka F ma rozkład F – Snedecora z S1=r-1, S2=n-r stopniami swobody. Obszar krytyczny testu: P(F ≥ Fα ,S ,S ) = α 1 2