Analiza wariancji - teoria - E-SGH

Transkrypt

Analiza wariancji - teoria - E-SGH
ANALIZA WARIANCJI
Analiza wariancji służy weryfikacji hipotezy czy na badaną zmienną
(zwaną zmienną objaśnianą) mają wpływ jakieś czynniki – np. jak rodzaj
stosowanego nawozu (załóżmy że mamy 3 rodzaje nawozów A, B, C) wpływa
na wielkość plonów, itp. Jeśli czynnik wpływa na zmienną objaśnianą to
średnie wartości tej zmiennej powinny istotnie się różnić w zależności od
wariantu tego czynnika (tj. przeciętna wysokość plonów rośliny nawożonej
nawozem A jest istotnie wyższa niż przeciętna wielkość plonów roślin
nawożonych nawozami B czy C).
Gdy weryfikujemy wpływ jednego czynnika na zmienną objaśnianą
mamy do czynienia z analizą wariancji z klasyfikacją pojedynczą, gdy
weryfikujemy wpływ kilku czynników na zmienną objaśnianą mamy do
czynienia z wielowymiarową analizą wariancji.
Jednoczynnikowa analiza wariancji
W celu zbadania wpływu czynnika na zmienną objaśnianą dzielimy populację
na r klas (gdzie r - liczba poziomów czynnika) opisanych za pomocą zmiennych
Yi (i=1,...,r) o rozkładzie normalnym z wartościami oczekiwanymi mi (i=1,...,r) i
jednakowymi wariancjami σ2. Z każdej populacji pobieramy niezależną próbę
ni-elementową.
W następnym kroku weryfikujemy hipotezę:
H 0 : mi = m j
H 0 : mi ≠ m j
∀ij
(a więc czynnik nie ma wpływu na zmienną objaśnianą)
∃ij
(czynnik ma wpływ na zmienną objaśnianą)
Do weryfikacji hipotezy służy statystyka F:
F=
MSB
,
MSE
2
gdzie MSB =
r
SSB
, SSB = ∑ ( y i − y ) ⋅ ni , SSB - zmienność międzygrupowa, y i r −1
i =1
średnia wartość zmiennej objaśnianej w i-tej klasie w próbie.
MSE =
r ni
SSE
, SSE = ∑∑ ( yki − yi ) 2 , SSE – zmienność wewnątrzgrupowa
n−r
i =1 k =1
r
ni
SSB+SSE=SST, gdzie SST = ∑∑ ( y ki − y ) 2 = S y2 ⋅ (n − 1)
i =1 k =1
Jeśli prawdziwa jest H0 to statystyka F ma rozkład F – Snedecora z S1=r-1,
S2=n-r stopniami swobody.
Obszar krytyczny testu: P(F ≥ Fα ,S ,S ) = α
1
2