REGRESJA n – liczność próbki ile.liczb() x – średnia arytmetyczna
Transkrypt
REGRESJA n – liczność próbki ile.liczb() x – średnia arytmetyczna
REGRESJA n – liczność próbki ile.liczb() x – średnia arytmetyczna rednia() S2 – obciąŜony estymator wariancji wariancja.popul() S*2 – nieobciąŜony estymator wariancji wariancja() S odch.standard.popul() S* odch.standardowe() α – poziom istotności u, t, F– kwantyle rozkładu normalnego standardowego, t, Snedecora REGRESJA ZMIENNEJ Y WZGLĘDEM X próbka: pary wartości (xi, yi) kowariancja z próbki: cov( x, y ) = 1 n ∑ xi yi − x y n i=1 cov( x, y ) SxS y prosta regresji cechy Y względem X estymator (obciąŜony) współczynnika korelacji: Y = aX + b r= Sy b = y − ax Sx wariancje parametrów prostej regresji: S y2 (1 − r 2 ) 2 Sa = 2 , Sb2 = S a2 ( S x2 + x 2 ) S x (n − 2) a=r n −1 (1 − r 2 ) S *y2 n−2 wyznaczanie obszaru ufności dla prostej regresji: S y)2 = wariancja resztkowa: yi' = axi + b - wartości Y obliczone na podstawie prostej regresji S = S [ S + ( xi − x ) ] = 2 yi' przedział ufności: 2 a 2 x 2 S y2ˆ + S a2 ( xi − x ) 2 n y − S y' t (1 − α / 2, n − 2) < Y ( X i ) < yi' + S y' t (1 − α / 2, n − 2) ' i i i uwaga: w poniŜszych funkcjach x i y oznaczają odpowiednie zakresy (bloki) komórek cov( x, y ) r kowariancja(x;y) pearson(x;y) statystyki regresji: po zaznaczeniu zakresu 2 × 4 komórek wstawić funkcję reglinp(y;x;;prawda) kończąc jej wprowadzanie przez naciśnięcie Ctrl_Shift_Enter Wyniki pojawiają się w tabeli: a Sa r2 b Sb S yˆ statystyka F l. st. sw oprócz tego moŜna wykorzystać funkcje: a b r2 S yˆ nachylenie(y;x) odci ta(y;x) r.kwadrat(y;x) regbłstd(y;x) t (1 − α / 2, n − 1) rozkład.t.odw(alfa;n-1) uwaga: funkcjom reglinp,nachylenie,odci ta,regbłstd dane podaje się w kolejności y;x ! natomiast w funkcjach kowariancja,pearson,r.kwadrat zakresy x i y moŜna podać w kolejności dowolnej PRZEDZIAŁY UFNOŚCI I TESTOWANIE HIPOTEZ 1. Współczynnik korelacji ρ z= 1 1+ r ln 2 1− r 1a) Przedział ufności dla ρ wyznaczamy przedział ufności dla z: 1 1 z− u (1 − α / 2) < Z < z + u (1 − α / 2) n−3 n−3 u (1 − α / 2) rozkład.normalny.s.odw(1-alfa/2) a następnie obliczamy granice przedziału dla ρ ρ = tanh(z ) tanh(z) 1b) Test istotności dla współczynnika korelacji ρ=0 H0: r n−2 statystyka testowa: t = 1− r2 H1: ρ<0 W = (− ∞,−t (1 − α , n − 2) H1: ρ>0 H1: ρ≠0 t (1 − α , n − 2) t (1 − α / 2, n − 2) H0: W = t (1 − α , n − 2),+∞ ) W = (− ∞, t (1 − α / 2, n − 2) ∪ t (1 − α / 2, n − 2),+∞ ) rozkład.t.odw(2*alfa;n-2) rozkład.t.odw(alfa;n-2) ρ = ρ0 statystyka testowa: U = ( z − z0 ) n − 3 gdzie H1: ρ < ρ0 H1: ρ > ρ0 H1: ρ ≠ ρ0 u (1 − α ) u (1 − α / 2) W = (− ∞,−u (1 − α ) z0 = 1 1 + ρ0 ln 2 1 − ρ0 W = u (1 − α ),+∞ ) W = (− ∞, u (1 − α / 2) ∪ u (1 − α / 2),+∞ ) rozkład.normalny.s.odw(1-alfa) rozkład.normalny.s.odw(1-alfa/2) 1c) Test jednorodności dla współczynnika korelacji H0: ρ1 = ρ2 1 1 + r1 1 1 + r2 (n1 − 3)(n2 − 3) statystyka testowa: U = ( z1 − z 2 ) , gdzie z1 = ln , z2 = ln n1 + n2 − 6 2 1 − r1 2 1 − r2 H1: ρ1 < ρ2 H1: ρ1 > ρ2 H1: ρ1 ≠ ρ2 W = (− ∞,−u (1 − α ) W = u (1 − α ),+∞ ) W = (− ∞, u (1 − α / 2) ∪ u (1 − α / 2),+∞ ) 2. Nachylenie prostej regresji a 2a) Przedział ufności dla a a − S at (1 − α / 2, n − 2) < a < a + S at (1 − α / 2, n − 2) 2b) Test istotności dla a H0: a = a0 a − a0 Sa statystyka testowa: t= H1: a < a0 W = (− ∞,−t (1 − α , n − 2) H1: a > a0 H1: a ≠ a0 W = t (1 − α , n − 2),+∞ ) W = (− ∞, t (1 − α / 2, n − 2) ∪ t (1 − α / 2, n − 2),+∞ ) alternatywnie, jeśli chcemy zbadać, czy nachylenie istotnie róŜni się od 0 H0: a=0 statystyka testowa: H1: a ≠ 0 F= a2 S a2 (to, co zwraca reglinp) W = F (1 − α ,1, n − 2) ) F (1 − α ,1, n − 2) rozkład.f.odw(alfa;1;n-2) 3. Parametr przesunięcia prostej regresji b 3a) Przedział ufności dla b b − Sbt (1 − α / 2, n − 2) < b < b + Sbt (1 − α / 2, n − 2) 2b) Test istotności dla b H0: b = b0 b − b0 Sb statystyka testowa: t= H1: b < b0 W = (− ∞,−t (1 − α , n − 2) H1: b > b0 H1: b ≠ b0 W = t (1 − α , n − 2),+∞ ) W = (− ∞, t (1 − α / 2, n − 2) ∪ t (1 − α / 2, n − 2),+∞ )