REGRESJA n – liczność próbki ile.liczb() x – średnia arytmetyczna

Transkrypt

REGRESJA n – liczność próbki ile.liczb() x – średnia arytmetyczna
REGRESJA
n – liczność próbki
ile.liczb()
x – średnia arytmetyczna
rednia()
S2 – obciąŜony estymator wariancji
wariancja.popul()
S*2 – nieobciąŜony estymator wariancji
wariancja()
S
odch.standard.popul()
S*
odch.standardowe()
α – poziom istotności
u, t, F– kwantyle rozkładu normalnego standardowego, t, Snedecora
REGRESJA ZMIENNEJ Y WZGLĘDEM X
próbka: pary wartości (xi, yi)
kowariancja z próbki: cov( x, y ) =
1 n
∑ xi yi − x y
n i=1
cov( x, y )
SxS y
prosta regresji cechy Y względem X
estymator (obciąŜony) współczynnika korelacji:
Y = aX + b
r=
Sy
b = y − ax
Sx
wariancje parametrów prostej regresji:
S y2 (1 − r 2 )
2
Sa = 2
,
Sb2 = S a2 ( S x2 + x 2 )
S x (n − 2)
a=r
n −1
(1 − r 2 ) S *y2
n−2
wyznaczanie obszaru ufności dla prostej regresji:
S y)2 =
wariancja resztkowa:
yi' = axi + b
- wartości Y obliczone na podstawie prostej regresji
S = S [ S + ( xi − x ) ] =
2
yi'
przedział ufności:
2
a
2
x
2
S y2ˆ
+ S a2 ( xi − x ) 2
n
y − S y' t (1 − α / 2, n − 2) < Y ( X i ) < yi' + S y' t (1 − α / 2, n − 2)
'
i
i
i
uwaga: w poniŜszych funkcjach x i y oznaczają odpowiednie zakresy (bloki) komórek
cov( x, y )
r
kowariancja(x;y)
pearson(x;y)
statystyki regresji: po zaznaczeniu zakresu 2 × 4 komórek wstawić funkcję
reglinp(y;x;;prawda)
kończąc jej wprowadzanie przez naciśnięcie Ctrl_Shift_Enter
Wyniki pojawiają się w tabeli:
a
Sa
r2
b
Sb
S yˆ
statystyka F
l. st. sw
oprócz tego moŜna wykorzystać funkcje:
a
b
r2
S yˆ
nachylenie(y;x)
odci ta(y;x)
r.kwadrat(y;x)
regbłstd(y;x)
t (1 − α / 2, n − 1)
rozkład.t.odw(alfa;n-1)
uwaga:
funkcjom reglinp,nachylenie,odci ta,regbłstd dane podaje się w kolejności
y;x !
natomiast w funkcjach kowariancja,pearson,r.kwadrat zakresy x i y moŜna podać
w kolejności dowolnej
PRZEDZIAŁY UFNOŚCI I TESTOWANIE HIPOTEZ
1. Współczynnik korelacji ρ
z=
1 1+ r
ln
2 1− r
1a) Przedział ufności dla ρ
wyznaczamy przedział ufności dla z:
1
1
z−
u (1 − α / 2) < Z < z +
u (1 − α / 2)
n−3
n−3
u (1 − α / 2)
rozkład.normalny.s.odw(1-alfa/2)
a następnie obliczamy granice przedziału dla ρ
ρ = tanh(z )
tanh(z)
1b) Test istotności dla współczynnika korelacji
ρ=0
H0:
r
n−2
statystyka testowa: t =
1− r2
H1:
ρ<0
W = (− ∞,−t (1 − α , n − 2)
H1:
ρ>0
H1:
ρ≠0
t (1 − α , n − 2)
t (1 − α / 2, n − 2)
H0:
W = t (1 − α , n − 2),+∞ )
W = (− ∞, t (1 − α / 2, n − 2) ∪ t (1 − α / 2, n − 2),+∞ )
rozkład.t.odw(2*alfa;n-2)
rozkład.t.odw(alfa;n-2)
ρ = ρ0
statystyka testowa: U = ( z − z0 ) n − 3 gdzie
H1:
ρ < ρ0
H1:
ρ > ρ0
H1:
ρ ≠ ρ0
u (1 − α )
u (1 − α / 2)
W = (− ∞,−u (1 − α )
z0 =
1 1 + ρ0
ln
2 1 − ρ0
W = u (1 − α ),+∞ )
W = (− ∞, u (1 − α / 2) ∪ u (1 − α / 2),+∞ )
rozkład.normalny.s.odw(1-alfa)
rozkład.normalny.s.odw(1-alfa/2)
1c) Test jednorodności dla współczynnika korelacji
H0:
ρ1 = ρ2
1 1 + r1
1 1 + r2
(n1 − 3)(n2 − 3)
statystyka testowa: U = ( z1 − z 2 )
, gdzie z1 = ln
, z2 = ln
n1 + n2 − 6
2 1 − r1
2 1 − r2
H1:
ρ1 < ρ2
H1:
ρ1 > ρ2
H1:
ρ1 ≠ ρ2
W = (− ∞,−u (1 − α )
W = u (1 − α ),+∞ )
W = (− ∞, u (1 − α / 2) ∪ u (1 − α / 2),+∞ )
2. Nachylenie prostej regresji a
2a) Przedział ufności dla a
a − S at (1 − α / 2, n − 2) < a < a + S at (1 − α / 2, n − 2)
2b) Test istotności dla a
H0:
a = a0
a − a0
Sa
statystyka testowa:
t=
H1:
a < a0
W = (− ∞,−t (1 − α , n − 2)
H1:
a > a0
H1:
a ≠ a0
W = t (1 − α , n − 2),+∞ )
W = (− ∞, t (1 − α / 2, n − 2) ∪ t (1 − α / 2, n − 2),+∞ )
alternatywnie, jeśli chcemy zbadać, czy nachylenie istotnie róŜni się od 0
H0:
a=0
statystyka testowa:
H1:
a ≠ 0
F=
a2
S a2
(to, co zwraca reglinp)
W = F (1 − α ,1, n − 2) )
F (1 − α ,1, n − 2)
rozkład.f.odw(alfa;1;n-2)
3. Parametr przesunięcia prostej regresji b
3a) Przedział ufności dla b
b − Sbt (1 − α / 2, n − 2) < b < b + Sbt (1 − α / 2, n − 2)
2b) Test istotności dla b
H0:
b = b0
b − b0
Sb
statystyka testowa:
t=
H1:
b < b0
W = (− ∞,−t (1 − α , n − 2)
H1:
b > b0
H1:
b ≠ b0
W = t (1 − α , n − 2),+∞ )
W = (− ∞, t (1 − α / 2, n − 2) ∪ t (1 − α / 2, n − 2),+∞ )