Regresja - Akademia eTrapez

Transkrypt

Regresja - Akademia eTrapez
Regresja
Wzory
Funkcja regresji I rodzaju
Funkcję regresji I rodzaju g  x  wyznaczamy przyporządkowując wartościom cechy
niezależnej (oznaczonej najczęściej jako X ) średnie warunkowe cechy zależnej ( najczęściej
Y ).
g  xi   E Y | X  xi 
Empiryczną linię regresji rysujemy na wykresie łącząc odpowiednie punkty odcinkami.
www.etrapez.pl Krystian Karczyński
Strona 1
Funkcja regresji II rodzaju
Jeżeli Y zależy od X , oszacowanie funkcji regresji II rodzaju ma postać:
yˆ i  a0  a1 xi ,
gdzie:
a1 
  x  X  y  Y 
 x  X 
i
i
2
i
a0  Y  a1 X
Jeżeli X zależy od Y , oszacowanie funkcji regresji II rodzaju ma postać:
xˆi  b0  b1 yi ,
gdzie:
b1 
  x  X  y  Y 
 y Y 
i
i
2
i
b0  X  bY
1
Uwagi
Trzeba pamiętać, że sumy we wzorach oznaczają sumowanie wszystkich jednostek w próbie i
w niektórych zadaniach może być konieczne dodatkowe mnożenie przez liczebności ni , o ile
występują.
Współczynnik korelacji liniowej Pearsona: rxy   a1  b1 , znak przed pierwiastkiem jest
zawsze taki sam, jak współczynników a1 i b1 .
Dodatkowo współczynniki a1 i b1 można wyznaczyć ze wzorów:
a1  rxy
S Y 
SX 
b1  rxy
SX 
S Y 
www.etrapez.pl Krystian Karczyński
Strona 2
Badania dokładności dopasowania oszacowanej funkcji regresji
Wariancja resztowa
S
2
S
2
 y  yˆ 
u   
i
2
i
nk
i
 x  xˆ 
z   
i
i
nk
i
, jeśli Y zależy od X
2
, jeśli X zależy od Y
, gdzie k oznacza liczbę parametrów w funkcji regresji (w przypadku prostej k  2 )
Współczynnik zbieżności  2

2
yx
  y  yˆ 

 y Y 
i
2
i
2
, jeśli Y zależy od X
i
  x  xˆ 

 x  X 
2

2
xy
i
i
2
, jeśli Y zależy od X
i
Współczynnik ten wskazuje, w ilu procentach zmiana wartości jednej zmiennej nie została
wyjaśniona regresją.
Zachodzi:
 xy2  rxy2  1
www.etrapez.pl Krystian Karczyński
Strona 3
Korelacja wielu zmiennych
Korelacja cząstkowa
Badamy wzajemną korelację dwóch cech, z pominięciem wpływu pozostałych.
Współczynnik korelacji cząstkowej:
rij .abzc... 
 Pij
Pii  Pjj
, gdzie:
rij .abzc... - współczynnik korelacji cząstkowej pomiędzy cechami o indeksach i i j , z
pominięciem cech o indeksach a, b, z, c,
.
Pij , Pii , Pjj - odpowiednie dopełnienia algebraiczne macierzy współczynników korelacji
1
r
liniowej Pearsona: P   21


 rn1
r12
r13
1
r23
rn 2
rn 3
... r1n 
... r2 n 
.

...

... 1 
Korelacja wieloraka
Badamy korelację wybranej cechy z wszystkimi pozostałymi łącznie
Współczynnik korelacji wielorakiej:
Rw  Ri.abc...  1 
P
, gdzie:
R
Ri.abc... - współczynnik korelacji wielorakiej cechy o indeksie i i wszystkich pozostałych cech
P - wyznacznik macierzy współczynników korelacji liniowej Pearsona
1
r
P   21


 rn1
r12
1
rn 2
r13 ... r1n 
r23 ... r2 n 

...

rn 3 ... 1 
R - wyznacznik macierzy współczynników korelacji liniowej Pearsona, z której wykreślono
wiersz z numerem i oraz kolumnę z numerem i .
www.etrapez.pl Krystian Karczyński
Strona 4
Regresja dla trzech zmiennych
Jeżeli Y zależy od dwóch zmiennych X 1 i X 2 , oszacowanie funkcji regresji II rodzaju ma
postać:
yˆi  a0  a1 x1i  a2 x2i .
gdzie:
a1 
S1 r12  r13  r23

S2
1  r232
a2 
S1 r13  r12  r23

S3
1  r232
a0  Y  a1 X 1  a2 X 2
Indeks 1 mają współczynniki dotyczące zmiennej Y , indeks 2 współczynniki dotyczące
zmiennej X 1 , a indeks 3 współczynniki dotyczące zmiennej X 2 .
Współczynnik korelacji wielorakiej:
RW  R1.23 
r122  r132  2r12 r13r23
1  r232
Wariancja resztowa:
S 2  u   S12 1  RW2 
www.etrapez.pl Krystian Karczyński
Strona 5