KORELACJA LINIOWA Pod korelacją rozumiemy współzależność

Transkrypt

KORELACJA LINIOWA Pod korelacją rozumiemy współzależność
KORELACJA LINIOWA
Pod korelacją rozumiemy współzależność. Innymi słowy,
mając zmienne X i Y interesujemy się, w jakim stopniu zmienna Y zależy od zmiennej X, lub inaczej: jaki
wpływ zmienna X wywiera na zmienną Y ?
Rozróżniamy zależność funkcyjną i statystyczną.
Statystyczna zależność bywa liniowa i krzywoliniowa.
Zależność liniowa charakteryzuje się siłą i kierunkiem.
Narzędzie do wykrycia zależności ”na oko” - wykres
rozrzutu.
Bardziej wiarygodną odpowiedź dają współczynniki korelacji.
Współczynnik korelacji liniowej Pearsona.
Jest to miara współzależności pomiędzy zmiennymi o
poziomie ilościowym (na dodatek dobrze by było gdyby
rozkład cech nie był daleki od symetrycznego). Obserwujemy wartości zmiennej X, czyli x1, x2, . . . , xn
oraz odpowiednie wartości zmiennej Y : y1, y2, . . . , yn.
1
Wówczas
Pn
rxy
− x̄)(yj − ȳ)
= qP
.
P
n
n
2
2
j=1 (xj − x̄)
j=1 (yj − ȳ)
j=1 (xj
Własności:
– rxy = ryx ∈ [−1, 1];
– rxy > 0 - zależność dodatnia; rxy < 0 - zależność
ujemna;
– rxy = 0 - brak zależności liniowej; rxy = ±1 - ”idealna” zależność liniowa;
– im bliżej |rxy | do jedności, tym zależność liniowa jest
mocniejsza, im bliżej |rxy | do zera, tym zależność liniowa jest słabsza.
Współczynnik korelacji rang Spearmana.
Jest to miara współzależności pomiędzy zmiennymi o
poziomie porządkowym. Najpierw wartościom zmiennych nadajemy rangi; rangą wartości nazywamy jej numer w szeregu niemalejącym tych wartości. Dalej dla
obliczonych w taki sposób rang {Xj } wartości zmiennej
X oraz {Yj } wartości zmiennej Y kładziemy
Pn
6 j=1(Xj − Yj )2
Rxy = 1 −
.
2
n(n − 1)
Związek pomiędzy dwoma podanymi współczynnikami.
Własności drugiego współczynnika są analogiczne.
2