KORELACJA LINIOWA Pod korelacją rozumiemy współzależność
Transkrypt
KORELACJA LINIOWA Pod korelacją rozumiemy współzależność
KORELACJA LINIOWA Pod korelacją rozumiemy współzależność. Innymi słowy, mając zmienne X i Y interesujemy się, w jakim stopniu zmienna Y zależy od zmiennej X, lub inaczej: jaki wpływ zmienna X wywiera na zmienną Y ? Rozróżniamy zależność funkcyjną i statystyczną. Statystyczna zależność bywa liniowa i krzywoliniowa. Zależność liniowa charakteryzuje się siłą i kierunkiem. Narzędzie do wykrycia zależności ”na oko” - wykres rozrzutu. Bardziej wiarygodną odpowiedź dają współczynniki korelacji. Współczynnik korelacji liniowej Pearsona. Jest to miara współzależności pomiędzy zmiennymi o poziomie ilościowym (na dodatek dobrze by było gdyby rozkład cech nie był daleki od symetrycznego). Obserwujemy wartości zmiennej X, czyli x1, x2, . . . , xn oraz odpowiednie wartości zmiennej Y : y1, y2, . . . , yn. 1 Wówczas Pn rxy − x̄)(yj − ȳ) = qP . P n n 2 2 j=1 (xj − x̄) j=1 (yj − ȳ) j=1 (xj Własności: – rxy = ryx ∈ [−1, 1]; – rxy > 0 - zależność dodatnia; rxy < 0 - zależność ujemna; – rxy = 0 - brak zależności liniowej; rxy = ±1 - ”idealna” zależność liniowa; – im bliżej |rxy | do jedności, tym zależność liniowa jest mocniejsza, im bliżej |rxy | do zera, tym zależność liniowa jest słabsza. Współczynnik korelacji rang Spearmana. Jest to miara współzależności pomiędzy zmiennymi o poziomie porządkowym. Najpierw wartościom zmiennych nadajemy rangi; rangą wartości nazywamy jej numer w szeregu niemalejącym tych wartości. Dalej dla obliczonych w taki sposób rang {Xj } wartości zmiennej X oraz {Yj } wartości zmiennej Y kładziemy Pn 6 j=1(Xj − Yj )2 Rxy = 1 − . 2 n(n − 1) Związek pomiędzy dwoma podanymi współczynnikami. Własności drugiego współczynnika są analogiczne. 2