ZAJĘCIA 5

Transkrypt

ZAJĘCIA 5
ZAJĘCIA 5
Analiza korelacji
DEFINICJA ZALEŻNOŚCI KORELACYJNEJ,
Zależnośd korelacyjna (statystyczna) występuje wtedy, gdy określonym wartościom jednej zmiennej są
przyporządkowane pewne średnie wartości drugiej zmiennej (skłonności). Nie można wyznaczyd jaka będzie
konkretna wartośd cechy Y (zależnej) przy danej wartości cechy X (niezależnej)
RODZAJE ZALEŻNOŚCI KORELACYJNYCH
Siłę zależności pomiędzy cechami można wyrazid liczbowo za pomocą odpowiednich mierników. Wybór
miernika jest uzależniony od
1. rodzaju cech miedzy którymi badana jest zależnośd
2.
liczby obserwacji
3.
charakteru zależności
KLASYFIKACJA METOD ANALIZY ZALEŻNOŚCI STATYSTYCZNYCH
Pomiar – jest to przyporządkowanie badanym obiektom, zgodnie z pewnym zbiorem reguł, liczb.
Określenie pomiaru w statystyce ma szerokie znaczenie. Zastosowanie skali pomiaru determinuje w dużym
stopniu zakres możliwej analizy statystycznej (ostatniego etapu badania). Wyróżniamy następujące skale
pomiarowe1:
Skala nominalna – pozwala określid jedynie przynależnośd badanych elementów do wyróżnionych dla danej
cechy jakościowych kategorii. Skala nominalna reprezentuje najniższy poziom pomiaru. Nie można określid
relacji większy-mniejszy, lepszy-gorszy.
Przykładem jest określenie płci lub regionu zamieszkania badanych osób.
Skala porządkowa – umożliwia przyporządkowanie jednostek statystycznych według stopnia natężenia badanej
cechy. Nie można określid dystansu (różnicy) pomiędzy jednostkami należącymi do różnych grup klasyfikacji.
Przykładem jest określenie statusu materialnego danej osoby (niski, średni, wysoki) lub osiągnięć w nauce
(niedostateczny, mierny, dostateczny, dobry, bardzo dobry).
Skala interwałowa (przedziałowa) – występuje wtedy, gdy uporządkowany zbiór wartości cechy składa się
z liczb rzeczywistych. Wartośd 0 w tej skali ustalona jest dowolnie. Skala przedziałowa pozwala tylko stwierdzid
o ile wartośd cechy jednostki rożni się cechy innej jednostki.
Przykładem tej skali jest skala temperatur Celsjusza (wartość 0 jest umowna). Wartość 0 w skali Kelvina jest
absolutna – (-273 st. C) jest to najniższa temp. przyjmowana przez materię.
Skala ilorazowa (stosunkowa) – pomiar na tej skali charakteryzuje się stałymi ilorazami i zerem bezwzględnym
(zawsze w tym samym punkcie). W tej skali możliwe jest porównywanie jednostek za pomocą charakterystyk
np. płaca, której naturalnym początkiem jest 0, co pozwala stwierdzić, że wynagrodzenie 4 tys. zł jest 2 razy
większa od płacy w wysokości 2 tys. zł.
Skala interwałowa i ilorazowa są skalami liczbowymi, z ustalonymi jednostkami pomiaru, co pozwala na
określenie nie tylko porządku jednostek, lecz także różnic (dystansu) między nimi. Są one praktycznie trudno
rozróżnialne. Skala interwałowa nie ma naturalnego początku, który uprawniałby do obliczenia ilorazów
wartości cechy i znaczące ich interpretowanie.
1
Por. Jarosław Podgórski, Statystyka dla studiów licencjackich, Polskie Wydawnictwo Ekonomiczne, Warszawa 2005 r., s.
10-12.
Zajęcia 4.
Materiały pomocnicze do dwiczeo
STATYSTYKA
mgr Emilia Modranka,
[email protected]
Strona 1 z 4
Rodzaj metody badania korelacji a skala pomiarowa badanych cech
Miary
korelacji
2 zmienne
Skala
nominalna
Wiele
zmiennych
Skala interwałowa
i ilorazowa
Skala
porządkowa
Φ Yule’a
τKendalla
V Pearsona
Q Kendalla
Ρ Spearmana
η stosunek korelacyjny
Skala
przedziałowa i
ilorazowa
Skala
porządkowa
Współczynnik
wielorakiej korelacji
rangowej Kendalla
Współczynnik korelacji
wielorakiej R Pearsona
Współczynnik korelacji
cząstkowej Pearsona
Współczynnik
cząstkowej korelacji
rangowej Kendalla
C Pearsona
T Czuprowa
V Cramera
Λ Goodmana I Kruskala
Źródło: Opracowanie własne na podstawie: H. Walesiak, Metody analizy danych marketingowych, Wydawnictwo Naukowe PWN, Warszawa
1996 r.
WIZUALIZACJA ZWIĄZKU DWUWYMIAROWEGO ZWIĄZKU KORELACYJNEGO
Szereg statystyczny
Budowa szeregu statystycznego polega na uporządkowaniu (przy małej liczbie obserwacji) według poziomu
zmiennej niezależnej (X) wartości zmiennej zależnej (Y).

Jeśli wartości jednej cechy rosną (maleją), a drugiej wykazują tendencję spadkową (rosnącą) – ujemna
korelacja. Np.: wraz ze wzrostem cen maleje popyt na określone dobro.

Jeśli wartości jednej cechy rosną (maleją) oraz drugiej rosną (maleją) – dodatnia korelacja. Np.: wraz ze
wzrostem cen rośnie podaż wybranego dobra
Tablica korelacyjna
Posługujemy się nią przy dłużej liczbie obserwacji. Przedstawia rozkład wartości dwóch cech X i Y.
l
y1
y2
y3
yl
n  n
ij
i
j1
n1l
n2l
n1•
n2•
.
.
.
.
.
nk2
nk3
nkl
nk•
n•2
n•3
n•l
n
x1
x2
x3
n11
n12
n13
.
.
.
.
.
.
.
.
xk
nk1
n•1
.
k
n  n
ij
j
i1
Zajęcia 4.
Materiały pomocnicze do dwiczeo
STATYSTYKA
mgr Emilia Modranka,
[email protected]
Strona 2 z 4
Jeśli dla każdego poziomu zmiennej niezależnej X obliczamy poziom zmiennej zależnej (średnią grupową), czyli
warunkową, to układ tych zmiennych wskaże czy pomiędzy badanymi zmiennymi istnieje zależnośd.
Mając do dyspozycji dane w układzie szeregu można przekształcid je do postaci tablicy korelacyjnej za pomocą
TABELI PRZESTAWNEJ oprogramowanej w arkuszu MS Excel.
Diagram korelacyjny – korelogram (arkusz kalkulacyjnym MS Excel 2003)
1.
Stworzyd dwie kolumny z danymi I kolumna: oś X, II kolumna: oś Y;
2.
Zaznaczyd wartości w kolumnach bez komórek z tytułami
3.
Menu: Wstaw > Wykres >typ: XY (punktowy) > Dalej > Serie: ułożone w kolumnach > Dalej
4.
W tytuły osi X I Y wpisad odpowiednie tytuły kolumn źródłowych danych
5.
W zakładce kreatora: Linie siatki: Główne linie siatki dla osi OX
6.
Odpowiednio sformatowad graficznie tło (białe) linie I inne elementy wykresu.
25
20
20
15
15
Y
Y
25
10
10
5
5
0
0
0
2
4
6
8
10
12
14
0
16
5
10
15
20
25
30
X
X
Korelacja dodatnia
Brak korelacji
BADANIE WSPÓŁZALEŻNOŚCI
PROSTOLINIOWEJ
WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA
Służy do mierzenia ścisłości związku prostoliniowego. Stosowany w przypadku, cechy są mierzalne, po
sprawdzeniu czy pomiędzy nimi zachodzi zależnośd prostoliniowa.
cov( X , Y )
rxy 

sx  s y
1
N

1
N
n
 (x
i
 x )( y i  y )
i 1

( xi  x ) 

i 1

n
1/ 2
2
1

N

( yi  y ) 

i 1

n
1/ 2
2
Wzór alternatywny
n
xy  x  y

cov( X , Y )
i 1
rxy 

sx  s y
 2

2
2 
2 
 xi  ( x )    y i  ( y ) 


 
1
N
Współczynnik przyjmuje wartości z przedziału *-1, 1+. Zależnośd liniowa rośnie wraz ze wzrostem wartości
bezwzględnej współczynnika korelacji Pearsona. W zagadnieniach społeczno-ekonomicznych występuje
korelacja niedoskonała.
Orientacyjnie przyjmuje się, że:
rxy  0,5 - korelacja między cechami jest wyraźna
0,3  rxy  0,5 - średnia
Zajęcia 4.
Materiały pomocnicze do dwiczeo
STATYSTYKA
mgr Emilia Modranka,
[email protected]
Strona 3 z 4
rxy  0,3 niewyraźna
rxy  1 korelacja doskonała
rxy  0 brak korelacji prostoliniowej
rxy > 0 korelacja dodatnia
rxy < 0 korelacja ujemna
Np. rxy =-0,9 – cechy charakteryzują się wyraźną ujemną korelacją liniową, która oznacza, że wraz ze
wzrostem X wartość cechy Y maleje.
ANALIZA KORELACJI
DWÓCH CECH MIERZONYCH NA SKALI PORZĄDKOWEJ
WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA
Służy do oceny siły zależności pomiędzy zmiennymi, kiedy są wyrażone co najmniej na skali porządkowej, lub
mogą byd poddane rangowaniu.
n
rs  1 
6 d i
2
i 1
N ( N 2  1)
Gdzie di – różnice pomiędzy rangami cechy xi i yi, N – liczba wszystkich obserwacji
Interpretacja: jak w przypadku współczynnika korelacji Pearsona
Obliczenia zaczynamy od uporządkowania wartości cech poprzez nadanie im rangi – kolejnego numeru. (dx, dy)
W przypadku gdy występują w szeregu te same wartości, przyporządkowujemy im średnią arytmetyczną z
kolejnych numerów w uporządkowanym szeregu.
Zajęcia 4.
Materiały pomocnicze do dwiczeo
STATYSTYKA
mgr Emilia Modranka,
[email protected]
Strona 4 z 4

Podobne dokumenty