ZAJĘCIA 5
Transkrypt
ZAJĘCIA 5
ZAJĘCIA 5 Analiza korelacji DEFINICJA ZALEŻNOŚCI KORELACYJNEJ, Zależnośd korelacyjna (statystyczna) występuje wtedy, gdy określonym wartościom jednej zmiennej są przyporządkowane pewne średnie wartości drugiej zmiennej (skłonności). Nie można wyznaczyd jaka będzie konkretna wartośd cechy Y (zależnej) przy danej wartości cechy X (niezależnej) RODZAJE ZALEŻNOŚCI KORELACYJNYCH Siłę zależności pomiędzy cechami można wyrazid liczbowo za pomocą odpowiednich mierników. Wybór miernika jest uzależniony od 1. rodzaju cech miedzy którymi badana jest zależnośd 2. liczby obserwacji 3. charakteru zależności KLASYFIKACJA METOD ANALIZY ZALEŻNOŚCI STATYSTYCZNYCH Pomiar – jest to przyporządkowanie badanym obiektom, zgodnie z pewnym zbiorem reguł, liczb. Określenie pomiaru w statystyce ma szerokie znaczenie. Zastosowanie skali pomiaru determinuje w dużym stopniu zakres możliwej analizy statystycznej (ostatniego etapu badania). Wyróżniamy następujące skale pomiarowe1: Skala nominalna – pozwala określid jedynie przynależnośd badanych elementów do wyróżnionych dla danej cechy jakościowych kategorii. Skala nominalna reprezentuje najniższy poziom pomiaru. Nie można określid relacji większy-mniejszy, lepszy-gorszy. Przykładem jest określenie płci lub regionu zamieszkania badanych osób. Skala porządkowa – umożliwia przyporządkowanie jednostek statystycznych według stopnia natężenia badanej cechy. Nie można określid dystansu (różnicy) pomiędzy jednostkami należącymi do różnych grup klasyfikacji. Przykładem jest określenie statusu materialnego danej osoby (niski, średni, wysoki) lub osiągnięć w nauce (niedostateczny, mierny, dostateczny, dobry, bardzo dobry). Skala interwałowa (przedziałowa) – występuje wtedy, gdy uporządkowany zbiór wartości cechy składa się z liczb rzeczywistych. Wartośd 0 w tej skali ustalona jest dowolnie. Skala przedziałowa pozwala tylko stwierdzid o ile wartośd cechy jednostki rożni się cechy innej jednostki. Przykładem tej skali jest skala temperatur Celsjusza (wartość 0 jest umowna). Wartość 0 w skali Kelvina jest absolutna – (-273 st. C) jest to najniższa temp. przyjmowana przez materię. Skala ilorazowa (stosunkowa) – pomiar na tej skali charakteryzuje się stałymi ilorazami i zerem bezwzględnym (zawsze w tym samym punkcie). W tej skali możliwe jest porównywanie jednostek za pomocą charakterystyk np. płaca, której naturalnym początkiem jest 0, co pozwala stwierdzić, że wynagrodzenie 4 tys. zł jest 2 razy większa od płacy w wysokości 2 tys. zł. Skala interwałowa i ilorazowa są skalami liczbowymi, z ustalonymi jednostkami pomiaru, co pozwala na określenie nie tylko porządku jednostek, lecz także różnic (dystansu) między nimi. Są one praktycznie trudno rozróżnialne. Skala interwałowa nie ma naturalnego początku, który uprawniałby do obliczenia ilorazów wartości cechy i znaczące ich interpretowanie. 1 Por. Jarosław Podgórski, Statystyka dla studiów licencjackich, Polskie Wydawnictwo Ekonomiczne, Warszawa 2005 r., s. 10-12. Zajęcia 4. Materiały pomocnicze do dwiczeo STATYSTYKA mgr Emilia Modranka, [email protected] Strona 1 z 4 Rodzaj metody badania korelacji a skala pomiarowa badanych cech Miary korelacji 2 zmienne Skala nominalna Wiele zmiennych Skala interwałowa i ilorazowa Skala porządkowa Φ Yule’a τKendalla V Pearsona Q Kendalla Ρ Spearmana η stosunek korelacyjny Skala przedziałowa i ilorazowa Skala porządkowa Współczynnik wielorakiej korelacji rangowej Kendalla Współczynnik korelacji wielorakiej R Pearsona Współczynnik korelacji cząstkowej Pearsona Współczynnik cząstkowej korelacji rangowej Kendalla C Pearsona T Czuprowa V Cramera Λ Goodmana I Kruskala Źródło: Opracowanie własne na podstawie: H. Walesiak, Metody analizy danych marketingowych, Wydawnictwo Naukowe PWN, Warszawa 1996 r. WIZUALIZACJA ZWIĄZKU DWUWYMIAROWEGO ZWIĄZKU KORELACYJNEGO Szereg statystyczny Budowa szeregu statystycznego polega na uporządkowaniu (przy małej liczbie obserwacji) według poziomu zmiennej niezależnej (X) wartości zmiennej zależnej (Y). Jeśli wartości jednej cechy rosną (maleją), a drugiej wykazują tendencję spadkową (rosnącą) – ujemna korelacja. Np.: wraz ze wzrostem cen maleje popyt na określone dobro. Jeśli wartości jednej cechy rosną (maleją) oraz drugiej rosną (maleją) – dodatnia korelacja. Np.: wraz ze wzrostem cen rośnie podaż wybranego dobra Tablica korelacyjna Posługujemy się nią przy dłużej liczbie obserwacji. Przedstawia rozkład wartości dwóch cech X i Y. l y1 y2 y3 yl n n ij i j1 n1l n2l n1• n2• . . . . . nk2 nk3 nkl nk• n•2 n•3 n•l n x1 x2 x3 n11 n12 n13 . . . . . . . . xk nk1 n•1 . k n n ij j i1 Zajęcia 4. Materiały pomocnicze do dwiczeo STATYSTYKA mgr Emilia Modranka, [email protected] Strona 2 z 4 Jeśli dla każdego poziomu zmiennej niezależnej X obliczamy poziom zmiennej zależnej (średnią grupową), czyli warunkową, to układ tych zmiennych wskaże czy pomiędzy badanymi zmiennymi istnieje zależnośd. Mając do dyspozycji dane w układzie szeregu można przekształcid je do postaci tablicy korelacyjnej za pomocą TABELI PRZESTAWNEJ oprogramowanej w arkuszu MS Excel. Diagram korelacyjny – korelogram (arkusz kalkulacyjnym MS Excel 2003) 1. Stworzyd dwie kolumny z danymi I kolumna: oś X, II kolumna: oś Y; 2. Zaznaczyd wartości w kolumnach bez komórek z tytułami 3. Menu: Wstaw > Wykres >typ: XY (punktowy) > Dalej > Serie: ułożone w kolumnach > Dalej 4. W tytuły osi X I Y wpisad odpowiednie tytuły kolumn źródłowych danych 5. W zakładce kreatora: Linie siatki: Główne linie siatki dla osi OX 6. Odpowiednio sformatowad graficznie tło (białe) linie I inne elementy wykresu. 25 20 20 15 15 Y Y 25 10 10 5 5 0 0 0 2 4 6 8 10 12 14 0 16 5 10 15 20 25 30 X X Korelacja dodatnia Brak korelacji BADANIE WSPÓŁZALEŻNOŚCI PROSTOLINIOWEJ WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA Służy do mierzenia ścisłości związku prostoliniowego. Stosowany w przypadku, cechy są mierzalne, po sprawdzeniu czy pomiędzy nimi zachodzi zależnośd prostoliniowa. cov( X , Y ) rxy sx s y 1 N 1 N n (x i x )( y i y ) i 1 ( xi x ) i 1 n 1/ 2 2 1 N ( yi y ) i 1 n 1/ 2 2 Wzór alternatywny n xy x y cov( X , Y ) i 1 rxy sx s y 2 2 2 2 xi ( x ) y i ( y ) 1 N Współczynnik przyjmuje wartości z przedziału *-1, 1+. Zależnośd liniowa rośnie wraz ze wzrostem wartości bezwzględnej współczynnika korelacji Pearsona. W zagadnieniach społeczno-ekonomicznych występuje korelacja niedoskonała. Orientacyjnie przyjmuje się, że: rxy 0,5 - korelacja między cechami jest wyraźna 0,3 rxy 0,5 - średnia Zajęcia 4. Materiały pomocnicze do dwiczeo STATYSTYKA mgr Emilia Modranka, [email protected] Strona 3 z 4 rxy 0,3 niewyraźna rxy 1 korelacja doskonała rxy 0 brak korelacji prostoliniowej rxy > 0 korelacja dodatnia rxy < 0 korelacja ujemna Np. rxy =-0,9 – cechy charakteryzują się wyraźną ujemną korelacją liniową, która oznacza, że wraz ze wzrostem X wartość cechy Y maleje. ANALIZA KORELACJI DWÓCH CECH MIERZONYCH NA SKALI PORZĄDKOWEJ WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA Służy do oceny siły zależności pomiędzy zmiennymi, kiedy są wyrażone co najmniej na skali porządkowej, lub mogą byd poddane rangowaniu. n rs 1 6 d i 2 i 1 N ( N 2 1) Gdzie di – różnice pomiędzy rangami cechy xi i yi, N – liczba wszystkich obserwacji Interpretacja: jak w przypadku współczynnika korelacji Pearsona Obliczenia zaczynamy od uporządkowania wartości cech poprzez nadanie im rangi – kolejnego numeru. (dx, dy) W przypadku gdy występują w szeregu te same wartości, przyporządkowujemy im średnią arytmetyczną z kolejnych numerów w uporządkowanym szeregu. Zajęcia 4. Materiały pomocnicze do dwiczeo STATYSTYKA mgr Emilia Modranka, [email protected] Strona 4 z 4