∑ ∑ ∑ ∑

Transkrypt

∑ ∑ ∑ ∑
ĆWICZENIA nr 11
Cel zajęć: Wykonanie obliczeń współczynników korelacji Pearsona i Spearmana oraz analiza
otrzymanych wyników.
Wprowadzenie teoretyczne
Współczynnik korelacji Pearsona zwany jest również współczynnikiem korelacji z
próby. Określa on zależność liniową między zmiennymi losowymi. Niech X i Y będą zmiennymi
losowymi. Niech xi i yi będą elementami prób losowych, gdzie i = 1,2,…,n. Współczynnikiem korelacji
Pearsona jest statystyka dana wzorem
n
rxy =
∑ (x
i =1
n
∑ (x
i =1
i
i
− x )( y i − y )
− x)
2
n
∑ (y
i =1
i
− y)
=
cov( X , Y )
σ XσY
2
.
Analogiczną miarą zależności zmiennych losowych jest współczynnik korelacji rang
Spearmana. Jest to jedna z nieparametrycznych miar zależności statystycznej między zmiennymi.
Współczynnik ten dany jest wzorem
n
rxy = 1 −
6∑ (Ri − S i )
i =1
(
)
n n2 −1
2
,
gdzie Ri jest rangą elementu xi z próby x oraz Si jest rangą elementu yi z próby y. Rangą nazywamy
miejsce, które zajmuje dany element po uporządkowaniu próby niemalejąco.
Zadania do rozwiązania
1. Dziesięciu kierowców samochodowych startuje w kolejnych zawodach zbierając punkty,
których suma określa ich lokatę w tabeli. Jaka jest zależność pomiędzy lokatą kierowcy po
sześciu wyścigach a lokatą kierowcy w wyścigu siódmym. Dane przedstawia poniższa tabela.
kierowca
1 2 3 4 5 6 7 8 9 10
miejsce w tabeli po sześciu wyścigach 1 2 3 4 5 6 7 8 9 10
miejsce w siódmym wyścigu
3 1 6 2 8 5 4 10 9 7
2. Przeprowadzone zostały badania określające wpływ wielkości dawki leku na masę wątroby
szczura w gramach. Tabela przedstawia krotności dawki leku oraz masę wątroby. Czy istnieje
zależność pomiędzy rozpatrywanymi cechami?
szczur
1
2
3
4
5
6
7
8
9
10
krotność dawki leku
1
2
3
4
5
6
7
8
9
10
masa wątroby [g] 3.25 4.50 3.75 4.75 5.50 4.25 3.50 5.00 5.25 4.00
3. Zebrano informacje na temat plantacji czarnej porzeczki. Tabela zawiera dane dotyczące
wieku plantacji oraz wielkości plonu w kwintalach z hektara. Określić stopień zależności
pomiędzy wiekiem plantacji a wielkością plonu czarnej porzeczki.
plantacja
1
2
3
4
5
6
7
wiek plantacji w latach 1
3
2
3
3
3
5
plony w kwintalach z ha 85 105 100 110 125 115 130
4. W piętnastoosobowej klasie maturalnej nauczyciele prowadzący zajęcia z matematyki i
języka polskiego sporządzili ranking swoich uczniów ze względu na przygotowanie do matury.
Na czele umieszczono najlepszych, przy końcu listy najsłabszych. Wyniki rankingu zawiera
tabela. Czy można przyjąć, że istnieje zależność między rezultatami osiąganymi przez uczniów
w zakresie matematyki i języka polskiego?
MATEMATYKA
JĘZYK POLSKI
miejsce w rankingu nazwisko ucznia miejsce w rankingu nazwisko ucznia
1
Bożek
1
Bromski
Kowalski
2
Kozioł
2-3
Kozioł
3
Nowicki
4
Szczygieł
4
Bożek
5
Nowicki
5
Kowalski
6
Brodacki
6
Bala
7
Szerszyński
7
Kosowski
8
Kosowski
8
Szerszyński
9
Bromski
9
Szczygieł
10
Bala
10
Zabłocki
11
Gawor
11
Gawor
12
Zabłocki
12
Brodacki
13
Zemanek
13
Zemanek
14
Żegliński
14
Wojciechowski
15
Wojciechowski
15
Żegliński
5. Badano zależność między czasem przeznaczonym na reklamę telewizorów marki Philips (w
minutach na miesiąc) a miesięczną ich sprzedażą. Zebrano dane z siedmiu miesięcy 2001
roku. Dla badanych cech obliczyć współczynnik korelacji liniowej, współczynnik korelacji
Spearmana oraz porównać otrzymane wyniki.
miesiąc
styczeń luty marzec kwiecień maj czerwiec lipiec
czas w mediach przeznaczony
10
18
13
14
20
15
8
na reklamę [min]
liczba sprzedanych
2.5
4.6
5.2
4.0
5.6
3.2
1.5
telewizorów [tys. sztuk]
6. Dla obserwacji zawartych w pliku dane.xls zbudować oraz przeanalizować macierz korelacji.
Źródła:
Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M. „Rachunek prawdopodobieństwa i
statystyka matematyczna w zadaniach – część II: Statystyka matematyczna”, PWN, Warszawa 2004
Kukuła K. „Elementy statystyki w zadaniach”, PWN, Warszawa 2003
Magiera R. „Modele i metody statystyki matematycznej”, Oficyna Wydawnicza GiS, Wrocław 2002
Żuk B. „Biometria stosowana”, PWN, Warszawa 1989

Podobne dokumenty