x ,∑ = 29344 x ,∑ = 3320 y ,∑ =1141400 y ,∑ =181490 xy - E-SGH

Transkrypt

x ,∑ = 29344 x ,∑ = 3320 y ,∑ =1141400 y ,∑ =181490 xy - E-SGH
Statystyka ćwiczenia nr 10
mgr Sylwia Timoszuk
Współczynnik zbieżności Cramera, współczynnik korelacji liniowej.
Współczynnik korelacji rang Spearmana.
Wnioskowanie statystyczne w analizie zależności.
Zad. 1. Losowo wybrane 120 osób zapytano o wydatki na książki (cecha X w złotych) w ciągu
ostatniego miesiąca oraz o to, czy w ubiegłym roku były w teatrze (cecha Y). Dane z sondażu
zostały pogrupowane według przedziałów klasowych cechy X: 0-40; 40-80; powyżej 80 oraz
cechy Y: tak; nie. Na podstawie uzyskanych danych wyznaczono współczynnik zbieżności
Cramera równy 0,21. Czy związek między zmiennymi można uznać za statystycznie istotny
(przyjmij a = 0,01) ?
Zad. 2. Jednostkowy koszt produkcji (w USD) oraz wielkość produkcji pewnego dobra (w tys.
sztuk) w konkurujących ze sobą pięciu firmach przedstawiono w poniższym zestawieniu:
Wielkość produkcji
23 30 41 45 50
Jednostkowy koszt produkcji
50 38 34 30 28
1. Określić i zinterpretować współczynnik korelacji liniowej Pearsona. Czy jest on istotny przy
α = 0,05?
2. O czym świadczyłaby wartość r o przeciwnym znaku?
Zad. 3. Na podstawie rozkładu empirycznego przebiegu samochodu (w tys. km) i wieku
samochodu (w latach ukończonych) postaci:
0-2
3-5
6-8
9-11
Wiek
Przebieg
0-40
9
6
0
0
40-80
3
14
7
1
80-120
2
18
15
8
120-160
1
2
13
26
a) wyznaczyć średni wiek oraz średni przebieg samochodu;
b) ocenić, ze względu na którą cechę badane samochody były bardziej zróżnicowane;
c) obliczyć średni wiek samochodów o przebiegu od 40 do 80 tys. km oraz odchylenie
standardowe wieku samochodów o tym przebiegu;
d) obliczyć średni przebieg samochodu 6-8 letniego;
e) zbadać czy istnieje zależność liniowa między badanymi zmiennymi w tej próbie oraz
w populacji generalnej.
Zad. 4. Z zapisów kliniki położniczej wylosowano 10 przypadków urodzeń, rejestrując długość
w cm (X) i wagę w dkg (Y) noworodków:
X
58
55
51
60
56
54
46
52
49
59
Y
440
340
230
400
360
300
240
350
300
360
W trakcie przetwarzania powyższych danych uzyskano ponadto (sumowanie po wszystkich
obserwacjach): ∑ x = 540 , ∑ x 2 = 29344 , ∑ y = 3320 , ∑ y 2 = 1141400 , ∑ xy = 181490 .
a) Oblicz kowariancję i współczynnik korelacji liniowej. Jak silna jest korelacja między
badanymi cechami?
Zadania opracowane z wykorzystaniem materiałów dr Anity Abramowskiej-Kmon
Statystyka ćwiczenia nr 10
mgr Sylwia Timoszuk
Współczynnik zbieżności Cramera, współczynnik korelacji liniowej.
Współczynnik korelacji rang Spearmana.
Wnioskowanie statystyczne w analizie zależności.
b) Sprawdź na poziomie istotności 0,05 hipotezę o nieskorelowaniu obu cech w populacji.
Odp. a)
= 245,6; = 0,82 (b. silna korelacja); b) wartość testu = 4,05; odrzucamy .
Zad. 5. Dla losowo wybranych 10 klientów supermarketu zarejestrowano dane o liczbie pozycji
na rachunku i czasie obsługi przy kasie (w min), otrzymując:
X
5
8
10
12
15
21
25
36
40
46
Y
2,5
3
3
5,5
4
6
6,5
7,5
6
8
Oblicz na tej podstawie współczynnik korelacji liniowej. Sprawdź na poziomie istotności 0,05
hipotezę o nieskorelowaniu obu cech w populacji.
Odp. = 0,88; wartość testu = 5,32, odrzucamy .
Zad. 6. Dyrektor programu szkoleniowego dla menedżerów chce sprawdzić czy istnieje
dodatni związek między wynikiem egzaminu kandydata na szkolenie a wynikami tej samej
osoby w trakcie szkolenia. Dyrektor ułożył ranking 15 uczestników według ich wyników na
egzaminie wstępnym i oddzielny ranking według ich wyników w trakcie szkolenia:
Uczestnik
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15
Ranga wstępna 8
9
4
2
3 10 1
5
6 15 13 14 12 7 11
Ranga końcowa 7
5
9
6
1
8
2 10 15 14 4
3 11 12 13
Korzystając z tych danych przeprowadź test dodatniej korelacji rang między wynikiem
egzaminu wstępnego i wynikami w trakcie szkolenia.
Zad. 7. Analityk w firmie reklamowej postanowił sprawdzić, czy istnieje jakikolwiek związek
między intensywnością koloru reklamy prasowej a jej siłą oddziaływania. Losowo wybranym
grupom respondentów pokazano 10 reklamo różnych stopniach intensywności kolorów, ale
identycznych pod innymi względami. Respondenci ocenili reklamy pod względem ogólnego
wrażenia, jakie wywoływały. Respondenci zostali podzieleni na grupy; każda z grup oceniała
inną reklamę. Oceny zagregowano w ramach grup. Ranking rezultatów przedstawia się
następująco:
Intensywność koloru: 8, 7, 2, 1, 3, 4, 10, 6, 5, 9.
Ocena oddziaływania: 1, 3, 4, 2, 5, 8, 7, 6, 9, 10.
Odp. = 0,30 (słaba dodatnia zależność).
Zad. 8. Nauczyciel oceniał 10 uczniów ze względu na zdolności językowe i matematyczne.
Następnie uszeregował uczniów ze względu na uzyskane noty każdej ze zdolności. Proszę
ocenić, czy istnieje zależność w tej grupie uczniów między zdolnościami językowymi a
matematycznymi.
Uczeń
A
B
C
D
E
F
G
H
I
J
Rangi zdolności językowych
2
4
6
3
10
8
7
1
5
9
Rangi zdolności matematycznych
3
1
7
4
10
8
9
2
5
6
Odp. = 0,84 (b. silna dodatnia zależność).
Zadania opracowane z wykorzystaniem materiałów dr Anity Abramowskiej-Kmon