x ,∑ = 29344 x ,∑ = 3320 y ,∑ =1141400 y ,∑ =181490 xy - E-SGH
Transkrypt
x ,∑ = 29344 x ,∑ = 3320 y ,∑ =1141400 y ,∑ =181490 xy - E-SGH
Statystyka ćwiczenia nr 10 mgr Sylwia Timoszuk Współczynnik zbieżności Cramera, współczynnik korelacji liniowej. Współczynnik korelacji rang Spearmana. Wnioskowanie statystyczne w analizie zależności. Zad. 1. Losowo wybrane 120 osób zapytano o wydatki na książki (cecha X w złotych) w ciągu ostatniego miesiąca oraz o to, czy w ubiegłym roku były w teatrze (cecha Y). Dane z sondażu zostały pogrupowane według przedziałów klasowych cechy X: 0-40; 40-80; powyżej 80 oraz cechy Y: tak; nie. Na podstawie uzyskanych danych wyznaczono współczynnik zbieżności Cramera równy 0,21. Czy związek między zmiennymi można uznać za statystycznie istotny (przyjmij a = 0,01) ? Zad. 2. Jednostkowy koszt produkcji (w USD) oraz wielkość produkcji pewnego dobra (w tys. sztuk) w konkurujących ze sobą pięciu firmach przedstawiono w poniższym zestawieniu: Wielkość produkcji 23 30 41 45 50 Jednostkowy koszt produkcji 50 38 34 30 28 1. Określić i zinterpretować współczynnik korelacji liniowej Pearsona. Czy jest on istotny przy α = 0,05? 2. O czym świadczyłaby wartość r o przeciwnym znaku? Zad. 3. Na podstawie rozkładu empirycznego przebiegu samochodu (w tys. km) i wieku samochodu (w latach ukończonych) postaci: 0-2 3-5 6-8 9-11 Wiek Przebieg 0-40 9 6 0 0 40-80 3 14 7 1 80-120 2 18 15 8 120-160 1 2 13 26 a) wyznaczyć średni wiek oraz średni przebieg samochodu; b) ocenić, ze względu na którą cechę badane samochody były bardziej zróżnicowane; c) obliczyć średni wiek samochodów o przebiegu od 40 do 80 tys. km oraz odchylenie standardowe wieku samochodów o tym przebiegu; d) obliczyć średni przebieg samochodu 6-8 letniego; e) zbadać czy istnieje zależność liniowa między badanymi zmiennymi w tej próbie oraz w populacji generalnej. Zad. 4. Z zapisów kliniki położniczej wylosowano 10 przypadków urodzeń, rejestrując długość w cm (X) i wagę w dkg (Y) noworodków: X 58 55 51 60 56 54 46 52 49 59 Y 440 340 230 400 360 300 240 350 300 360 W trakcie przetwarzania powyższych danych uzyskano ponadto (sumowanie po wszystkich obserwacjach): ∑ x = 540 , ∑ x 2 = 29344 , ∑ y = 3320 , ∑ y 2 = 1141400 , ∑ xy = 181490 . a) Oblicz kowariancję i współczynnik korelacji liniowej. Jak silna jest korelacja między badanymi cechami? Zadania opracowane z wykorzystaniem materiałów dr Anity Abramowskiej-Kmon Statystyka ćwiczenia nr 10 mgr Sylwia Timoszuk Współczynnik zbieżności Cramera, współczynnik korelacji liniowej. Współczynnik korelacji rang Spearmana. Wnioskowanie statystyczne w analizie zależności. b) Sprawdź na poziomie istotności 0,05 hipotezę o nieskorelowaniu obu cech w populacji. Odp. a) = 245,6; = 0,82 (b. silna korelacja); b) wartość testu = 4,05; odrzucamy . Zad. 5. Dla losowo wybranych 10 klientów supermarketu zarejestrowano dane o liczbie pozycji na rachunku i czasie obsługi przy kasie (w min), otrzymując: X 5 8 10 12 15 21 25 36 40 46 Y 2,5 3 3 5,5 4 6 6,5 7,5 6 8 Oblicz na tej podstawie współczynnik korelacji liniowej. Sprawdź na poziomie istotności 0,05 hipotezę o nieskorelowaniu obu cech w populacji. Odp. = 0,88; wartość testu = 5,32, odrzucamy . Zad. 6. Dyrektor programu szkoleniowego dla menedżerów chce sprawdzić czy istnieje dodatni związek między wynikiem egzaminu kandydata na szkolenie a wynikami tej samej osoby w trakcie szkolenia. Dyrektor ułożył ranking 15 uczestników według ich wyników na egzaminie wstępnym i oddzielny ranking według ich wyników w trakcie szkolenia: Uczestnik 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Ranga wstępna 8 9 4 2 3 10 1 5 6 15 13 14 12 7 11 Ranga końcowa 7 5 9 6 1 8 2 10 15 14 4 3 11 12 13 Korzystając z tych danych przeprowadź test dodatniej korelacji rang między wynikiem egzaminu wstępnego i wynikami w trakcie szkolenia. Zad. 7. Analityk w firmie reklamowej postanowił sprawdzić, czy istnieje jakikolwiek związek między intensywnością koloru reklamy prasowej a jej siłą oddziaływania. Losowo wybranym grupom respondentów pokazano 10 reklamo różnych stopniach intensywności kolorów, ale identycznych pod innymi względami. Respondenci ocenili reklamy pod względem ogólnego wrażenia, jakie wywoływały. Respondenci zostali podzieleni na grupy; każda z grup oceniała inną reklamę. Oceny zagregowano w ramach grup. Ranking rezultatów przedstawia się następująco: Intensywność koloru: 8, 7, 2, 1, 3, 4, 10, 6, 5, 9. Ocena oddziaływania: 1, 3, 4, 2, 5, 8, 7, 6, 9, 10. Odp. = 0,30 (słaba dodatnia zależność). Zad. 8. Nauczyciel oceniał 10 uczniów ze względu na zdolności językowe i matematyczne. Następnie uszeregował uczniów ze względu na uzyskane noty każdej ze zdolności. Proszę ocenić, czy istnieje zależność w tej grupie uczniów między zdolnościami językowymi a matematycznymi. Uczeń A B C D E F G H I J Rangi zdolności językowych 2 4 6 3 10 8 7 1 5 9 Rangi zdolności matematycznych 3 1 7 4 10 8 9 2 5 6 Odp. = 0,84 (b. silna dodatnia zależność). Zadania opracowane z wykorzystaniem materiałów dr Anity Abramowskiej-Kmon