∑ ∑ ∑ ∑
Transkrypt
∑ ∑ ∑ ∑
ĆWICZENIA nr 11 Cel zajęć: Wykonanie obliczeń współczynników korelacji Pearsona i Spearmana oraz analiza otrzymanych wyników. Wprowadzenie teoretyczne Współczynnik korelacji Pearsona zwany jest również współczynnikiem korelacji z próby. Określa on zależność liniową między zmiennymi losowymi. Niech X i Y będą zmiennymi losowymi. Niech xi i yi będą elementami prób losowych, gdzie i = 1,2,…,n. Współczynnikiem korelacji Pearsona jest statystyka dana wzorem n rxy = ∑ (x i =1 n ∑ (x i =1 i i − x )( y i − y ) − x) 2 n ∑ (y i =1 i − y) = cov( X , Y ) σ XσY 2 . Analogiczną miarą zależności zmiennych losowych jest współczynnik korelacji rang Spearmana. Jest to jedna z nieparametrycznych miar zależności statystycznej między zmiennymi. Współczynnik ten dany jest wzorem n rxy = 1 − 6∑ (Ri − S i ) i =1 ( ) n n2 −1 2 , gdzie Ri jest rangą elementu xi z próby x oraz Si jest rangą elementu yi z próby y. Rangą nazywamy miejsce, które zajmuje dany element po uporządkowaniu próby niemalejąco. Zadania do rozwiązania 1. Dziesięciu kierowców samochodowych startuje w kolejnych zawodach zbierając punkty, których suma określa ich lokatę w tabeli. Jaka jest zależność pomiędzy lokatą kierowcy po sześciu wyścigach a lokatą kierowcy w wyścigu siódmym. Dane przedstawia poniższa tabela. kierowca 1 2 3 4 5 6 7 8 9 10 miejsce w tabeli po sześciu wyścigach 1 2 3 4 5 6 7 8 9 10 miejsce w siódmym wyścigu 3 1 6 2 8 5 4 10 9 7 2. Przeprowadzone zostały badania określające wpływ wielkości dawki leku na masę wątroby szczura w gramach. Tabela przedstawia krotności dawki leku oraz masę wątroby. Czy istnieje zależność pomiędzy rozpatrywanymi cechami? szczur 1 2 3 4 5 6 7 8 9 10 krotność dawki leku 1 2 3 4 5 6 7 8 9 10 masa wątroby [g] 3.25 4.50 3.75 4.75 5.50 4.25 3.50 5.00 5.25 4.00 3. Zebrano informacje na temat plantacji czarnej porzeczki. Tabela zawiera dane dotyczące wieku plantacji oraz wielkości plonu w kwintalach z hektara. Określić stopień zależności pomiędzy wiekiem plantacji a wielkością plonu czarnej porzeczki. plantacja 1 2 3 4 5 6 7 wiek plantacji w latach 1 3 2 3 3 3 5 plony w kwintalach z ha 85 105 100 110 125 115 130 4. W piętnastoosobowej klasie maturalnej nauczyciele prowadzący zajęcia z matematyki i języka polskiego sporządzili ranking swoich uczniów ze względu na przygotowanie do matury. Na czele umieszczono najlepszych, przy końcu listy najsłabszych. Wyniki rankingu zawiera tabela. Czy można przyjąć, że istnieje zależność między rezultatami osiąganymi przez uczniów w zakresie matematyki i języka polskiego? MATEMATYKA JĘZYK POLSKI miejsce w rankingu nazwisko ucznia miejsce w rankingu nazwisko ucznia 1 Bożek 1 Bromski Kowalski 2 Kozioł 2-3 Kozioł 3 Nowicki 4 Szczygieł 4 Bożek 5 Nowicki 5 Kowalski 6 Brodacki 6 Bala 7 Szerszyński 7 Kosowski 8 Kosowski 8 Szerszyński 9 Bromski 9 Szczygieł 10 Bala 10 Zabłocki 11 Gawor 11 Gawor 12 Zabłocki 12 Brodacki 13 Zemanek 13 Zemanek 14 Żegliński 14 Wojciechowski 15 Wojciechowski 15 Żegliński 5. Badano zależność między czasem przeznaczonym na reklamę telewizorów marki Philips (w minutach na miesiąc) a miesięczną ich sprzedażą. Zebrano dane z siedmiu miesięcy 2001 roku. Dla badanych cech obliczyć współczynnik korelacji liniowej, współczynnik korelacji Spearmana oraz porównać otrzymane wyniki. miesiąc styczeń luty marzec kwiecień maj czerwiec lipiec czas w mediach przeznaczony 10 18 13 14 20 15 8 na reklamę [min] liczba sprzedanych 2.5 4.6 5.2 4.0 5.6 3.2 1.5 telewizorów [tys. sztuk] 6. Dla obserwacji zawartych w pliku dane.xls zbudować oraz przeanalizować macierz korelacji. Źródła: Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M. „Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach – część II: Statystyka matematyczna”, PWN, Warszawa 2004 Kukuła K. „Elementy statystyki w zadaniach”, PWN, Warszawa 2003 Magiera R. „Modele i metody statystyki matematycznej”, Oficyna Wydawnicza GiS, Wrocław 2002 Żuk B. „Biometria stosowana”, PWN, Warszawa 1989