Zadania Arkusz 6 Elementy statystyki opisowej 1. Wielki dom
Transkrypt
Zadania Arkusz 6 Elementy statystyki opisowej 1. Wielki dom
Zadania Arkusz 6 Elementy statystyki opisowej 1. Wielki dom towarowy gromadzi informacje o wartości sprzedaży przypadającej na poszczególnych sprzedawców. W danym dniu zebrano następujące dane o wartości sprzedaży dla 20 sprzedawców: 6, 9, 10, 12, 13, 14, 14, 15, 16, 16, 16, 17, 17, 18, 18, 19, 20, 21, 22, 24. Dane te (wyniki obserwacji) zostały już uporządkowane według wielkości. Wyznacz: i) 50-ty, 80-ty i 90-ty percentyl, ii) średnią, medianę i dominantę, iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że dane te pochodzą z próby). O d p o w i e d ź. i) 50-ty percentyl = 16; 80-ty percentyl = 19,8; 90-ty percentyl = 21,9. ii) średnia x = 15, 85; mediana me = 16; dominanta = 16. iii) rozstęp = 18; wariancja z próby s2 = 19, 9237; odchylenie standardowe z próby s = 4, 46. 2. Następujące dane są liczbami pasażerów korzystających z rejsów Delta Airlines między San Francisco a Seattle w ciągu 33 dni kwietnia i maja: 128, 121, 134, 136, 136, 118, 123, 109, 120, 116, 125, 128, 121, 129, 130, 131, 127, 119, 114, 134, 110, 136, 134, 125, 128, 123, 128, 133, 132, 136, 134, 129, 132. Oblicz: i) dolny, środkowy i górny kwartyl dla tego zbioru danych oraz percentyle 10-ty, 15-ty i 65-ty. Jaki jest odstęp międzykwartylowy? ii) średnią, medianę i dominantę, iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że dane te pochodzą z próby). O d p o w i e d ź. i) dolny kwartyl Q1 = 121, 5; środkowy kwartyl Q2 = 128; górny kwartyl Q3 = 133, 5; 10-ty percentyl = 114,8; 15-ty percentyl = 118,1; 65-ty percentyl = 131,1; odstęp międzykwartylowy IQR = Q3 − Q1 = 12. ii) średnia x = 126, 64; mediana me = Q2 = 128; dominanta = 128 lub 136 lub 134 trudno w tym przypadku wskazać jednoznacznie dominantę, co spodowane jest małą liczbą obserwacji. Zasadniczo dominantę należy wyznaczać tylko dla dużego zbioru danych, lub danych pogrupowanych w szeregu rozdzielczym. iii) rozstęp = 27; wariancja z próby s2 = 57, 7386; odchylenie standardowe z próby s = 7, 599. 3. Następujące liczby są rocznymi stopami przychodu z 15 akcji: 12,5 13 14,8 11 16,7 9 8,3 -1,2 3,9 15,5 16,2 18 11,6 10 9,5 Wyznacz: i) medianę, 1-szy i 3-ci kwartyl oraz 55-ty i 85-ty percentyl dla tych danych, ii) średnią i dominantę, iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że dane te pochodzą z próby). 1 Zadania Arkusz 6 O d p o w i e d ź. i) mediana me = 11, 6; Q1 = 9; Q3 = 15, 5; 55-ty percentyl = 12,32; 85-ty percentyl = 16,5. ii) średnia x = 11, 2533; dominanta jest nieokreślona (zbyt mała liczba obserwacji). iii) rozstęp = 19,2; wariancja s2 = 25, 9041; odchylenie standardowe s = 5, 0896. 4. Następujące dane to oceny uzyskane na egzaminie z zarządzania w grupie 22 studentów: 88, 56, 64, 45, 52, 76, 54, 79, 38, 98, 69, 77, 71, 45, 60, 78, 90, 81, 87, 44, 80, 41. Znajdź: i) percentyle 20-ty, 30-ty, 60-ty i 90-ty, ii) średnią, medianę i dominantę, iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że dane te pochodzą z próby). O d p o w i e d ź. i) 20-ty percentyl = 45; 30-ty percentyl = 53,8; 60-ty percentyl = 76,8; 90-ty percentyl = 89,4. ii) średnia x = 66, 96; mediana me = 70; dominanta = 45, ale w tym przypadku trudno uznać tę wartość za dominującą, zbyt mało obserwacji. iii) rozstęp = 60; wariancja s2 = 321, 3788; odchylenie standardowe s = 17, 93. 5. Następujące dane informują o liczbie ofert napływających codziennie do rządu pewnego rozwijającego się kraju od firm chcącyh wygrać przetarg na budowę urządzeń w nowym porcie: 2, 3, 2, 4, 3, 5, 1, 1, 6, 4, 7, 2, 5, 1, 6. Wyznacz: i) kwartyle, odstęp międzykwartylowy oraz 60-ty percentyl, ii) średnią, medianę i dominantę, iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że dane te pochodzą z próby). O d p o w i e d ź. i) Q1 = 2; Q3 = 5; odstęp międzykwartylowy IQR = 3; 60-ty percentyl = 4. ii) x = 3, 47; me = 3; dominanta - nieokreślona. iii) rozstęp = 6; s2 = 3, 981; s = 1, 995. 6. Przedstaw różnice między trzema miarami tendencji centralnej. 7. Wyjaśnij dlaczego potrzebujemy miar zmienności i jaką informację te miary przekazują? 8. Która z miar zmienności jest najważniejsza i dlaczego? 9. Czym różnią się sposoby obliczania wariancji w próbie i w populacji? 10. Następujące dane informują o miesięcznej produkcji stali w milionach ton: 7,0; 6,9; 8,2; 7,8; 7,7; 7,3; 6,8; 6,7; 8,2; 8,4; 7,0; 6,7; 7,5; 7,2; 7,9; 7,6; 6,7; 6,6; 6,3; 5,6; 7,8; 5,5; 6,2; 5,8; 5,8; 6,1; 6,0; 7,3; 7,3; 7,5; 7,2; 7,2; 7,4; 7,6. Sporządź dla tych danych zestawienie łodyga-liście oraz wykres-pudełko. Jakie korzyści odnosimy z zestawienia łodyga-liście, a jakie z wykresu-pudełko? O d p o w i e d ź. Zestawienie łodyga-liście: 5 6 7 8 5688 0123677789 00222333455667889 224 2 Zadania Arkusz 6 11. Uczestnictwo robotników w zarządzaniu wciąga pracowników w proces podejmowania decyzji w spółkach. Podanie niżej dane to procenty pracowników zaangażowanych w programach uczestnictwa robotników w zarządzaniu w pewnej grupie spółek: 5, 32, 33, 35, 42, 43, 42, 45, 46, 44, 47, 48, 48, 48, 49, 49,50, 37, 38, 34, 51, 52, 52, 47, 53, 55, 56, 57, 58, 63, 78. Sporządź dla tych danych zestawienie łodyga-liście oraz wykres-pudełko. 12. Na poniższej liście podano wydatki rządowe krajów zachodniej półkuli wyrażone w procentach produktu krajowego brutto (są to dane za lata 1979-1981): Antyle Holenderskie Argentyna Bahamy Belize Boliwia Brazylia Chile Dominikana Ekwador Gujana Gwadelupa Gwatemala Haiti Honduras Jamajka Kanada Kolumbia Kostaryka Kuba 21,3 12,7 13,2 14,0 13,6 8,9 12,4 7,8 15,0 23,9 32,3 7,7 87,4 14,6 21,5 19,4 8,0 18,3 2,1 Martynika Meksyk Nikaragua Panama Paragwaj Peru Puerto Rico Salwador Stany Zjednoczone Surinam Trynidad i Tobago Urugwaj Wenezuela 3 26,0 10,8 11,6 15,3 7,3 12,5 17,1 15,1 20,7 16,4 16,8 13,5 13,1 Zadania Arkusz 6 Zbuduj dla tych danych wykres-pudełko. Czy są tu nietypowe wyniki obserwacji lub wyniki podejrzane o nietypowość? Czy możesz podać przyczyny występowania w tym zbiorze obserwacji nietypowych? 13. Następujące dane to zawartość srebra w tonie rudy wydobywanej w dwóch kopalniach (w uncjach): Kopalnia A Kopalnia B 34 23 32 24 35 28 37 29 41 32 42 34 43 35 45 37 46 38 45 40 48 43 49 44 51 47 52 48 53 49 60 50 73 51 76 52 85 59 Sporządź zestawienie łodyga-liście i wykres pudełkowy dla danych pochodzących z każdej kopalni. Porównaj oba rodzaje rysunków dla obu kopalń. Jakie wnioski możesz wyciągnąć z tych porównań? Wykres-Pudełko me x̄ o * Q1 Q3 IQR 1, 5 · IQR 3 · IQR — — — — — — 1, 5 · IQR 3 · IQR Q1 - dolny kwartyl (25-ty percentyl), Q3 - górny kwartyl (75-ty percentyl), IQR = Q3 − Q1 - odstęp międzykwartylowy (interquartile range), me - mediana, o - obserwacja nietypowa, ∗ - obserwacja podejrzana o nietypowość. 4