Zadania Arkusz 7 Metody prezentacji danych
Transkrypt
Zadania Arkusz 7 Metody prezentacji danych
Zadania Arkusz 7 Metody prezentacji danych - Histogramy 1. Czasopismo ”Fortune” z 12 października 1987 r. podaje listę najbogatszych ludzi na świecie i wartość ich majątku. Według szacunku czasopisma wartości te (w miliardach $) przedstawiają się następująco: 25.0, 20.0, 8.7, 7.5, 7.4, 6.0, 5.7, 5.5, 5.0, 5.0, 4.4, 4.0, 4.0, 3.6, 3.4, 3.1, 3.0, 3.0, 2.9, 2.8, 2.8, 2.5, 2.5, 2.5, 2.4, 2.4, 2.4, 2.2, 2.0, 2.0, 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.5, 1.5, 1.5, 1.4, 1.3, 1.3, 1.3, 1.3, 1.2, 1.2, 1.2, 1.2, 1.1, 1.1, 1.1, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0. Sporządź dla tych danych histogramy częstości absolutnych (liczebności) i częstości względnych. O d p o w i e d ź. 2. Coraz więcej pracodawców korzysta z testów psychologicznych do sprawdzenia, czy przyszły pracownik nadaje się do pracy w firmie. Przedstawione niżej dane pokazują liczebności grup osób, które na egzaminach psychologicznych zorganizowanych przez firmę uzyskały określone oceny. Oceny (wyrażone w punktach) podzielono na klasy o rozpiętości 10 punktów: Klasa ocen 41-50 51-60 61-70 71-80 81-90 91-100 Liczebności 5 7 10 16 11 9 Wykreśl histogram liczebności (absolutnych lub względnych). Znajdź średnią uzyskanych ocen i jej odchylenie standardowe. Która klasa jest klasą medialną? 3. Następujące dane podają, z jaką liczbą stron (w milionach) równoważny jest zasób informacji, który można przechowywać na dysku optycznym firmy Kodak: 1 Zadania Arkusz 7 2.01, 2.32, 2.45, 2.00, 2.22, 2.67, 2.03, 2.08, 2.09, 2.55, 2.33, 2.31, 2.22, 2.10, 2.15, 2.17, 2.43, 2.22, 2.18, 2.19, 2.30, 2.42, 2.00, 2.03, 2.04, 2.05, 2.11, 2.16, 2.19, 2.00, 2.06, 2.07, 2.05, 2.00, 2.27, 2.40, 2.05, 2.03, 2.02, 2.35, 2.39, 2.07, 2.08, 2.11, 2.34, 2.37, 2.09, 2.15, 2.33, 2.25, 2.16, 2.13, 2.20, 2.11, 2.06, 2.41, 2.03. Podziel te dane na klasy o jednakowej rozpiętości wykreśl histogram liczebności absolutnych. Policz względne częstości dla poszczególnych klas. Średnią i wariancję policz najpierw dla danych niepogrupowanych, a nasępnie dla danych pogrupowanych. Czy są duże różnice? Postaraj sie je wyjaśnić. 4. Analityk rynku przez 35 dni śledził ceny pewnego towaru i pogrupował zaobserwowane wyniki następująco: Rozpiętość cen w $ Liczba dni 2,10 - 2,50 4 2,60 - 3,00 6 3,10 - 3,50 8 7 3,60 - 4,00 4,10 - 4,50 6 4 4,60 - 5,00 Cena towaru zmienia się zawsze o 10 centów. Wykreśl dla tych danych histogram. Znajdź klasę dominującą. Oblicz średnią i odchylenie standardowe. Twierdzenie Czebyszewa Co najmniej 3/4 wyników obserwacji odchyla się od średniej o mniej niż o 2 odchylenia standardowe, a co najmniej 8/9 wyników obserwacji odchyla się od średniej o mniej niż 3 odchylenia standardowe. Reguła empiryczna Jeśli rozkład wyników obserwacji ma kształt kopca (tj. histogram jest dość symetryczny o jednej dominancie), to około 68% wyników obserwacji odchyla się od średniej nie więcej niż 1 odchylenie standardowe, 95% wyników odchyla się od średniej nie więcej niż 2 odchylenia standardowe, prawie wszystkie (99,7%) wyniki obserwacji odchylają się od zmiennej nie więcej niż 3 odchylenia standardowe (reguła trzech sigm). 5. Zbadaj, czy twierdzenie Czebyszewa i Reguła empiryczna sprawdzają się w zbiorze danych z zadań 1 - 4. 6. Podane niżej liczby są szacunkowymi wartościami sprzedaży sprzętu (w mln $) przez wymienionych producentów. Skonstruuj dla tych danych wykres strukturalny (”tortowy”): Electrolux 5100 General Electric 4350 Matsushita Electric 4180 Whirpool 3950 Bosch-Siemens 2200 Philips 2000 Maytag 1580 7. Sporządź wykres słupkowy (poziomy i pionowy) dla danych z poprzedniego zadania. Czy któryś z tych trzech rodzajów wykresów jest ”właściwszy” od innych? Jeżeli tak, to dlaczego? 8. Poniżej podano informacje o produkcie krajowym brutto (PKB) za lata 1980 - 1985. (Dane pochodzą z ”Survey of Business” za rok 1987, wydawanego przez U. S. Department of Commerce). Sporządź kolumnowy wykres słupkowy dla tych danych: 2 Zadania Arkusz 7 Rok PKB w mld $ 1980 11995 13262 1981 1982 13614 14504 1983 1984 15913 16757 1985 9. Poniższe dane, zaczerpnięte z ”The Wall Street Journal” opisują spożycie napojów (w galonach na osobę) w Stanach Zjednoczonych w latach 1976 i 1986. Sporządź i zestaw obok siebie pojedyncze wykresy słupkowe z wypisanymi liczbami charakteryzującymi spożycie każdego napoju dla każdego z tych dwóch lat. Powiedz co zauważyłeś. Napoje Napoje bezalkoholowe Kawa Piwo Mleko Herbata Soki owocowe Napoje z proszków Woda mineralna Wino Alkohole mocne 1976 1986 28,6 42,1 29,4 25,4 21,8 23,9 21,9 20,3 7,4 7,4 6,8 6,3 5,5 6,1 1,5 5,7 1,7 2,5 2,0 1,6 10. Opierając się na podanych niżej danych przedstaw na wykresie strukturalnym produkcję różnych wyrobów firmy Coca-Cola (w mln jednostek) w 1986 roku: Coca-Cola Diet Coke New Coke Cherry Coke Coffein-free Diet Coke Coffein-free Coke Diet Cherry Coke 1294,3 490,8 185,1 115,6 85,6 19,0 15,0 11. Dla danych z poprzedniego zadania sporządź wykres słupkowy. 12. Sporządź kolumnowy wykres słupkowy dla danych o wartości wyposażenia (w mld $) następujących uniwersytetów: Harvard Texas Princeton Yale Stanford Columbia Texas A and M 3,4 2,5 1,9 1,7 1,4 1,3 1,11 13. Następujące liczby są kwotami (w $) zanotowanymi na paragonach w pewnym domu towarowym: 3.45; 4.52; 5.41; 6.00; 5.97; 7.18; 1.12; 5.39; 7.03; 10.25; 11.45; 13.21; 12.00; 14.05; 2.99; 3.28; 17.10; 19.28; 21.09; 12.11; 5.88; 4.65; 3.99; 10.10; 23.00; 15.16. 3 Zadania Arkusz 7 Wykreśl wielobok częstości dla tych danych. (Zacznij od wyznaczenia przedziałów, do których będą zaliczane dane i policzenia danych, które znajdą się w poszczególnych przedziałach). 14. Dla danych z poprzedniego zadania wykreśl wielobok częstości względnych 15. Dla tych samych danych sporządź wykres skumulowanych częstości względnych (ogiwę). 16. Makler giełdowy notował ile razy cena akcji, której kurs badał, znalazła się w określonym przedziale i zebrał następujące dane: Przedział (w $) Liczba dni 10 - 11.99 2 5 12 - 13.99 14 - 15.99 12 4 16 - 17.99 1 18 - 20 17. Dany jest rozkład wynagrodzeń w październiku 206 r. (na podstawie Rocznika Statystycznego RP 2008): Wynagrodzenie (w tys. zł) 0,5 - 1,0 1,0 - 1,5 1,5 - 2,0 2,0 - 2,5 2,5 - 3,0 3,0 - 4,0 4,0 - 5,0 5,0 - 7,0 7,0 - 11,0 Odsetek zatrudnionych 9,5 19,2 20,8 16,4 10,5 11,4 5,0 3,6 3,6 Duże rozpiętości wynagrodzeń, zwłaszcza w zakresie wysokich wartości, powodują, że cztery ostatnie klasy są szersze niż wcześniejsze klasy. Sporządź histogram rozkładu wynagrodzeń w ten sposób, by pola prostokątów były proporcjonalne do częstości pracowników znajdujących się w klasach: i) przeliczając odsetki na stałą rozpiętość klas równą 0,5 tys. zł, ii) przeliczając częstości względne tak, aby suma pól prostokątów wynosiła 1. 4