Zadania Arkusz 7 Metody prezentacji danych

Transkrypt

Zadania Arkusz 7 Metody prezentacji danych
Zadania
Arkusz 7
Metody prezentacji danych - Histogramy
1. Czasopismo ”Fortune” z 12 października 1987 r. podaje listę najbogatszych ludzi na
świecie i wartość ich majątku. Według szacunku czasopisma wartości te (w miliardach $)
przedstawiają się następująco:
25.0, 20.0, 8.7, 7.5, 7.4, 6.0, 5.7, 5.5, 5.0, 5.0, 4.4, 4.0, 4.0, 3.6, 3.4, 3.1, 3.0, 3.0,
2.9, 2.8, 2.8, 2.5, 2.5, 2.5, 2.4, 2.4, 2.4, 2.2, 2.0, 2.0, 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.5, 1.5,
1.5, 1.4, 1.3, 1.3, 1.3, 1.3, 1.2, 1.2, 1.2, 1.2, 1.1, 1.1, 1.1, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
1.0, 1.0.
Sporządź dla tych danych histogramy częstości absolutnych (liczebności) i częstości względnych.
O d p o w i e d ź.
2. Coraz więcej pracodawców korzysta z testów psychologicznych do sprawdzenia, czy przyszły pracownik nadaje się do pracy w firmie. Przedstawione niżej dane pokazują liczebności
grup osób, które na egzaminach psychologicznych zorganizowanych przez firmę uzyskały
określone oceny. Oceny (wyrażone w punktach) podzielono na klasy o rozpiętości 10 punktów:
Klasa ocen
41-50
51-60
61-70
71-80
81-90
91-100
Liczebności
5
7
10
16
11
9
Wykreśl histogram liczebności (absolutnych lub względnych). Znajdź średnią uzyskanych
ocen i jej odchylenie standardowe. Która klasa jest klasą medialną?
3. Następujące dane podają, z jaką liczbą stron (w milionach) równoważny jest zasób
informacji, który można przechowywać na dysku optycznym firmy Kodak:
1
Zadania
Arkusz 7
2.01, 2.32, 2.45, 2.00, 2.22, 2.67, 2.03, 2.08, 2.09, 2.55, 2.33, 2.31, 2.22, 2.10, 2.15,
2.17, 2.43, 2.22, 2.18, 2.19, 2.30, 2.42, 2.00, 2.03, 2.04, 2.05, 2.11, 2.16, 2.19, 2.00,
2.06, 2.07, 2.05, 2.00, 2.27, 2.40, 2.05, 2.03, 2.02, 2.35, 2.39, 2.07, 2.08, 2.11, 2.34,
2.37, 2.09, 2.15, 2.33, 2.25, 2.16, 2.13, 2.20, 2.11, 2.06, 2.41, 2.03.
Podziel te dane na klasy o jednakowej rozpiętości wykreśl histogram liczebności absolutnych.
Policz względne częstości dla poszczególnych klas. Średnią i wariancję policz najpierw dla
danych niepogrupowanych, a nasępnie dla danych pogrupowanych. Czy są duże różnice?
Postaraj sie je wyjaśnić.
4. Analityk rynku przez 35 dni śledził ceny pewnego towaru i pogrupował zaobserwowane
wyniki następująco:
Rozpiętość cen w $ Liczba dni
2,10 - 2,50
4
2,60 - 3,00
6
3,10 - 3,50
8
7
3,60 - 4,00
4,10 - 4,50
6
4
4,60 - 5,00
Cena towaru zmienia się zawsze o 10 centów. Wykreśl dla tych danych histogram. Znajdź
klasę dominującą. Oblicz średnią i odchylenie standardowe.
Twierdzenie Czebyszewa Co najmniej 3/4 wyników obserwacji odchyla się od średniej
o mniej niż o 2 odchylenia standardowe, a co najmniej 8/9 wyników obserwacji odchyla
się od średniej o mniej niż 3 odchylenia standardowe.
Reguła empiryczna Jeśli rozkład wyników obserwacji ma kształt kopca (tj. histogram jest
dość symetryczny o jednej dominancie), to około 68% wyników obserwacji odchyla się od
średniej nie więcej niż 1 odchylenie standardowe, 95% wyników odchyla się od średniej
nie więcej niż 2 odchylenia standardowe, prawie wszystkie (99,7%) wyniki obserwacji
odchylają się od zmiennej nie więcej niż 3 odchylenia standardowe (reguła trzech sigm).
5. Zbadaj, czy twierdzenie Czebyszewa i Reguła empiryczna sprawdzają się w zbiorze
danych z zadań 1 - 4.
6. Podane niżej liczby są szacunkowymi wartościami sprzedaży sprzętu (w mln $) przez
wymienionych producentów. Skonstruuj dla tych danych wykres strukturalny (”tortowy”):
Electrolux
5100
General Electric
4350
Matsushita Electric 4180
Whirpool
3950
Bosch-Siemens
2200
Philips
2000
Maytag
1580
7. Sporządź wykres słupkowy (poziomy i pionowy) dla danych z poprzedniego zadania.
Czy któryś z tych trzech rodzajów wykresów jest ”właściwszy” od innych? Jeżeli tak, to
dlaczego?
8. Poniżej podano informacje o produkcie krajowym brutto (PKB) za lata 1980 - 1985.
(Dane pochodzą z ”Survey of Business” za rok 1987, wydawanego przez U. S. Department
of Commerce). Sporządź kolumnowy wykres słupkowy dla tych danych:
2
Zadania
Arkusz 7
Rok PKB w mld $
1980
11995
13262
1981
1982
13614
14504
1983
1984
15913
16757
1985
9. Poniższe dane, zaczerpnięte z ”The Wall Street Journal” opisują spożycie napojów (w
galonach na osobę) w Stanach Zjednoczonych w latach 1976 i 1986. Sporządź i zestaw obok
siebie pojedyncze wykresy słupkowe z wypisanymi liczbami charakteryzującymi spożycie
każdego napoju dla każdego z tych dwóch lat. Powiedz co zauważyłeś.
Napoje
Napoje bezalkoholowe
Kawa
Piwo
Mleko
Herbata
Soki owocowe
Napoje z proszków
Woda mineralna
Wino
Alkohole mocne
1976 1986
28,6 42,1
29,4 25,4
21,8 23,9
21,9 20,3
7,4
7,4
6,8
6,3
5,5
6,1
1,5
5,7
1,7
2,5
2,0
1,6
10. Opierając się na podanych niżej danych przedstaw na wykresie strukturalnym produkcję różnych wyrobów firmy Coca-Cola (w mln jednostek) w 1986 roku:
Coca-Cola
Diet Coke
New Coke
Cherry Coke
Coffein-free Diet Coke
Coffein-free Coke
Diet Cherry Coke
1294,3
490,8
185,1
115,6
85,6
19,0
15,0
11. Dla danych z poprzedniego zadania sporządź wykres słupkowy.
12. Sporządź kolumnowy wykres słupkowy dla danych o wartości wyposażenia (w mld $)
następujących uniwersytetów:
Harvard
Texas
Princeton
Yale
Stanford
Columbia
Texas A and M
3,4
2,5
1,9
1,7
1,4
1,3
1,11
13. Następujące liczby są kwotami (w $) zanotowanymi na paragonach w pewnym domu
towarowym:
3.45; 4.52; 5.41; 6.00; 5.97; 7.18; 1.12; 5.39; 7.03; 10.25; 11.45; 13.21; 12.00; 14.05;
2.99; 3.28; 17.10; 19.28; 21.09; 12.11; 5.88; 4.65; 3.99; 10.10; 23.00; 15.16.
3
Zadania
Arkusz 7
Wykreśl wielobok częstości dla tych danych. (Zacznij od wyznaczenia przedziałów, do których będą zaliczane dane i policzenia danych, które znajdą się w poszczególnych przedziałach).
14. Dla danych z poprzedniego zadania wykreśl wielobok częstości względnych
15. Dla tych samych danych sporządź wykres skumulowanych częstości względnych (ogiwę).
16. Makler giełdowy notował ile razy cena akcji, której kurs badał, znalazła się w określonym przedziale i zebrał następujące dane:
Przedział (w $) Liczba dni
10 - 11.99
2
5
12 - 13.99
14 - 15.99
12
4
16 - 17.99
1
18 - 20
17. Dany jest rozkład wynagrodzeń w październiku 206 r. (na podstawie Rocznika Statystycznego RP 2008):
Wynagrodzenie (w tys. zł)
0,5 - 1,0
1,0 - 1,5
1,5 - 2,0
2,0 - 2,5
2,5 - 3,0
3,0 - 4,0
4,0 - 5,0
5,0 - 7,0
7,0 - 11,0
Odsetek zatrudnionych
9,5
19,2
20,8
16,4
10,5
11,4
5,0
3,6
3,6
Duże rozpiętości wynagrodzeń, zwłaszcza w zakresie wysokich wartości, powodują, że cztery
ostatnie klasy są szersze niż wcześniejsze klasy. Sporządź histogram rozkładu wynagrodzeń w
ten sposób, by pola prostokątów były proporcjonalne do częstości pracowników znajdujących
się w klasach:
i) przeliczając odsetki na stałą rozpiętość klas równą 0,5 tys. zł,
ii) przeliczając częstości względne tak, aby suma pól prostokątów wynosiła 1.
4

Podobne dokumenty