Zadania Arkusz 6 Elementy statystyki opisowej 1. Wielki dom

Transkrypt

Zadania Arkusz 6 Elementy statystyki opisowej 1. Wielki dom
Zadania
Arkusz 6
Elementy statystyki opisowej
1. Wielki dom towarowy gromadzi informacje o wartości sprzedaży przypadającej na poszczególnych sprzedawców. W danym dniu zebrano następujące dane o wartości sprzedaży
dla 20 sprzedawców:
6, 9, 10, 12, 13, 14, 14, 15, 16, 16, 16, 17, 17, 18, 18, 19, 20, 21, 22, 24.
Dane te (wyniki obserwacji) zostały już uporządkowane według wielkości. Wyznacz:
i) 50-ty, 80-ty i 90-ty percentyl,
ii) średnią, medianę i dominantę,
iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że
dane te pochodzą z próby).
O d p o w i e d ź. i) 50-ty percentyl = 16; 80-ty percentyl = 19,8; 90-ty percentyl =
21,9. ii) średnia x = 15, 85; mediana me = 16; dominanta = 16. iii) rozstęp = 18; wariancja
z próby s2 = 19, 9237; odchylenie standardowe z próby s = 4, 46.
2. Następujące dane są liczbami pasażerów korzystających z rejsów Delta Airlines między
San Francisco a Seattle w ciągu 33 dni kwietnia i maja:
128, 121, 134, 136, 136, 118, 123, 109, 120, 116, 125, 128, 121, 129, 130, 131, 127,
119, 114, 134, 110, 136, 134, 125, 128, 123, 128, 133, 132, 136, 134, 129, 132.
Oblicz:
i) dolny, środkowy i górny kwartyl dla tego zbioru danych oraz percentyle 10-ty, 15-ty i
65-ty. Jaki jest odstęp międzykwartylowy?
ii) średnią, medianę i dominantę,
iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że
dane te pochodzą z próby).
O d p o w i e d ź. i) dolny kwartyl Q1 = 121, 5; środkowy kwartyl Q2 = 128; górny
kwartyl Q3 = 133, 5; 10-ty percentyl = 114,8; 15-ty percentyl = 118,1; 65-ty percentyl =
131,1; odstęp międzykwartylowy IQR = Q3 − Q1 = 12. ii) średnia x = 126, 64; mediana
me = Q2 = 128; dominanta = 128 lub 136 lub 134 trudno w tym przypadku wskazać
jednoznacznie dominantę, co spodowane jest małą liczbą obserwacji. Zasadniczo dominantę
należy wyznaczać tylko dla dużego zbioru danych, lub danych pogrupowanych w szeregu
rozdzielczym. iii) rozstęp = 27; wariancja z próby s2 = 57, 7386; odchylenie standardowe z
próby s = 7, 599.
3. Następujące liczby są rocznymi stopami przychodu z 15 akcji:
12,5 13 14,8 11 16,7 9 8,3 -1,2 3,9
15,5 16,2 18 11,6 10 9,5
Wyznacz:
i) medianę, 1-szy i 3-ci kwartyl oraz 55-ty i 85-ty percentyl dla tych danych,
ii) średnią i dominantę,
iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że
dane te pochodzą z próby).
1
Zadania
Arkusz 6
O d p o w i e d ź. i) mediana me = 11, 6; Q1 = 9; Q3 = 15, 5; 55-ty percentyl = 12,32;
85-ty percentyl = 16,5. ii) średnia x = 11, 2533; dominanta jest nieokreślona (zbyt mała
liczba obserwacji). iii) rozstęp = 19,2; wariancja s2 = 25, 9041; odchylenie standardowe
s = 5, 0896.
4. Następujące dane to oceny uzyskane na egzaminie z zarządzania w grupie 22 studentów:
88, 56, 64, 45, 52, 76, 54, 79, 38, 98, 69, 77, 71, 45, 60, 78, 90, 81, 87, 44, 80, 41.
Znajdź:
i) percentyle 20-ty, 30-ty, 60-ty i 90-ty,
ii) średnią, medianę i dominantę,
iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że
dane te pochodzą z próby).
O d p o w i e d ź. i) 20-ty percentyl = 45; 30-ty percentyl = 53,8; 60-ty percentyl = 76,8;
90-ty percentyl = 89,4. ii) średnia x = 66, 96; mediana me = 70; dominanta = 45, ale w
tym przypadku trudno uznać tę wartość za dominującą, zbyt mało obserwacji. iii) rozstęp
= 60; wariancja s2 = 321, 3788; odchylenie standardowe s = 17, 93.
5. Następujące dane informują o liczbie ofert napływających codziennie do rządu pewnego
rozwijającego się kraju od firm chcącyh wygrać przetarg na budowę urządzeń w nowym
porcie:
2, 3, 2, 4, 3, 5, 1, 1, 6, 4, 7, 2, 5, 1, 6.
Wyznacz:
i) kwartyle, odstęp międzykwartylowy oraz 60-ty percentyl,
ii) średnią, medianę i dominantę,
iii) rozstęp, wariancję i odchylenie standardowe dla poniższych danych (przyjmując, że
dane te pochodzą z próby).
O d p o w i e d ź. i) Q1 = 2; Q3 = 5; odstęp międzykwartylowy IQR = 3; 60-ty percentyl
= 4. ii) x = 3, 47; me = 3; dominanta - nieokreślona. iii) rozstęp = 6; s2 = 3, 981; s = 1, 995.
6. Przedstaw różnice między trzema miarami tendencji centralnej.
7. Wyjaśnij dlaczego potrzebujemy miar zmienności i jaką informację te miary przekazują?
8. Która z miar zmienności jest najważniejsza i dlaczego?
9. Czym różnią się sposoby obliczania wariancji w próbie i w populacji?
10. Następujące dane informują o miesięcznej produkcji stali w milionach ton:
7,0; 6,9; 8,2; 7,8; 7,7; 7,3; 6,8; 6,7; 8,2; 8,4; 7,0; 6,7; 7,5; 7,2; 7,9; 7,6; 6,7; 6,6; 6,3;
5,6; 7,8; 5,5; 6,2; 5,8; 5,8; 6,1; 6,0; 7,3; 7,3; 7,5; 7,2; 7,2; 7,4; 7,6.
Sporządź dla tych danych zestawienie łodyga-liście oraz wykres-pudełko. Jakie korzyści odnosimy z zestawienia łodyga-liście, a jakie z wykresu-pudełko?
O d p o w i e d ź. Zestawienie łodyga-liście:
5
6
7
8
5688
0123677789
00222333455667889
224
2
Zadania
Arkusz 6
11. Uczestnictwo robotników w zarządzaniu wciąga pracowników w proces podejmowania decyzji w spółkach. Podanie niżej dane to procenty pracowników zaangażowanych w
programach uczestnictwa robotników w zarządzaniu w pewnej grupie spółek:
5, 32, 33, 35, 42, 43, 42, 45, 46, 44, 47, 48, 48, 48, 49, 49,50, 37, 38, 34, 51, 52, 52,
47, 53, 55, 56, 57, 58, 63, 78.
Sporządź dla tych danych zestawienie łodyga-liście oraz wykres-pudełko.
12. Na poniższej liście podano wydatki rządowe krajów zachodniej półkuli wyrażone w
procentach produktu krajowego brutto (są to dane za lata 1979-1981):
Antyle Holenderskie
Argentyna
Bahamy
Belize
Boliwia
Brazylia
Chile
Dominikana
Ekwador
Gujana
Gwadelupa
Gwatemala
Haiti
Honduras
Jamajka
Kanada
Kolumbia
Kostaryka
Kuba
21,3
12,7
13,2
14,0
13,6
8,9
12,4
7,8
15,0
23,9
32,3
7,7
87,4
14,6
21,5
19,4
8,0
18,3
2,1
Martynika
Meksyk
Nikaragua
Panama
Paragwaj
Peru
Puerto Rico
Salwador
Stany Zjednoczone
Surinam
Trynidad i Tobago
Urugwaj
Wenezuela
3
26,0
10,8
11,6
15,3
7,3
12,5
17,1
15,1
20,7
16,4
16,8
13,5
13,1
Zadania
Arkusz 6
Zbuduj dla tych danych wykres-pudełko. Czy są tu nietypowe wyniki obserwacji lub wyniki podejrzane o nietypowość? Czy możesz podać przyczyny występowania w tym zbiorze
obserwacji nietypowych?
13. Następujące dane to zawartość srebra w tonie rudy wydobywanej w dwóch kopalniach
(w uncjach):
Kopalnia A
Kopalnia B
34
23
32
24
35
28
37
29
41
32
42
34
43
35
45
37
46
38
45
40
48
43
49
44
51
47
52
48
53
49
60
50
73
51
76
52
85
59
Sporządź zestawienie łodyga-liście i wykres pudełkowy dla danych pochodzących z każdej
kopalni. Porównaj oba rodzaje rysunków dla obu kopalń. Jakie wnioski możesz wyciągnąć
z tych porównań?
Wykres-Pudełko
me
x̄
o
*
Q1
Q3
IQR
1, 5 · IQR
3 · IQR
—
—
—
—
—
—
1, 5 · IQR
3 · IQR
Q1 - dolny kwartyl (25-ty percentyl),
Q3 - górny kwartyl (75-ty percentyl),
IQR = Q3 − Q1 - odstęp międzykwartylowy (interquartile range),
me - mediana,
o - obserwacja nietypowa,
∗ - obserwacja podejrzana o nietypowość.
4