STATYSTYKA OPISOWA Przykłady problemów:

Transkrypt

STATYSTYKA OPISOWA Przykłady problemów:
STATYSTYKA OPISOWA
Przykłady problemów:
- badanie opinii publicznej na temat preferencji wyborczych;
- badanie stanu zdrowia w pewnej miejscowości;
- badanie stopnia zanieczyszczenia gleb metalami ciężkimi w pewnym obszarze;
- badanie socjologiczne na temat spędzania czasu przed
telewizorem bądź komputerem, itd.
Działamy poprzez przeprowadzenie doświadczeń. Można powiedzieć, że wyniki tych doświadczeń mają charakter losowy, gdyż nie da się ich przewidzieć wcześniej.
Zakładamy, że jesteśmy w stanie powtórzyć te doświadczenia w tych samych warunkach pewną liczbę razy
(a lepiej – dowolną liczbę razy).
Podstawowe cechy badań.
1. Mamy do czynienia ze zbiorem (populacja generalna)
pojedynczych nośników informacji (jednostka statystyczna). Populacje mogą być skończone i nieskończone.
2. Jednostki statystyczne są charakteryzowane przez
pewne cechy. Interesujące nas cechy jednostek, które
nie są takie same dla wszystkich jednostek, nazywamy
zmiennymi.
1
3. Badanie może być pełne i częściowe. W przypadku
drugim, badając tylko małą część populacji (próbka losowa) chcemy sądzić o całej populacji. Próbka musi
być reprezentatywna.
Wnioskowanie statystyczne może być błędne.
Etapy badania statystycznego:
- przygotowanie badania;
- gromadzenie danych i ich opracowanie;
- wnioskowanie statystyczne;
- prezentacja wyników.
Rozkład częstości zmiennej - jakie wartości zmienna
przyjęła i jak często.
Metody przedstawienia rozkładu częstości zmiennej: w
postaci tabeli i w postaci wykresów (słupkowe, kołowe).
Przykład. Rozważmy wyniki badania przynależności
do pewnej grupy pracowniczej 474 respondentów.
Kategoria Liczebność Procent
urzędnik
363
76,6
ochroniarz
27
5,7
menedżer
84
17,7
Ogółem
474
100,0
2
Wykres słupkowy zmiennej na podstawie liczebności.
Wykres słupkowy zmiennej na podstawie procentów.
3
Wykres kołowy zmiennej na podstawie liczebności.
Wykres kołowy zmiennej na podstawie procentów.
Gdy liczebność próbki jest duża i zmienna przyjmuje
dużo różnych wartości, tworzymy histogram. W tym
celu wartości zmiennej z próbki grupujemy w klasach,
czyli przedziałach o jednakowej długości. Liczba klas r
zależy od liczebności próbki (patrz np. tabelę):
4
Liczebność próbki n Liczba klas r
30-60
5-8
60-100
7-10
100-200
9-12
200-500
11-17
500-1000
16-25
Klasy najczęściej mają jednakowe długości. Długość
każdej klasy ∆d określamy dzieląc zakres zmiany zmiennej (rozstęp) d = xmax − xmin przez liczbę klas i zaokrąglając z nadmiarem: ∆d > dr .
Granice poszczególnych klas obliczamy, dodając kolejno ∆d do początku pierwszej klasy.
Gdy podział na klasy został przeprowadzony, rozpoczynamy obliczanie liczebności poszczególnych klas.
Liczebnością j-tej klasy (ozn. nj ) nazywamy liczbę wartości, którzy trafiły do j-tej klasy. Oczywiście, n1 +
· · · + nr = n.
Częstością względną j-tej klasy (ozn. wj ) nazywamy
liczbę wj = nj /n. Oczywiście, w1 + · · · + wr = 1.
W wyniku takiego grupowania wartości zmiennej z próbki otrzymujemy tzw. szereg rozdzielczy {(x0j , nj )}rj=1,
gdzie przez x01, . . . , x0r oznaczamy środki kolejnych klas.
5
Czasami obliczamy też liczebności i częstości skumulowane, które otrzymujemy przez kolejne sumowanie nj
i wj odpowiednio od pierwszej klasy do ostatniej.
Przykład. Rozważmy wyniki badania wzrostu (w centymetrach) 100 uczniów pewnej szkoły wyższej. Wyniki
badania są zawarte w tabeli:
185
188
163
177
179
182
187
175
177
184
187
171
171
171
182
173
172
166
181
173
165
162
180
174
163
185
185
174
173
168
183
178
159
175
164
160
187
179
172
168
167
190
173
165
166
186
164
161
158
178
180
184
185
166
181
157
183
173
177
173
165
168
176
173
161
184
169
181
170
162
175
172
165
158
160
194
183
186
179
178
170
184
181
182
176
163
191
181
188
170
164
180
189
182
184
169
171
178
189
191
Jakie wartości zmienna przyjęła i jak często? Rozkład liczebności występowania poszczególnych wartości
zmiennej pokazują następujące tabele:
Wzrost
157 158 159 160 161 162 163 164 165 166
Liczeb.
1 2 1 2 2 2 3 3 4 3
Liczeb. skum. 1 3 4 6 8 10 13 16 20 23
6
167 168 169 170 171 172 173 174 175 176 177 178 179
1 3 2 3 4 3 7 2 3 2 3 4 3
24 27 29 32 36 39 46 48 51 53 56 60 63
180 181 182 183 184 185 186 187 188 189 190 191 194
3 5 4 3 5 4 2 3 2 2 1 2 1
66 71 75 78 83 87 89 92 94 96 97 99 100
Tworzymy szereg rozdzielczy. Przyjmijmy, że klas będzie r = 10.
Klasy
157-160
161-164
165-168
169-172
173-176
177-180
181-184
185-188
189-192
193-196
Klasy dokł.
156,5-160,5
160,5-164,5
164,5-168,5
168,5-172,5
172,5-176,5
176,5-180,5
180,5-184,5
184,5-188,5
188,5-192,5
192,5-196,5
Środek Liczeb. Liczeb. skum.
158,5
6
6
162,5
10
16
166,5
11
27
170,5
12
39
174,5
14
53
178,5
13
66
182,5
17
83
186,5
11
94
190,5
5
99
194,5
1
100
7
Na podstawie szeregu rozdzielczego budujemy histogram. Jest to rodzaj wykresu słupkowego pokazujący
rozkład badanej cechy. Podstawy słupków są klasy, a
wysokości - liczebności bądź częstości klas.
Łącząc łamaną punkty o współrzędnych (x0j , nj ) (bądź
(x0j , wj )), otrzymujemy tzw. wielobok liczebności (częstości).
Przykład: 3,6; 5,0; 4,0; 4,7; 5,2; 5,9; 4,5; 5,3; 5,5; 3,9; 5,6;
3,5; 5,4; 5,2; 4,1; 5,0; 3,1; 5,8; 4,8; 4,4; 4,6; 5,1; 4,7; 3,0; 5,5;
6,1; 3,8; 4,9; 5,6; 6,1; 5,9; 4,2; 6,4; 5,3; 4,5; 4,9; 4,0; 5,2; 3,3;
5,4; 4,7; 6,4; 5,1; 3,4; 5,2; 6,2; 4,4; 4,3; 5,8; 3,7 (n = 50).
8