STATYSTYKA OPISOWA Przykłady problemów:
Transkrypt
STATYSTYKA OPISOWA Przykłady problemów:
STATYSTYKA OPISOWA Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych; - badanie stanu zdrowia w pewnej miejscowości; - badanie stopnia zanieczyszczenia gleb metalami ciężkimi w pewnym obszarze; - badanie socjologiczne na temat spędzania czasu przed telewizorem bądź komputerem, itd. Działamy poprzez przeprowadzenie doświadczeń. Można powiedzieć, że wyniki tych doświadczeń mają charakter losowy, gdyż nie da się ich przewidzieć wcześniej. Zakładamy, że jesteśmy w stanie powtórzyć te doświadczenia w tych samych warunkach pewną liczbę razy (a lepiej – dowolną liczbę razy). Podstawowe cechy badań. 1. Mamy do czynienia ze zbiorem (populacja generalna) pojedynczych nośników informacji (jednostka statystyczna). Populacje mogą być skończone i nieskończone. 2. Jednostki statystyczne są charakteryzowane przez pewne cechy. Interesujące nas cechy jednostek, które nie są takie same dla wszystkich jednostek, nazywamy zmiennymi. 1 3. Badanie może być pełne i częściowe. W przypadku drugim, badając tylko małą część populacji (próbka losowa) chcemy sądzić o całej populacji. Próbka musi być reprezentatywna. Wnioskowanie statystyczne może być błędne. Etapy badania statystycznego: - przygotowanie badania; - gromadzenie danych i ich opracowanie; - wnioskowanie statystyczne; - prezentacja wyników. Rozkład częstości zmiennej - jakie wartości zmienna przyjęła i jak często. Metody przedstawienia rozkładu częstości zmiennej: w postaci tabeli i w postaci wykresów (słupkowe, kołowe). Przykład. Rozważmy wyniki badania przynależności do pewnej grupy pracowniczej 474 respondentów. Kategoria Liczebność Procent urzędnik 363 76,6 ochroniarz 27 5,7 menedżer 84 17,7 Ogółem 474 100,0 2 Wykres słupkowy zmiennej na podstawie liczebności. Wykres słupkowy zmiennej na podstawie procentów. 3 Wykres kołowy zmiennej na podstawie liczebności. Wykres kołowy zmiennej na podstawie procentów. Gdy liczebność próbki jest duża i zmienna przyjmuje dużo różnych wartości, tworzymy histogram. W tym celu wartości zmiennej z próbki grupujemy w klasach, czyli przedziałach o jednakowej długości. Liczba klas r zależy od liczebności próbki (patrz np. tabelę): 4 Liczebność próbki n Liczba klas r 30-60 5-8 60-100 7-10 100-200 9-12 200-500 11-17 500-1000 16-25 Klasy najczęściej mają jednakowe długości. Długość każdej klasy ∆d określamy dzieląc zakres zmiany zmiennej (rozstęp) d = xmax − xmin przez liczbę klas i zaokrąglając z nadmiarem: ∆d > dr . Granice poszczególnych klas obliczamy, dodając kolejno ∆d do początku pierwszej klasy. Gdy podział na klasy został przeprowadzony, rozpoczynamy obliczanie liczebności poszczególnych klas. Liczebnością j-tej klasy (ozn. nj ) nazywamy liczbę wartości, którzy trafiły do j-tej klasy. Oczywiście, n1 + · · · + nr = n. Częstością względną j-tej klasy (ozn. wj ) nazywamy liczbę wj = nj /n. Oczywiście, w1 + · · · + wr = 1. W wyniku takiego grupowania wartości zmiennej z próbki otrzymujemy tzw. szereg rozdzielczy {(x0j , nj )}rj=1, gdzie przez x01, . . . , x0r oznaczamy środki kolejnych klas. 5 Czasami obliczamy też liczebności i częstości skumulowane, które otrzymujemy przez kolejne sumowanie nj i wj odpowiednio od pierwszej klasy do ostatniej. Przykład. Rozważmy wyniki badania wzrostu (w centymetrach) 100 uczniów pewnej szkoły wyższej. Wyniki badania są zawarte w tabeli: 185 188 163 177 179 182 187 175 177 184 187 171 171 171 182 173 172 166 181 173 165 162 180 174 163 185 185 174 173 168 183 178 159 175 164 160 187 179 172 168 167 190 173 165 166 186 164 161 158 178 180 184 185 166 181 157 183 173 177 173 165 168 176 173 161 184 169 181 170 162 175 172 165 158 160 194 183 186 179 178 170 184 181 182 176 163 191 181 188 170 164 180 189 182 184 169 171 178 189 191 Jakie wartości zmienna przyjęła i jak często? Rozkład liczebności występowania poszczególnych wartości zmiennej pokazują następujące tabele: Wzrost 157 158 159 160 161 162 163 164 165 166 Liczeb. 1 2 1 2 2 2 3 3 4 3 Liczeb. skum. 1 3 4 6 8 10 13 16 20 23 6 167 168 169 170 171 172 173 174 175 176 177 178 179 1 3 2 3 4 3 7 2 3 2 3 4 3 24 27 29 32 36 39 46 48 51 53 56 60 63 180 181 182 183 184 185 186 187 188 189 190 191 194 3 5 4 3 5 4 2 3 2 2 1 2 1 66 71 75 78 83 87 89 92 94 96 97 99 100 Tworzymy szereg rozdzielczy. Przyjmijmy, że klas będzie r = 10. Klasy 157-160 161-164 165-168 169-172 173-176 177-180 181-184 185-188 189-192 193-196 Klasy dokł. 156,5-160,5 160,5-164,5 164,5-168,5 168,5-172,5 172,5-176,5 176,5-180,5 180,5-184,5 184,5-188,5 188,5-192,5 192,5-196,5 Środek Liczeb. Liczeb. skum. 158,5 6 6 162,5 10 16 166,5 11 27 170,5 12 39 174,5 14 53 178,5 13 66 182,5 17 83 186,5 11 94 190,5 5 99 194,5 1 100 7 Na podstawie szeregu rozdzielczego budujemy histogram. Jest to rodzaj wykresu słupkowego pokazujący rozkład badanej cechy. Podstawy słupków są klasy, a wysokości - liczebności bądź częstości klas. Łącząc łamaną punkty o współrzędnych (x0j , nj ) (bądź (x0j , wj )), otrzymujemy tzw. wielobok liczebności (częstości). Przykład: 3,6; 5,0; 4,0; 4,7; 5,2; 5,9; 4,5; 5,3; 5,5; 3,9; 5,6; 3,5; 5,4; 5,2; 4,1; 5,0; 3,1; 5,8; 4,8; 4,4; 4,6; 5,1; 4,7; 3,0; 5,5; 6,1; 3,8; 4,9; 5,6; 6,1; 5,9; 4,2; 6,4; 5,3; 4,5; 4,9; 4,0; 5,2; 3,3; 5,4; 4,7; 6,4; 5,1; 3,4; 5,2; 6,2; 4,4; 4,3; 5,8; 3,7 (n = 50). 8