PODSTAWOWE POJĘCIA STATYSTYKI MATEMATYCZNEJ

Transkrypt

PODSTAWOWE POJĘCIA STATYSTYKI MATEMATYCZNEJ
PODSTAWOWE POJĘCIA STATYSTYKI MATEMATYCZNEJ
1.Populacja generalna (zbiorowość statystyczna) – ogół obiektów (faktów, zdarzeń) będący
przedmiotem badania statystycznego.
2. Jednostka statystyczna (jednostka badana) – poszczególny obiekt (fakt, zdarzenie) będący
przedmiotem badania, jako element składowy całej badanej zbiorowości statystycznej.
3. Cecha statystyczna – właściwość jednostki statystycznej podlegająca bezpośredniemu
badaniu statystycznemu.
Podział cech statystycznych:
cecha statystyczna
niemierzalna
(kolor oczu, wykształcenie)
mierzalna
skokowa
(liczba dzieci)
ciągła
(wzrost, waga)
4. Próba – podzbiór populacji generalnej podlegający bezpośredniemu badaniu ze względu
na ustaloną cechę, w celu wyciągnięcia wniosków na temat rozkładu wartości tej cechy w
całej populacji generalnej.
OPRACOWANIE WYNIKÓW DOŚWIADCZEŃ.
Dane uzyskane w wyniku badania statystycznego cechy mierzalnej są przedstawiane w
postaci szeregów statystycznych.
Wyróżniamy następujące szeregi statystyczne.
Szereg szczegółowy: materiał statystyczny uporządkowany wyłącznie według wartości
badanej cechy.
Szereg rozdzielczy punktowy: dane statystyczne podzielone na grupy według wartości
(wariantów) badanej cechy, przy czym poszczególnym wariantom zmiennej
przyporządkowane są odpowiadające im liczebności. Szereg rozdzielczy punktowy budujemy
tylko dla cechy skokowej.
Szereg rozdzielczy przedziałowy: dane statystyczne podzielone na grupy według wielkości,
przy czym grupy są przedziałami liczbowymi, zw. przedziałami klasowymi obejmującymi
cały zakres otrzymanych wartości badanej cechy. Szeregi rozdzielcze przedziałowe budujemy
dla cechy ciągłej oraz dla cechy skokowej przyjmującej dużą liczbę różnych wartości.
Tworzenie szeregu rozdzielczego przedziałowego.
x1 , x 2 , K , x n , n > 30
Dane:
Rozstęp: miara rozproszenia wartości cechy w próbie:
R = max( xi ) − min( xi )
Przedziały klasowe: przedziały liczbowe, o których zakładamy, że są
– jednakowej długości,
– prawostronnie otwarte.
Liczba przedziałów klasowych k zależy od liczebności próby n (nie jest to zależność ścisła).
Liczbę przedziałów klasowych k i wspólną długość h tych przedziałów określa się tak, by
były spełnione następujące warunki:
1) liczbę k ustalamy w zależności od liczby danych n , tak aby
5 ≤ k < 30
w oparciu o jedno z następujących kryteriów:
k ≤ 5 ln n
k = 1 + 3.322 ln n
k= n
lub korzystając z tabeli:
n
k
40 - 60
5 -7
60 - 100
6-9
100 - 200
8 - 12
200 -500
11 -17
2) h powinno być liczbą prostą, np. 0.01, 0.3, 5, 20, itp. w zależności od wielkości danych.
3) iloczyn liczb k i h powinien być równy (lub równy w przybliżeniu z nadmiarem)
rozstępowi, czyli
R = k ⋅h .
Szereg rozdzielczy przedziałowy przedstawia się graficznie w postaci histogramu zw. też
wielobokiem częstotliwości lub w postaci diagramu zw. krzywą liczebności. Diagram lub
histogram jest geometrycznym obrazem rozkładu badanej cechy w populacji.
Wprowadzamy następujące oznaczenia:
n – liczba danych,
k – liczba przedziałów klasowych,
[ai , bi ) – i-ty przedział klasowy, i = 1,K k ,
n – liczebność i-tego przedziału klasowego,
i
fi =
ni – częstości względne,
n
s i = ∑ n j – liczebności skumulowane,
i
j =1
Fi = ∑ f j – częstości skumulowane, wartości dystrybuanty empirycznej
i
j =1