PODSTAWOWE POJĘCIA STATYSTYKI MATEMATYCZNEJ
Transkrypt
PODSTAWOWE POJĘCIA STATYSTYKI MATEMATYCZNEJ
PODSTAWOWE POJĘCIA STATYSTYKI MATEMATYCZNEJ 1.Populacja generalna (zbiorowość statystyczna) – ogół obiektów (faktów, zdarzeń) będący przedmiotem badania statystycznego. 2. Jednostka statystyczna (jednostka badana) – poszczególny obiekt (fakt, zdarzenie) będący przedmiotem badania, jako element składowy całej badanej zbiorowości statystycznej. 3. Cecha statystyczna – właściwość jednostki statystycznej podlegająca bezpośredniemu badaniu statystycznemu. Podział cech statystycznych: cecha statystyczna niemierzalna (kolor oczu, wykształcenie) mierzalna skokowa (liczba dzieci) ciągła (wzrost, waga) 4. Próba – podzbiór populacji generalnej podlegający bezpośredniemu badaniu ze względu na ustaloną cechę, w celu wyciągnięcia wniosków na temat rozkładu wartości tej cechy w całej populacji generalnej. OPRACOWANIE WYNIKÓW DOŚWIADCZEŃ. Dane uzyskane w wyniku badania statystycznego cechy mierzalnej są przedstawiane w postaci szeregów statystycznych. Wyróżniamy następujące szeregi statystyczne. Szereg szczegółowy: materiał statystyczny uporządkowany wyłącznie według wartości badanej cechy. Szereg rozdzielczy punktowy: dane statystyczne podzielone na grupy według wartości (wariantów) badanej cechy, przy czym poszczególnym wariantom zmiennej przyporządkowane są odpowiadające im liczebności. Szereg rozdzielczy punktowy budujemy tylko dla cechy skokowej. Szereg rozdzielczy przedziałowy: dane statystyczne podzielone na grupy według wielkości, przy czym grupy są przedziałami liczbowymi, zw. przedziałami klasowymi obejmującymi cały zakres otrzymanych wartości badanej cechy. Szeregi rozdzielcze przedziałowe budujemy dla cechy ciągłej oraz dla cechy skokowej przyjmującej dużą liczbę różnych wartości. Tworzenie szeregu rozdzielczego przedziałowego. x1 , x 2 , K , x n , n > 30 Dane: Rozstęp: miara rozproszenia wartości cechy w próbie: R = max( xi ) − min( xi ) Przedziały klasowe: przedziały liczbowe, o których zakładamy, że są – jednakowej długości, – prawostronnie otwarte. Liczba przedziałów klasowych k zależy od liczebności próby n (nie jest to zależność ścisła). Liczbę przedziałów klasowych k i wspólną długość h tych przedziałów określa się tak, by były spełnione następujące warunki: 1) liczbę k ustalamy w zależności od liczby danych n , tak aby 5 ≤ k < 30 w oparciu o jedno z następujących kryteriów: k ≤ 5 ln n k = 1 + 3.322 ln n k= n lub korzystając z tabeli: n k 40 - 60 5 -7 60 - 100 6-9 100 - 200 8 - 12 200 -500 11 -17 2) h powinno być liczbą prostą, np. 0.01, 0.3, 5, 20, itp. w zależności od wielkości danych. 3) iloczyn liczb k i h powinien być równy (lub równy w przybliżeniu z nadmiarem) rozstępowi, czyli R = k ⋅h . Szereg rozdzielczy przedziałowy przedstawia się graficznie w postaci histogramu zw. też wielobokiem częstotliwości lub w postaci diagramu zw. krzywą liczebności. Diagram lub histogram jest geometrycznym obrazem rozkładu badanej cechy w populacji. Wprowadzamy następujące oznaczenia: n – liczba danych, k – liczba przedziałów klasowych, [ai , bi ) – i-ty przedział klasowy, i = 1,K k , n – liczebność i-tego przedziału klasowego, i fi = ni – częstości względne, n s i = ∑ n j – liczebności skumulowane, i j =1 Fi = ∑ f j – częstości skumulowane, wartości dystrybuanty empirycznej i j =1