ROZKŁAD CZĘSTOŚCI (LICZEBNOŚCI) ZMIENNEJ I METODY
Transkrypt
ROZKŁAD CZĘSTOŚCI (LICZEBNOŚCI) ZMIENNEJ I METODY
ROZKŁAD CZĘSTOŚCI (LICZEBNOŚCI) ZMIENNEJ I METODY JEGO PRZEDSTAWIANIA Podstawowe typy (poziomy) zmiennych: - nominalny (pleć, wyznanie, obszar zamieszkania); - porządkowy (stosunek do palenia, stopień zaufania do Sejmu, grupa wiekowa); - ilościowy (waga, wiek, iloraz inteligencji). Rozkład częstości zmiennej - jakie wartości zmienna przyjęła i jak często. Metody przedstawienia rozkładu częstości zmiennej: w postaci tabeli i w postaci wykresów. Typ nominalny: wykresy słupkowe, wykresy kolowe. Typ porządkowy: to samo + wykresy słupkowe częstości skumulowanych. Typ ilościowy: histogram, wielobok, histogram dla częstości skumulowanych, wielobok dla częstości skumulowanych. 1 Przy tworzeniu histogramu mamy następujące opcje do wyboru: - liczba klas (przedziałów), na które dzielimy zakres zmiany zmiennej; - początek pierwszej klasy. Nawet najmniejsze zmiany w tych opcjach mogą prowadzić do zmiany postaci histogramu! Wzory do wyboru liczby klas k w zależności od liczby obserwacji n : k jest największa liczba naturalna nie √ wieksza od 5 ln n; k jest najbliższa liczba naturalna do n; k jest najbliższa liczba naturalna do 1 + 3.322 ln n. Rekomendacje: n = 30 − 60 =⇒ k = 6 − 8; n = 60 − 100 =⇒ k = 7 − 10; n = 100 − 200 =⇒ k = 9 − 12; n = 200 − 500 =⇒ k = 11 − 17; n = 500 − 1500 =⇒ k = 16 − 25. W histogramie w pierwszą kolej zwracamy uwagę na liczbę maksimów (lokalnych). Interpretacja: jeden maksimum - dane są jednorodne; dwa maksima - dane są mieszanką dwóch jednorodnych grup danych itd. Gdy liczba obserwacji rośnie, histogram zwykle ma tendencję do stabilizacji. 2