ROZKŁAD CZĘSTOŚCI (LICZEBNOŚCI) ZMIENNEJ I METODY

Transkrypt

ROZKŁAD CZĘSTOŚCI (LICZEBNOŚCI) ZMIENNEJ I METODY
ROZKŁAD CZĘSTOŚCI (LICZEBNOŚCI)
ZMIENNEJ I METODY JEGO
PRZEDSTAWIANIA
Podstawowe typy (poziomy) zmiennych:
- nominalny (pleć, wyznanie, obszar zamieszkania);
- porządkowy (stosunek do palenia, stopień zaufania
do Sejmu, grupa wiekowa);
- ilościowy (waga, wiek, iloraz inteligencji).
Rozkład częstości zmiennej - jakie wartości
zmienna przyjęła i jak często.
Metody przedstawienia rozkładu częstości
zmiennej: w postaci tabeli i w postaci wykresów.
Typ nominalny: wykresy słupkowe, wykresy kolowe.
Typ porządkowy: to samo + wykresy słupkowe
częstości skumulowanych.
Typ ilościowy: histogram, wielobok, histogram dla
częstości skumulowanych, wielobok dla częstości
skumulowanych.
1
Przy tworzeniu histogramu mamy następujące opcje do
wyboru:
- liczba klas (przedziałów), na które dzielimy zakres
zmiany zmiennej;
- początek pierwszej klasy.
Nawet najmniejsze zmiany w tych opcjach mogą prowadzić do zmiany postaci histogramu!
Wzory do wyboru liczby klas k w zależności od liczby
obserwacji n :
k jest największa liczba naturalna nie √
wieksza od 5 ln n;
k jest najbliższa liczba naturalna do n;
k jest najbliższa liczba naturalna do 1 + 3.322 ln n.
Rekomendacje:
n = 30 − 60 =⇒ k = 6 − 8;
n = 60 − 100 =⇒ k = 7 − 10;
n = 100 − 200 =⇒ k = 9 − 12;
n = 200 − 500 =⇒ k = 11 − 17;
n = 500 − 1500 =⇒ k = 16 − 25.
W histogramie w pierwszą kolej zwracamy uwagę na
liczbę maksimów (lokalnych). Interpretacja: jeden maksimum - dane są jednorodne; dwa maksima - dane są
mieszanką dwóch jednorodnych grup danych itd.
Gdy liczba obserwacji rośnie, histogram zwykle ma tendencję do stabilizacji.
2