jak określić, czy rozkład jest normalny?

Transkrypt

jak określić, czy rozkład jest normalny?
ANALIZA STATYSTYCZNA
WYNIKÓW BADAŃ
Dopasowanie rozkładów
Dopasowanie rozkładów- ogólny cel
Porównanie średnich dwóch zmiennych
2 zmienne posiadają rozkład normalny ->
test parametryczny (t- studenta)
2 zmienne nie spełniają rozkładu
normalnego -> testy nieparametryczne
Dopasowanie rozkładów- ogólny cel
Cele prognostyczne
Często dla celów prognostycznych jest
wskazane zrozumienie kształtu
rozważanego rozkładu populacji.
Najczęściej używane rozkłady
-Bernoulliego
- Poissona
- Beta
- Prostokątny
- Dwumianowy
- Rayleigha
- Chi-kwadrat
- t-studenta
- Wykładniczy
- Weibulla
- F (Snedeckora)
- Gamma
- Geometryczny
- Gompertza
- Logistyczny
- Logarytmiczno- normalny
- Pareto
- NORMALNY
ROZKŁAD NORMALNY
Rozkład o charakterystycznym kształcie "krzywej
dzwonowej", symetrycznej w stosunku do średniej.
ROZKŁAD NORMALNY
Ogólnie jest dobrym modelem dla rozkładu
zmiennej losowej, w sytuacji gdy:
-Występuje silna tendencja do przyjmowania
wartości położonych blisko środka rozkładu;
ROZKŁAD NORMALNY
Ogólnie jest dobrym modelem dla rozkładu
zmiennej losowej, w sytuacji gdy:
- Dodatnie i ujemne odchylenia od środka rozkładu
są jednakowo prawdopodobne;
ROZKŁAD NORMALNY
Ogólnie jest dobrym modelem dla rozkładu
zmiennej losowej, w sytuacji gdy:
- Liczność odchyleń gwałtownie spada wraz ze
wzrostem ich wielkości.
ROZKŁAD NORMALNY
Podstawowy mechanizm tworzący rozkład
normalny: nieskończoną liczbę niezależnych
zdarzeń losowych które generują wartości danej
zmiennej.
Przykład: istnieje prawdopodobnie prawie
nieograniczona liczba czynników determinujących
wzrost człowieka (olbrzymia liczba genów, sposób
odżywiania, przebyte choroby itd.). Tak więc należy
spodziewać się, że w populacji wzrost podlega
rozkładowi normalnemu.
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
1. obliczenie skośności i kurtozy
2. analiza histogramu
3. analiza wykresów P-P
4. testy normalności
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
1. obliczenie skośności i kurtozy
Skośność mierzy odchylenie rozkładu od symetrii.
Jeśli wartość skośności jest wyraźnie różna od zera,
wówczas dany rozkład jest asymetryczny.
Rozkład normalny jest symetryczny!!!!!!
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
1. obliczenie skośności i kurtozy
Kurtoza mierzy "spiczastość" rozkładu.
Jeśli wartość kurtozy jest wyraźnie różna od zera,
wówczas rozkład jest albo bardziej płaski albo
bardziej spiczasty niż rozkład normalny.
Wartość kurtozy dla rozkładu normalnego wynosi 0!
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
2. Analiza histogramu
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
3. Analiza wykresów P-P
Wykres prawdopodobieństwo-prawdopodobieństwo
Dystrybuanta empiryczna kreślona jest względem
dystrybuanty teoretycznej.
Jeśli teoretyczny rozkład dobrze przybliża rozkład
obserwowany, wówczas punkty na wykresie
powinny leżeć blisko przekątnej.
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
3. Analiza wykresów P-P
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
4. Testy normalności
W celu zidentyfikowania rozkładu zazwyczaj
dopasowuje się rozkład empiryczny do rozkładu
teoretycznego poprzez:
porównanie częstości zaobserwowanych w
danych rzeczywistych do częstości
oczekiwanych rozkładu teoretycznego
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
częstości
zaobserwowane w
danych
rzeczywistych
częstości
oczekiwane
rozkładu
teoretycznego
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
4. Testy normalności
Porównania częstości zaobserwowanych w
danych rzeczywistych do częstości
oczekiwanych rozkładu teoretycznego dokonuje
się za pomocą testów statystycznych:
-
chi kwadrat
Kołmogorowa-Smirnowa
Lillieforsa
Shapiro-Wilka
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
4. Testy normalności
Test Kołmogorowa-Smirnowa: Wykorzystuje
maksymalną wartość różnicy między
dystrybuantą z próby, a założoną dystrybuantą
teoretyczną.
p< 0.05 -> rozkład różni się istotnie od normalnego
p> 0.05 -> rozkład jest normalny
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
4. Testy normalności
Test chi-kwadrat:
Stopnie swobody: df = liczba kategorii - liczba
parametrów - 1
liczba kategorii - liczba klas w tablicy liczności, w
której liczności oczekiwane są wyższe niż 5,
liczba parametrów- liczba parametrów
odpowiedniego rozkładu teoretycznego.
p< 0.05 -> rozkład różni się istotnie od normalnego
p> 0.05 -> rozkład jest normalny
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
4. Testy normalności
Test W Shapiro-Wilka: preferowany test
normalności ze względu na jego dużą moc w
porównaniu z innymi testami.
p< 0.05 -> rozkład różni się istotnie od normalnego
p> 0.05 -> rozkład jest normalny
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
4. Testy normalności
Test Lillieforsa: test oparty na badaniu
maksymalnej różnicy pomiędzy dystrybuantą
empiryczną (z próby) a dystrybuantą rozkładu
normalnego o takiej samej średniej i wariancji
jak oszacowana z próby
p< 0.05 -> rozkład różni się istotnie od normalnego
p> 0.05 -> rozkład jest normalny

Podobne dokumenty