Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Transkrypt

Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za
pomocą testów statystycznych
Weryfikacja hipotez statystycznych za
pomocą testów stat.
Hipoteza statystyczna
Dowolne przypuszczenie co do rozkładu populacji generalnej (jego
postaci funkcyjnej lub wartości parametrów). Prawdziwość
przypuszczenia oceniana jest na
podstawie wyników próby
losowej.
• hipotezy parametryczne: dotyczą konkretnej wartości parametru
rozkładu (np. wariancji, średniej)
• hipotezy nieparametryczne: dotyczą postaci funkcyjnej rozkładu
(zgodność rozkładów empirycznych z teoretycznymi)
Weryfikacja hipotez statystycznych za
pomocą testów stat.
Test statystyczny
Reguła postępowania, która każdej możliwej próbie losowej
pobranej z
populacji generalnej przyporządkowuje decyzję
przyjęcia lub odrzucenia stawianej hipotezy.
Weryfikacja hipotez statystycznych
Zasady konstrukcji testów statystycznych
X – cecha populacji,  - parametr rozkładu cechy X
1. Formułujemy hipotezę zerową (podstawową), która
podlega weryfikacji
H0: 1 = 2
2. Formułujemy hipotezę alternatywną
H1: 1 > 2 LUB H1: 1 < 2 LUB H1: 1  2
Hipotezy jednostronne
Hipoteza dwustronna
Weryfikacja hipotez statystycznych za
pomocą testów stat.
Zasady konstrukcji testów statystycznych
3. Obliczenie funkcji testowej i porównanie jej z wartością
krytyczną dla wybranego poziomu istotności 
Weryfikacja hipotez statystycznych za
pomocą testów stat.
Terminologia
Un – sprawdzian (statystyka testująca)
K – zbiór krytyczny (zbiór odrzuceń)
- poziom istotności (typowe wartości : 0,1 ; 0,05 ; 0,01)
 kr – krytyczny poziom istotności (poziom istotności przy
którym następuje zmiana decyzji
Weryfikacja hipotez statystycznych za
pomocą testów stat.
Błędy decyzji w teście sprawdzającym hipotezę H0
Weryfikacja hipotez statystycznych za
pomocą testów stat.
Hipotezy nieparametryczne
Badanie zgodności rozkładu
empirycznego z rozkładami
teoretycznymi
Badanie zgodności rozkładu empirycznego z
teoretycznym
Pytanie badawcze:
Jakim rozkładem teoretycznym (konkretnym wzorem
matematycznym) możemy opisać rozkład (histogram)
naszych danych doświadczalnych ?
Badanie zgodności rozkładu empirycznego z
teoretycznym
Pytanie badawcze:
Nie satysfakcjonuje nas
sama eksploracja
danych?
Na podstawie dopasowanego modelu
teoretycznego prognozujemy, jak np.
zjawisko będzie wyglądało w przyszłym
roku
Chcemy użyć metody
statystycznej
wymagającej rozkładu
normalnego?
Sprawdzamy czy nasza
zmienna/zmienne spełnia/spełniają
rozkład normalny
Badanie zgodności rozkładu empirycznego z
teoretycznym
1. Hipoteza zerowa – rozkład jest normalny
H0: F(x) = Fn(x)
2. Hipoteza alternatywna – rozkład jest różny od rozkładu
normalnego
H1: F(x)  Fn(x)
Badanie zgodności rozkładu empirycznego z
teoretycznym
3. Funkcje testowe
𝑘
2
𝜒 =
𝑖=1
2
𝑛𝑖 − 𝑛𝑝𝑖
𝑛𝑝𝑖
2
2
𝜒𝑘𝑟
(𝛼, 𝑓 = 𝑘 − 𝑚 − 1)
Stosowana do wyników, które zostały wcześniej podzielone na
przedziały!
k – ilość przedziałów
ni – liczebność empiryczna w danej klasie
npi – liczebność teoretyczna w danej klasie (zgodna z rozkładem normalnym)
m – liczba parametrów rozkładu (m=2 dla rozkładu normalnego)
Badanie zgodności rozkładu empirycznego z
teoretycznym
3. Funkcje testowe
2
𝜒 >
2
2
𝜒𝑘𝑟
𝜒 <
2
𝜒𝑘𝑟
2
Odrzucamy H0
Rozkład empiryczny nie jest
rozkładem normalnym
Przyjmujemy H0
Rozkład empiryczny jest
rozkładem normalnym
Wynik testu silnie zależy od tego, jak są podzielone wyniki!
Badanie zgodności rozkładu empirycznego z
teoretycznym
3. Funkcje testowe
Kołmogorowa-Smirnowa
𝛿 = sup 𝐹 𝑥 − 𝐹𝑛 (𝑥)
Maksymalna różnica
między dystrybuantami
𝜆=𝛿 𝑛
lkr odczytujemy z rozkładu l Kołmogorowa-Smirnowa dla danego

Badanie zgodności rozkładu empirycznego z
teoretycznym
3. Funkcje testowe
Kołmogorowa-Smirnowa
P=1-=0.95
Badanie zgodności rozkładu empirycznego z
teoretycznym
3. Funkcje testowe
𝜆 > 𝜆𝑘𝑟
𝜆 < 𝜆𝑘𝑟
Kołmogorowa-Smirnowa
Odrzucamy H0
Rozkład empiryczny nie jest
rozkładem normalnym
Przyjmujemy H0
Rozkład empiryczny jest
rozkładem normalnym