Testowanie hipotez

Transkrypt

Testowanie hipotez

Testowanie hipotez
Niech X = (X1 , . . . , Xn ) będzie próbą losową na przestrzeni X , zaś P = {Pθ , θ ∈ Θ}
rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X .
Definicja 1. Hipotezą zerową Θ0 ⊂ Θ nazywamy hipotezę, której prawdziwość chcemy
zweryfikować na podstawie obserwacji. Hipoteza alternatywna jest postaci Θ1 = Θ\Θ0 .
Hipoteza prosta zawiera jeden element, np. H0 : θ = 2, hipoteza złożona zawiera więcej
niż jeden element, np. H0 : θ > 4.
Definicja 2. Obszar krytyczny testu jest to obszar odrzucenia hipotezy zerowej. Najczęściej ma on postać K = {X : T (X) > c}, gdzie c jest poziomem krytycznym testu,
wyznaczonym przez kwantyl rozkładu, z jakiego pochodzi statystyka testowa przy założeniu prawdziwości hipotezy zerowej (zależy on od przyjętego poziomu istotności testu).
Definicja 3. Test można identyfikować z jego obszarem krytycznym K lub funkcją krytyczną ϕ : X −→ {0, 1} postaci
1, gdy X ∈ K,
ϕ(X) = 1K (X) =
0, gdy X ∈
/ K,
Definicja 4. Prawdopodobieństwo błędu pierwszego rodzaju to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona prawdziwa:
αI (θ) = Pθ (X ∈ K),
θ ∈ Θ0 .
Definicja 5. Prawdopodobieństwo błędu drugiego rodzaju to prawdopodobieństwo przyjęcia hipotezy zerowej, gdy jest ona fałszywa:
αII (θ) = Pθ (X ∈ K c ) = 1 − Pθ (X ∈ K),
θ ∈ Θ1 .
Definicja 6. Funkcją mocy testu nazywamy β : Θ −→ [0, 1] postaci
β(θ) = Pθ (X ∈ K) = Eθ ϕ(X).
Z reguły bada się moc testu na alternatywie, czyli θ = θ1 .
Definicja 7. Test o funkcji krytycznej ϕ (o obszarze krytycznym K) jest testem na
poziomie istotności α ∈ (0, 1), jeżeli
∀θ∈Θ0
Eθ ϕ(X) = Pθ (X ∈ K) = β(θ) ≤ α.
Definicja 8. Rozmiarem testu o funkcji krytycznej ϕ (obszarze krytycznym K) nazywamy
wielkość
β = sup Eθ ϕ(X) = sup β(θ).
θ∈Θ0
∗
θ∈Θ0
∗
Definicja 9. Test ϕ (K ) na poziomie istotności α jest testem jednostajnie najmocniejszym (JNM) w klasie testów Φ (K) na poziomie α, jeżeli
∀ϕ∈Φ
β ∗ (θ) ≥ β(θ).
∀θ∈Θ1
1
Twierdzenie (podstawowy lemat Neymana-Pearsona) Niech P0 i P1 będą rozkładami prawdopodobieństwa i niech f0 i f1 będą gęstościami tych rozkładów (względem
pewnej ustalonej miary µ). Niech α ∈ (0, 1) będzie ustaloną liczbą.
(a) (istnienie testu) Istnieją stałe c i

 1,
γ,
ϕ(x) =

0,
γ > 0 takie, że
gdy f1 (x) > cf0 (x),
gdy f1 (x) = cf0 (x),
gdy f1 (x) < tf0 (x),
jest testem hipotezy H0 : P0 przeciwko H1 : P1 na poziomie istotności α, tzn.
E0 ϕ(X) = α.
(1)
(b) (dostateczność) Jeżeli test ϕ spełnia warunek (1) i dla pewnego c warunek
1, gdy f1 (x) > cf0 (x),
ϕ(x) =
(2)
0, gdy f1 (x) < tf0 (x),
to ϕ jest testem najmocniejszym dla testowania H0 przeciwko H1 na poziomie istotności α.
(c) (konieczność) Jeżeli φ jest testem najmocniejszym na poziomie istotności α dla
testowania H0 przeciwko H1 , to dla pewnego c spełnia on warunek (2).
Podsumowując, test statystyczny składa się z:
1. Hipotezy zerowej H0 i hipotezy alternatywnej H1 ,
2. Statystyki testowej T (X),
3. Obszaru krytycznego K.
4. Poziomu istotności α,
Decyzja: jeżeli T (X) ∈ K, to odrzucamy hipotezę H0 , jeżeli T (X) ∈
/ K, to nie mamy
podstaw do odrzucenia hipotezy zerowej.
Definicja 10. P-wartość (p-value) to graniczny poziom istotności - najmniejszy, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej.
Jest to więc taki poziom istotności, przy którym zmienia się decyzja testu (zaczynając
od lewej - od małego poziomu α, kiedy to nie mamy podstaw do odrzucenia H0 , po
przekroczeniu p-wartości zaczynamy odrzucać H0 ).
P-wartość pozwala bezpośrednio ocenić wiarygodność hipotezy. Im p-wartość jest
większa, tym bardziej hipoteza H0 jest prawdziwa. Mała p-wartość świadczy przeciwko
hipotezie zerowej.
Znajomość p-wartości pozwala przeprowadzić testowanie dla dowolnego poziomu istotności:
-odrzucamy hipotezę zerową H0 , gdy
p-wartość ≤ α,
-nie mamy podstaw do odrzucenia hipotezy zerowej H0 , gdy
p-wartość > α.
2
Test Chi-kwadrat zgodności
nr klasy
liczebności empiryczne
1
n1
2
n2
3
n3
4
n4
5
n5
...
...
• Hipotezy
H0 : X ∼ F,
H1 : X F,
F jest dowolnym rozkładem prawdopodobieństwa.
• Statystyka testowa
χ2 =
k
X
(ni − nt )2
i
i=1
nti
,
gdzie
k - liczba klas,
ni - liczebności empiryczne (zaobserwowane),
nti = n · pti - liczebności teoretyczne,
pti = PF (Xprzyjeła wartosc z klasy i) - prawdopodobieństwa teoretyczne.
Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat
z (k − r − 1) stopniami swobody (r jest liczbą nieznanych parametrów hipotetycznego rozkładu F ).
• Obszar krytyczny
(1 − α), +∞),
K = (Fχ−1
2
k−1
gdzie Fχ−1
(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1)
2
k−1
stopniami swobody.
Test Chi-kwadrat niezależności
Tablica kontyngencji:
Cecha 1
2 ...
n12 . . .
n22 . . .
... ...
nr2 . . .
Cecha 2 1
1
n11
2
n21
...
...
r
nr1
k
n1k
n23
...
nrk
• Hipotezy
H0 : X, Y są niezależne,
3
vs H1 : X, Y są zależne
k X
r
X
(nij − ntij )2
χ =
,
ntij
j=1 i=1
2
gdzie
k - liczba kolumn w tablicy kontyngencji,
r - liczba wierszy w tablicy kontyngencji,
nij - liczebności empiryczne (zaobserwowane),
ntij - liczebności teoretyczne, dane wzorem
k
P
ntij
gdzie n =
k P
r
P
=
nij ·
j=1
r
P
nij
i=1
n
,
nij .
j=1 i=1
Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat
z (k − 1)(r − 1) stopniami swobody.
K = (Fχ−1
2
(1 − α), +∞),
(k−1)(r−1)
gdzie Fχ−1
(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1)
2
k−1
stopniami swobody.
Test Kołmogorowa
Test Kołmogorowa testuje zgodność z rozkładem F dla jednej próby (Test Kołmogorowa
- Smirnowa dla dwóch prób testuje zgodność rozkładów w obu próbach).
• Hipotezy
H0 : X ∼ F,
H1 : X F,
gdzie F jest ciągłym rozkładem prawdopodobieństwa.
1. n ≤ 100
i
i
−
1
, − F (Xi:n )
Dn = sup |F (x) − Fn (x)| = max max F (Xi:n ) −
,
1≤i≤n
n n
x∈R
4
K = (FD−1n (1 − α), 1],
gdzie FD−1n (1−α) jest kwantylem rzędu 1−α rozkładu statystyki Kołmogorowa (Dn ).
2. n > 100
√
nDn ,
K = (λ1−α , +∞),
gdzie λ√1−α jest kwantylem rzędu 1 − α granicznego rozkładu statystyki Kołmogorowa ( nDn ).
Test Shapiro-Wilka
Jest to test normalności rozkładu.
• Hipotezy
H0 : X ∼ N,
H1 : X N
W =
n
P
2
ai xi:n
i=1
n
P
,
(xi −
x)2
i=1
gdzie stałe ai są dane wzorem
(a1 , . . . , an ) = √
m> V −1
m> V −1 V −1 m
,
gdzie m = (m1 , . . . , mn )> , są wartościami oczekiwanymi statystyk pozycyjnych z
pochodzących z próby iid z rozkładu standardowego normalnego a V jest ich macierzą kowariancji (stablicowane).
K = (Wn (1 − α), +∞),
gdzie Wn (1 − α) jest kwantylem rzędu 1 − α rozkładu statystyki Shapiro-Wilka W .
5
Test t-studenta
Jest to test parametryczny dla jednej lub dwóch prób, polegający na testowaniu równości
wartości oczekiwanych (test istotności). Zakładamy, że pomiary podlegają rozkładowi
normalnemu, oraz że wariancje w próbach nie różnią się od siebie istotnie.
1. Test t dla jednej próby
• Hipotezy
H0 : µ = µ0 ,
H1 : µ > µ0 ,
µ < µ0 ,
µ 6= µ0
(3)
(4)
(5)
T =
gdzie s2X =
1
n−1
n
P
√ X̄ − µ0
n
,
sX
(Xi − X̄)2 to próbkowe odchylenie standardowe. Statystyka te-
i=1
stowa T ma rozkład t-studenta o (n − 1) stopniach swobody.
Zależy od postaci hipotezy alternatywnej w następujący sposób:
K1 = (Ft−1
(1 − α), +∞),
n−1
K2 = (−∞, −Ft−1
(1 − α)),
n−1
−1
(1 − α2 ), +∞),
K3 = (−∞, −Ftn−1 (1 − α2 )) ∪ (Ft−1
n−1
gdzie Ft−1
(a) to kwantyl rzędu a rozkładu t-studenta z (n − 1) stopniami swobody.
n−1
Jeżeli wariancja rozkładu jest znana, wówczas sX zastępujemy przez odchylenie
standardowe rozkładu, zaś Ft−1
(a) zastępujemy przez Φ−1 (a).
n−1
2. Test t dla dwóch prób niezależnych
• Hipotezy
H0 : µ1 = µ2 ,
H1 : µ1 6= µ2
T =
X̄1 − X̄2
,
SX̄1 −X̄2
gdzie
s
SX̄1 −X̄2 =
(n1 − 1)s21 + (n2 − 1)s22
n1 + n2 − 2
1
1
+
,
n1 n2
s1 , s2 to nieznane odchylenia standardowe z próbek, zaś n1 , n2 to liczebności próbek.
Statystyka testowa T ma rozkład t-studenta o (n1 + n2 − 2) stopniach swobody.
6
(1 −
K = (−∞, −Ft−1
n1 +n2 −2
α
α
(1 − ), +∞)
)) ∪ (Ft−1
n1 +n2 −2
2
2
3. Test dla dwóch prób zależnych
• Hipotezy
H0 : µ1 = µ2 ,
H1 : µ1 6= µ2
T =
d¯
,
Sd¯
gdzie
n
1X
d¯ =
di ,
n i=1
di = x1i − x2i , i = 1, . . . , n,
v
u
n
u 1 X
t
¯ 2,
Sd¯ =
(di − d)
n − 1 i=1
zaś x1i , x2i oznaczają wartości cechy X dla i-tego obiektu w pierwszym i drugim
badaniu. Statystyka testowa T ma rozkład t-studenta o (n − 1) stopniach swobody.
K = (−∞, −Ft−1
(1 −
n−1
α
α
)) ∪ (Ft−1
(1 − ), +∞)
n−1
2
2
UWAGA: Gdy liczebność próby jest duża (n > 30, n1 + n2 > 30), to kwantyl rozkładu
t-studenta zastępujemy przez kwantyl rozkładu standardowego normalnego (Ft−1
' Φ).
n
7

Testowanie hipotez

Transkrypt

Podobne dokumenty

Page 1 ĆWICZENIA nr 9 Cel zajęć: Przedstawienie wybranych

ZASADY TESTOWANIA HIPOTEZ STATYSTYCZNYCH. TESTY

Weryfikacja hipotez statystycznych - Sigma Kwadrat

tezy: H0 (zerowa) i H1 (alternatywna)

STATYSTYKA NIELEGALNA ADOPCJA (ART.211A)

µ 2 1 1 nn nnnn S n S n XXT + −+

166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu

Weryfikacja hipotez statystycznych

Błędy weryfikacyjne, moc testów, testy jednostajnie najmocniejsze

Spis treści Weryfikacja hipotez statystycznych

9. TESTY ZGODNOŚCI 9.1 Róne sytuacje praktyczne

Weryfikacja hipotez statystycznych

Testowanie hipotez dla proporcji

Test t-Studenta dla jednej średniej

Prawdopodobienstwo i statystyka

Metody probabilistyczne i statystyka Hipoteza statystyczna

Metodologia i zakres prac naukowych

kupić samolot

Pobierz artykuł

Falsyfikacjonizm a test hipotezy zerowej