TESTOWANIE HIPOTEZ: ZARYS TEORII X = (X1,...,Xn)

Transkrypt

TESTOWANIE HIPOTEZ: ZARYS TEORII X = (X1,...,Xn)
TESTOWANIE HIPOTEZ: ZARYS TEORII
X = (X1, . . . , Xn) - próbka z rozkładu (nieznanego)
P ∈ P; X to przestrzeń prób.
Zakładamy, że zostały sformułowane dwie wzajemnie
wykluczające się hipotezy: H0 (zerowa) i H1 (alternatywna).
Definicja. Testem hipotezy H0 przeciwko H1 nazywamy statystykę δ : X 7→ {0, 1}; wartość 1 interpretujemy jako decyzję o odrzuceniu H0, natomiast 0 oznacza, że nie odrzucamy H0.
Przypominając pojęcie zbioru krytycznego testu (temat Testowanie hipotez), jest nim zbiór K = {X ∈
X : δ(X) = 1}. Do tej pory mieliśmy do czynienia
z testami postaci δ(X) = 1{S(X)>c}(X) lub δ(X) =
1{S(X)<c}(X) lub δ(X) = 1{c1<S(X)<c2}(X), gdzie S(X)
to statystyka testowa, a c, c1, c2 to pewne stałe.
Skutki działania testu mogą być następujące:
stan rzeczy/decyzja
δ=0
δ=1
H0 prawdziwa
OK
błąd I rodzaju
H1 prawdziwa
błąd II rodzaju
OK
1
Pożądane jest, by prawdopodobieństwa popełnienia błędów obu rodzajów były jak najmniejsze. Okazuje się,
że tego nie da się zrobić jednocześnie. Wobec tego postępujemy tak, że przede wszystkim kontrolujemy prawdopodobieństwo popełnienia błędu I rodzaju.
Właśnie dlatego, przy już sformułowanych hipotezach,
oznaczamy je tak, by popełnienie błędu I rodzaju miało
gorsze skutki.
Wybieramy pewną małą liczbę α (nazywamy ją poziomem istotności testu) - standardowo α = 0,05 - i
rozważamy tylko testy na poziomie istotności α, czyli
testy, dla których
P (δ(X) = 1/H0 jest prawdziwa) 6 α.
Wśród testów na poziomie istotności α będziemy starać
się wybrać taki, by
P (δ(X) = 0/H1 jest prawdziwa) było jak najmniejsze.
Dalej skupimy się na sytuacji, gdy hipotezy H0, H1 są
parametryczne: H0 : θ ∈ Θ0; H1 : θ ∈ Θ1, Θ0 ∩
Θ1 = ∅.
Jeśli hipoteza dokładnie precyzuje rozkład próbki, to
nazywamy ją prostą, w przeciwnym przypadku - złożoną.
2
Definicja. Funkcję mδ : Θ0 ∪ Θ1 7→ [0, 1] określoną
wzorem mδ (θ) = Pθ (δ(X) = 1) nazywamy mocą testu δ.
Dla θ ∈ Θ0 moc testu jest prawdopodobieństwem popełnienia błędu I rodzaju, czyli dla testów na poziomie
istotności α jest ona nie większa niż α: supθ∈Θ0 mδ (θ) 6 α.
Dla θ ∈ Θ1 wartość 1 − mδ (θ) jest prawdopodobieństwem popełnienia błędu II rodzaju, czyli dla takich θ
moc testu chcielibyśmy mieć jak największą.
Definicja. Test δ ∗ nazywamy jednostajnie najmocniejszym na poziomie istotności α, jeśli jest to test na poziomie istotności α, oraz dla dowolnego innego testu δ
na poziomie istotności α zachodzi
mδ∗ (θ) > mδ (θ) ∀θ ∈ Θ1.
Przykład. Niech X1, . . . , Xn będzie próbką z rozkładu
normalnego N (µ, σ 2), wariancja σ 2 > 0 jest znana.
Rozważmy sytuację, gdy testujemy dwie proste hipotezy: H0 : µ = µ0; H1 : µ = µ1, przy czym niech
µ0 < µ1. Gęstość rozkładu próbki, odpowiadająca hipotezie Hj , to
[
]
n
1
1 ∑
2
fj (u1, . . . , un) =
exp
−
(u
−
µ
)
.
i
j
2σ 2 i=1
(2π)n/2σ n
3
Rozważmy logarytm ilorazu wiarogodności
ln f1(X1, . . . , Xn)−ln f0(X1, . . . , Xn) =
n
n
∑
1 ∑
1
− 2
(Xi − µ1)2 + 2
(Xi − µ0)2 =
2σ i=1
2σ i=1
]
n [
2
2
2(µ1 − µ0)X̄ + (µ0 − µ1) .
2σ 2
Okazuje się, że test δ ∗(X) = 1K ∗ (X) jest jednostajnie
∗
najmocniejszym na poziomie istotności
α
dla
K
:=
√
{X ∈ X : X̄ > µ0 + z1−ασ/ n}. Zauważmy, że
Pµ0 (K ∗) = α.
(Analogicznie przeprowadzamy rozumowania dla przypadku √
µ0 > µ1; tutaj K ∗ := {X ∈ X : X̄ < µ0 −
z1−ασ/ n}).
Algorytm (Neyman-Pearson).
Niech H0 : θ = θ0; H1 : θ = θ1.
Rozważamy nierówność ln f1(X) − ln f0(X) > c, przy
czym stałą c dobieramy tak, by Pθ0 (K ∗) = α dla K ∗ :=
{X ∈ X : ln f1(X) − ln f0(X) > c} . Wówczas test
δ ∗(X) = 1K ∗ (X) będzie jednostajnie najmocniejszym
na poziomie istotności α.
4
Definicja. Test δ nazywamy nieobciążonym przy testowaniu hipotez H0 : θ ∈ Θ0; H1 : θ ∈ Θ1, jeśli
mδ (θ1) > mδ (θ0) ∀θ0 ∈ Θ0 ∀θ1 ∈ Θ1
(czyli dla testów na poziomie istotności α moc testu dla
θ ∈ Θ1 nigdy nie spada poniżej poziomu istotności).
Wracając do powyższego przykładu nietrudno zauważyć, że np. przy testowaniu hipotez H0 : µ = µ0; H1 :
µ ̸= µ0 test δ ∗ = 1K ∗ (X) ze zbiorem krytycznym
{
√ }
∗
K = X ∈ X : |X̄ − µ0| > z1−α/2σ/ n
jest testem nieobciążonym na poziomie istotności α,
bowiem moc testu wynosi
)
(
√ µ0 − µ
mδ∗ (µ) = 1−Φ
n
+ z1−α/2 +
σ
(1)
(
)
√ µ0 − µ
Φ
n
− z1−α/2
σ
(Φ(·) jest dystrybuantą rozkładu N (0, 1)), skąd mδ∗ (µ0)
= α oraz mδ∗ (µ) > α dla µ ̸= µ0. Co więcej, można pokazać, że test ten będzie jednostajnie najmocniejszym
wśród testów nieobciążonych na poziomie istotności α.
Definicja. Test δ = δn nazywamy zgodnym na poziomie istotności α przy testowaniu hipotez H0 : θ ∈
Θ0; H1 : θ ∈ Θ1, jeśli
5
limn→∞ mδn (θ) 6 α ∀θ ∈ Θ0;
limn→∞ mδn (θ) = 1 ∀θ ∈ Θ1.
Na przykład test z funkcją mocy (1) jest zgodnym na
poziomie istotności α.
6