TESTOWANIE HIPOTEZ: ZARYS TEORII X = (X1,...,Xn)
Transkrypt
TESTOWANIE HIPOTEZ: ZARYS TEORII X = (X1,...,Xn)
TESTOWANIE HIPOTEZ: ZARYS TEORII X = (X1, . . . , Xn) - próbka z rozkładu (nieznanego) P ∈ P; X to przestrzeń prób. Zakładamy, że zostały sformułowane dwie wzajemnie wykluczające się hipotezy: H0 (zerowa) i H1 (alternatywna). Definicja. Testem hipotezy H0 przeciwko H1 nazywamy statystykę δ : X 7→ {0, 1}; wartość 1 interpretujemy jako decyzję o odrzuceniu H0, natomiast 0 oznacza, że nie odrzucamy H0. Przypominając pojęcie zbioru krytycznego testu (temat Testowanie hipotez), jest nim zbiór K = {X ∈ X : δ(X) = 1}. Do tej pory mieliśmy do czynienia z testami postaci δ(X) = 1{S(X)>c}(X) lub δ(X) = 1{S(X)<c}(X) lub δ(X) = 1{c1<S(X)<c2}(X), gdzie S(X) to statystyka testowa, a c, c1, c2 to pewne stałe. Skutki działania testu mogą być następujące: stan rzeczy/decyzja δ=0 δ=1 H0 prawdziwa OK błąd I rodzaju H1 prawdziwa błąd II rodzaju OK 1 Pożądane jest, by prawdopodobieństwa popełnienia błędów obu rodzajów były jak najmniejsze. Okazuje się, że tego nie da się zrobić jednocześnie. Wobec tego postępujemy tak, że przede wszystkim kontrolujemy prawdopodobieństwo popełnienia błędu I rodzaju. Właśnie dlatego, przy już sformułowanych hipotezach, oznaczamy je tak, by popełnienie błędu I rodzaju miało gorsze skutki. Wybieramy pewną małą liczbę α (nazywamy ją poziomem istotności testu) - standardowo α = 0,05 - i rozważamy tylko testy na poziomie istotności α, czyli testy, dla których P (δ(X) = 1/H0 jest prawdziwa) 6 α. Wśród testów na poziomie istotności α będziemy starać się wybrać taki, by P (δ(X) = 0/H1 jest prawdziwa) było jak najmniejsze. Dalej skupimy się na sytuacji, gdy hipotezy H0, H1 są parametryczne: H0 : θ ∈ Θ0; H1 : θ ∈ Θ1, Θ0 ∩ Θ1 = ∅. Jeśli hipoteza dokładnie precyzuje rozkład próbki, to nazywamy ją prostą, w przeciwnym przypadku - złożoną. 2 Definicja. Funkcję mδ : Θ0 ∪ Θ1 7→ [0, 1] określoną wzorem mδ (θ) = Pθ (δ(X) = 1) nazywamy mocą testu δ. Dla θ ∈ Θ0 moc testu jest prawdopodobieństwem popełnienia błędu I rodzaju, czyli dla testów na poziomie istotności α jest ona nie większa niż α: supθ∈Θ0 mδ (θ) 6 α. Dla θ ∈ Θ1 wartość 1 − mδ (θ) jest prawdopodobieństwem popełnienia błędu II rodzaju, czyli dla takich θ moc testu chcielibyśmy mieć jak największą. Definicja. Test δ ∗ nazywamy jednostajnie najmocniejszym na poziomie istotności α, jeśli jest to test na poziomie istotności α, oraz dla dowolnego innego testu δ na poziomie istotności α zachodzi mδ∗ (θ) > mδ (θ) ∀θ ∈ Θ1. Przykład. Niech X1, . . . , Xn będzie próbką z rozkładu normalnego N (µ, σ 2), wariancja σ 2 > 0 jest znana. Rozważmy sytuację, gdy testujemy dwie proste hipotezy: H0 : µ = µ0; H1 : µ = µ1, przy czym niech µ0 < µ1. Gęstość rozkładu próbki, odpowiadająca hipotezie Hj , to [ ] n 1 1 ∑ 2 fj (u1, . . . , un) = exp − (u − µ ) . i j 2σ 2 i=1 (2π)n/2σ n 3 Rozważmy logarytm ilorazu wiarogodności ln f1(X1, . . . , Xn)−ln f0(X1, . . . , Xn) = n n ∑ 1 ∑ 1 − 2 (Xi − µ1)2 + 2 (Xi − µ0)2 = 2σ i=1 2σ i=1 ] n [ 2 2 2(µ1 − µ0)X̄ + (µ0 − µ1) . 2σ 2 Okazuje się, że test δ ∗(X) = 1K ∗ (X) jest jednostajnie ∗ najmocniejszym na poziomie istotności α dla K := √ {X ∈ X : X̄ > µ0 + z1−ασ/ n}. Zauważmy, że Pµ0 (K ∗) = α. (Analogicznie przeprowadzamy rozumowania dla przypadku √ µ0 > µ1; tutaj K ∗ := {X ∈ X : X̄ < µ0 − z1−ασ/ n}). Algorytm (Neyman-Pearson). Niech H0 : θ = θ0; H1 : θ = θ1. Rozważamy nierówność ln f1(X) − ln f0(X) > c, przy czym stałą c dobieramy tak, by Pθ0 (K ∗) = α dla K ∗ := {X ∈ X : ln f1(X) − ln f0(X) > c} . Wówczas test δ ∗(X) = 1K ∗ (X) będzie jednostajnie najmocniejszym na poziomie istotności α. 4 Definicja. Test δ nazywamy nieobciążonym przy testowaniu hipotez H0 : θ ∈ Θ0; H1 : θ ∈ Θ1, jeśli mδ (θ1) > mδ (θ0) ∀θ0 ∈ Θ0 ∀θ1 ∈ Θ1 (czyli dla testów na poziomie istotności α moc testu dla θ ∈ Θ1 nigdy nie spada poniżej poziomu istotności). Wracając do powyższego przykładu nietrudno zauważyć, że np. przy testowaniu hipotez H0 : µ = µ0; H1 : µ ̸= µ0 test δ ∗ = 1K ∗ (X) ze zbiorem krytycznym { √ } ∗ K = X ∈ X : |X̄ − µ0| > z1−α/2σ/ n jest testem nieobciążonym na poziomie istotności α, bowiem moc testu wynosi ) ( √ µ0 − µ mδ∗ (µ) = 1−Φ n + z1−α/2 + σ (1) ( ) √ µ0 − µ Φ n − z1−α/2 σ (Φ(·) jest dystrybuantą rozkładu N (0, 1)), skąd mδ∗ (µ0) = α oraz mδ∗ (µ) > α dla µ ̸= µ0. Co więcej, można pokazać, że test ten będzie jednostajnie najmocniejszym wśród testów nieobciążonych na poziomie istotności α. Definicja. Test δ = δn nazywamy zgodnym na poziomie istotności α przy testowaniu hipotez H0 : θ ∈ Θ0; H1 : θ ∈ Θ1, jeśli 5 limn→∞ mδn (θ) 6 α ∀θ ∈ Θ0; limn→∞ mδn (θ) = 1 ∀θ ∈ Θ1. Na przykład test z funkcją mocy (1) jest zgodnym na poziomie istotności α. 6