materiały na zajęcia 9
Transkrypt
materiały na zajęcia 9
7. Testowanie hipotez statystycznych 7.1 Populacja ma rozkład ciągły opisany funkcją gęstości f ( x) = (1 + θ ) xθ dla x ∈ [0,1]. Testowana jest hipoteza, że θ = 1 wobec hipotezy alternatywnej, że θ = 2. Wnioskujemy na podstawie jednoelementowej próbki: jeśli wynik jest większy niż 0,8, to hipotezę zerową odrzucamy. a) ile wynoszą prawdopodobieństwo popełnienia błędów pierwszego i drugiego rodzaju? b) ile wynosi moc testu? 7.2 Wyhodowano nową odmianę pewnej rośliny. Hipotezę, ze kiełkuje 60% sadzonek, wobec hipotezy alternatywnej, że kiełkuje więcej niż 60%, weryfikujemy na podstawie próbki 6 sadzonek. Hipotezę zerową odrzucamy, gdy wykiełkuje 5 lub więcej sadzonek. Czy rozmiar tego testu jest mniejszy niż 0,05? Jaki jest rozmiar innego testu, który odrzuca hipotezę zerową, jeśli wszystkie sadzonki wykiełkują? 7.3 W celu zweryfikowania hipotezy, że nieznane prawdopodobieństwo sukcesu w pojedynczej próbie jest mniejsze od 0,5 wykonuje się 20 niezależnych prób i hipotezę odrzuca się, gdy liczba sukcesów jest większa lub równa 12. Wyznacz funkcję prawdopodobieństwa błędu pierwszego rodzaju i funkcję prawdopodobieństwa błędu drugiego rodzaju. 7.4 Niech X 1 ,..., X n będzie próbą losową z rozkładu N ( µ ,32 ). Weryfikujemy hipotezę, że nieznany parametr µ wynosi 0 wobec alternatywy, że µ równą (-1), za pomocą testu z obszarem krytycznym {( x1 ,...xn ) : 1 n ∑ n x < −5, 25}. Oblicz rozmiar testu. Jak liczna i =1 i musiałaby być wylosowana próbka, aby moc testu wynosiła 0,85? 7.5 Niech X 1 ,..., X 36 będzie próbą losową z rozkładu normalnego N ( µ ,1). Przeprowadzamy test hipotezy zerowej H 0 : µ = 0 przeciw alternatywie H1 : µ = 0.2. Test jest następujący: • jeżeli X ≤ 0.01 to nie odrzucamy H 0 , • jeżeli X > 0.01 to odrzucamy H 0 . Wyznaczyć prawdopodobieństwo popełnienia błędu I rodzaju oraz obliczyć moc testu. 7.6 Populacja generalna ma rozkład wykładniczy z parametrem β . Z tej populacji wylosowano 10 – elementową próbkę: 2; 0.9; 1.7; 3.5; 1.9; 2.1; 3.7; 2.5; 3.4; 2.8. Przetestować za pomocą testu najmocniejszego przy poziomie istotności α = 0, 05 hipotezę zerową, że β = 1/ 2, przeciw hipotezie alternatywnej, że β = 1/ 3. 7.7 Cecha ma w populacji rozkład normalny z nieznanym µ i odchyleniem standardowym równym 4,5. Z tej populacji wylosowano n-elementową próbkę. Do weryfikacji hipotezy zerowej, że µ = 0, wobec hipotezy alternatywnej, że µ > 0, zastosowano test jednostajnie najmocniejszy na poziomie istotności α = 0, 05. a) podaj funkcję mocy testu; b) ile obserwacji należy wylosować, aby moc tego testu wynosiła 0,8 dla hipotezy alternatywnej, że µ = 1? 7.8 Dysponujemy 1 obserwacją i weryfikujemy hipotezę H 0 : obserwacja pochodzi z rozkładu o gęstości f ( x) = e− x przy alternatywie H1 : obserwacja pochodzi z rozkładu o gęstości f ( x) = xe− x . a) Zbudować test najmocniejszy na poziomie istotności 0,05. b) Oblicz moc testu. 1 7.9 Niech X będzie zmienną losową z rozkładu o gęstości f ( x) = θ xθ −1 dla x ∈ [0,1]. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę H 0 : θ = 2 przy alternatywie H1 : θ = 6 na poziomie istotności 0,1. a) Wyznacz obszar krytyczny testu najmocniejszego b) Oblicz moc testu. 7.10 Niech X 1 ,..., X 9 będzie próbą losową z rozkładu normalnego N (1, σ 2 ). Rozważamy hipotezę H 0 : σ = 2 przy alternatywie H1 : σ = 1. Skonstruować test najmocniejszy na poziomie istotności α = 0, 05. a) Wyznacz obszar krytyczny testu najmocniejszego b) Obliczyć moc testu. Praca domowa 7.1 Populacja generalna ma rozkład określony funkcją gęstości: f ( x) = λ e − λ x dla x > 0. Weryfikuje się hipotezę zerową λ = 2 wobec hipotezy alternatywnej λ = 1/ 4 przy pomocy pojedynczej obserwacji. Jeśli wynik jest większy niż pewna stała c, to odrzucamy hipotezę zerową. Wyznacz stałą c tak, aby α = 0, 01 i oblicz moc testu. 2 m −1 7.2 Populacja generalna ma rozkład ciągły określony funkcją gęstości postaci: f ( x) = 1−mm x 1−m dla x ∈ [0,1]. Weryfikujemy hipotezę H 0 : m = 2 3 wobec hipotezy alternatywnej H1 : m = 3 4 za pomocą następującego testu: losujemy jedną obserwację i odrzucamy H 0 jeśli otrzyma się wynik mniejszy niż ¾, a przyjmujemy H 0 w przeciwnym przypadku. Na który z błędów I-ego czy II-ego rodzaju jesteśmy bardziej narażeni przy stosowaniu tego testu. 7.3 Populacja generalna ma rozkład ciągły określony funkcją gęstości postaci: f ( x) = 2 β2 x dla x ∈ [0, β ]. W celu zweryfikowania H 0 : β = 2 wobec hipotezy alternatywnej H1 : β = 1/ 2 dokonuje się pojedynczej obserwacji. Jeśli wynik obserwacji jest mniejszy niż pewna stała c, to hipoteza zerowa zostaje odrzucona. Wyznacz stałą c tak, aby α = 0, 04 i oblicz moc testu. 7.4 Niech X 1 ,..., X 25 będzie próbą losową z rozkładu normalnego N ( µ , 22 ). Wiemy, że średnia z próby wynosi 3,6. Zweryfikować testem najmocniejszym hipotezę H 0 : µ = 3 przy alternatywie H1 : µ = 4 na poziomie istotności 0,01. f ( x) = θ dla x > 1. xθ +1 Weryfikujemy hipotezę H 0 : θ = 3 wobec alternatywy H 0 : θ = 5 na poziomie istotności 0,05. Skonstruować test najmocniejszy (podać obszar krytyczny) oraz obliczyć moc testu. 7.5 Niech X będzie zmienną losową z rozkładu o gęstości 7.6 Niech X będzie zmienną losową z rozkładu o gęstości fθ ( x) = θ xθ −1 dla x ∈ [0,1], gdzie θ jest nieznanym parametrem. Niech c będzie ustaloną dodatnią liczbą. Test jest zbudowany w następujący sposób: jeśli X ≥ c, to należy przyjąć H1 : θ = 4, a gdy X < c, należy przyjąć H 0 : θ = 2. Oblicz: a) prawdopodobieństwo popełnienia błędów pierwszego i drugiego rodzaju; b) moc testu; 2 c) wartość c, przy której suma prawdopodobieństw błędów pierwszego i drugiego rodzaju jest najmniejsza. 7.7 Niech X 1 , X 2 , X 3 , X 4 będzie próbą losową z rozkładu N ( µ , σ 2 ). Testujemy hipotezę H 0 : σ 2 = 2 przeciwko H1 : σ 2 > 2. Odrzucamy H 0 jeśli wartość statystyki ∑ 4 i =1 ( X i − X )2 przekroczy c. Dla jakiej wartości c prawdopodobieństwo błędu I rodzaju wynosi 0,1. Podać moc testu dla hipotezy alternatywnej σ 2 = 10,7. 7.8* Niech X 1 ,..., X 100 będzie próbą z rozkładu N ( µ ,1) z nieznanym parametrem µ. Rozważamy jednostajnie najmocniejszy test hipotezy H 0 : µ = 0 przeciw alternatywie H1 : µ > 0 na poziomie istotności 0,05. Znaleźć taką wartość µ , że funkcja mocy testu przyjmuje wartość 0,95. 7.9* Przeprowadzamy n = 10 niezależnych doświadczeń z nieznanym, jednakowym prawdopodobieństwem sukcesu θ . Niech X oznacza liczbę sukcesów. Podać test najmocniejszy dla weryfikacji hipotezy H 0 : θ = 12 wobec alternatywy H1 : θ = 34 na poziomie istotności 0,05. 7.10* Niech X 1 , X 2 ,..., X n będzie próbą losową z rozkładu jednostajnego na przedziale (0, θ ). Do weryfikacji hipotezy H 0 : θ = θ 0 przy alternatywie H1 : θ > θ 0 zaproponowano test: gdy X n:n < c nie mamy podstaw do odrzucenia hipotezy H 0 , gdy X n:n ≥ c hipotezę H 0 odrzucamy. a) Wyznaczyć stałą c, aby otrzymać test na poziomie istotności 0,1. b) Wyznaczyć funkcję mocy testu dla hipotezy alternatywnej. c) Wyznaczyć liczebność próby, aby prawdopodobieństwo popełnienia błędu II rodzaju dla alternatywy θ = 1, 2θ0 było mniejsze niż 0,09. Teoria dotycząca testowania hipotez Niech będzie dana przestrzeń statystyczna, czyli przestrzeń próbkowa wyposażona w rodzinę rozkładów prawdopodobieństwa {Pθ ,θ ∈ Θ}. Ponadto Θ = Θ0 ∪ Θ1 , Θ0 ∩ Θ1 = ∅. Mówiąc o zagadnieniu testowania będziemy rozważali hipotezę zerową H 0 : θ ∈ Θ0 i hipotezę alternatywną H1 : θ ∈ Θ1. Testem hipotezy H 0 przeciw alternatywie H1 nazywamy statystykę δ : Ω → {0,1}, gdzie „1” oznacza decyzję o odrzuceniu H 0 , natomiast „0” oznacza, że nie odrzucamy H 0 . Innymi słowy, testem statystycznym nazywamy metodę postępowania, która możliwym realizacjom próby losowej X 1 ,..., X n określonej na przestrzeni statystycznej przypisuje decyzję odrzucenia (albo przyjęcia) weryfikowanej hipotezy. W celu zbudowania testu do weryfikacji postawionej hipotezy H 0 należy skonstruować dwa dopełniające się zbiory W i W ′ (W ∩ W ′ = ∅, W ∩ W ′ = ℜ) oraz pewną statystykę T ( X 1 ,..., X n ), zwaną statystyką testową, przy czym: jeżeli T ( X 1 ,..., X n ) ∈ W , to H 0 odrzucamy jeżeli T ( X 1 ,..., X n ) ∈ W ′, to H 0 przyjmujemy. Zbiór W nazywamy zbiorem krytycznym, a zbiór W ′ zbiorem przyjęć. Przeważnie test ma postać δ ( X 1 ,..., X n ) = I (T ( X 1 ,..., X n ) > c), gdzie c jest liczbą zwaną poziomem krytycznym. W wyniku testowania hipotezy H 0 możemy popełnić jeden z dwu następujących błędów: 1) odrzucimy weryfikowaną hipotezę H 0 , gdy jest ona prawdziwa – tzw. błąd pierwszego rodzaju; 3 2) przyjmiemy weryfikowaną hipotezę H 0 , gdy jest ona fałszywa – tzw. błąd drugiego rodzaju. Stan rzeczy Decyzja δ =0 δ =1 Błąd I rodzaju H 0 prawdziwa O.K. = P(δ = 1| H 0 ) Błąd II rodzaju = H1 prawdziwa O.K. P(δ = 0 | H1 ) Niech 1 − β (θ ) = Pθ (δ ( X 1 ,..., X n ) = 1) oznacza prawdopodobieństwo odrzucenia H 0 . Funkcję 1 − β (θ ) nazywamy funkcją mocy testu δ ( X 1 ,..., X n ). Interpretacja tej funkcji jest odmienna dla θ ∈ Θ0 i θ ∈ Θ1 : dla θ ∈ Θ0 1 − β (θ ) = Pθ (δ ( X 1 ,..., X n ) = 1) = Pθ (δ ( X 1 ,..., X n ) = 1| H 0 ) - prawdopodobieństwo popełnienie błędu I rodzaju; dla θ ∈ Θ1 1 − β (θ ) = Pθ (δ ( X 1 ,..., X n ) = 1) = Pθ (δ ( X 1 ,..., X n ) = 1| H1 ) = = 1 − Pθ (δ ( X 1 ,..., X n ) = 0 | H1 ) - 1 minus prawdopodobieństwo popełnienie błędu II rodzaju; Zgodnie z oznaczeniami przyjętymi powyżej wyrażenie P(δ = 1| H1 ) = 1 − P(δ = 0 | H1 ) nazywamy funkcją mocy testu dla hipotezy alternatywnej (lub w skócie mocą testu). Mówimy, że δ jest testem na poziomie istotności α , jeśli sup P(δ = 1| H 0 ) ≤ α . θ ∈Θ0 Idea testowania hipotez jest następującą: H 0 uważamy za „prawdziwe”, dopóki nie pojawią się przesłanki (w tym wypadku dane statystyczne), które będą z nią sprzeczne. Nie jesteśmy skłonni do rezygniacji z H 0 dopóki nie pojawią się ku temu poważne powody. Więc będziemy się przede wszystkim starali kontrolować prawdopodobieństwo popełnia błędu I rodzaju. Chcielibyśmy umieć konstruować testy, dla których prawdopodobieństwo błędu pierwszego rodzaju nie przekracza zadanej z góry, małej liczby. Następnie z klasy testów spełniających powyższy warunek chcielibyśmy wybrać ten, dla którego prawdopodobieństwo popełnienia błędu II rodzaju jest najniższe. Opis formalnego sposobu postępowania znajduje się poniżej. Niech θ0 i θ1 będą ustalonymi punktami przestrzeni parametrów Θ. Rozważmy dwie hipotezy proste: H 0 : θ = θ 0 i H1 : θ = θ1. Niech P0 i P1 oznaczają rozkłady prawdopodobieństwa na przestrzeni próbkowej, odpowiadające wartościom parametrów θ0 i θ1. Załóżmy, że te rozkłady mają gęstości f0 i f1. Statystyk jest zainteresowany w jednoczesnej minimalizacji prawdopodobieństw obu błędów. Zadanie tego typu na ogół nie ma jednak rozwiązania, gdyż zmniejszenie prawdopodobieństwa błędu jednego rodzaju powoduje wzrost prawdopodobieństwa błędu drugiego rodzaju. Dlatego wybieramy tzw. poziom istotności α i rozwiązujemy zadanie, które ma postać: P(δ = 0 | H1 ) = min! P(δ = 1| H1 ) = max! (*) ⇔ P(δ = 1| H 0 ) ≤ α P (δ = 1| H 0 ) ≤ α Test, który przy ustalonym prawdopodobieństwie błędu I rodzaju minimalizuje prawdopodobieństwo błędu II rodzaju (maksymalizuje moc testu), nazywamy testem najmocniejszym. Lemat Neymana – Pearsona H 0 : θ = θ 0 ; H1 : θ = θ1 ; T – ustalona statystyka. Załóżmy, że rozkład T jest ciągły oraz: f 0 gęstość rozkładu T, gdy θ = θ 0 , f1 - gęstość rozkładu T, gdy θ = θ1. Warunek (*) jest równoważny: 4 f1 (t )dt = max! W∫ ∫ f 0 (t )dt ≤ α W Wówczas, w celu skonstruowania testu najmocniejszego obszar krytyczny W należy dobrać w następujący sposób: W = {t ∈ Ω : ff10 ((tt)) > c}, gdzie c jest dobrane w taki sposób, że ∫ f (t )dt = α . 0 W Lemat ten uogólnia się na przypadek na przypadek „dyskretnych funkcji prawdopodobieństwa” (tzn. gdy statystyka testowa T ma rozkład skokowy). Wówczas całki należy zastąpić sumami. Test o którym jest mowa w lemacie Neymana-Pearsona nazywamy testem ilorazu wiarogodności. Definicja (Test jednostajnie najmocniejszy) Test δ * jest testem jednostajnie najmocniejszym na poziomie istotności α , jeśli 1) δ * jest testem na poziomie istotności α ; 2) dla każdego testu δ na poziomie istotności α , mamy: Pθ (δ * = 1) ≥ Pθ (δ = 1) dla każdego θ ∈ Θ1. Przykład Niech X 1 , X 2 ,..., X n będzie próbą losową z rozkładu N ( µ , σ 2 ), zakładamy, że σ 2 jest znane. Skonstruujemy test najmocniejszy dla hipotezy H 0 : µ = µ0 wobec H1 : µ = µ1 , gdzie µ0 < µ1. ) exp(− 2σ1 2 ∑ i =1 ( xi − µ1 ) 2 ) f1 ( x1 ,..., xn ) = ( n 1 2πσ f 0 ( x1 ,..., xn ) = ( n 1 2πσ n ) exp(− 2σ1 2 ∑ i =1 ( xi − µ0 ) 2 ) n Iloraz wiarogodności (iloraz łącznych gęstości): f1 ( x1 ,..., xn ) n n = exp(− 2σ1 2 ∑ i =1 ( X i − µ1 ) 2 + 2σ1 2 ∑ i =1 ( X i − µ0 )2 )) > c ⇔ f 0 ( x1 ,..., xn ) −∑ i =1 ( X i − µ1 ) 2 + ∑ i =1 ( X i − µ0 )2 > 2σ 2 ln c = c1 ⇔ n n 2∑ i =1 X i (µ1 − µ0 ) + n( µ02 − µ12 ) > c1 ⇔ n ∑ ∑ n i =1 n i =1 X i (µ1 − µ0 ) > (c1 − n( µ02 − µ12 )) / 2 = c2 ⇔ X i > c2 /( µ1 − µ0 ) = c3 ⇔ ∑ X= n i =1 Xi > c3 / n = c4 n Czyli będziemy odrzucań H 0 , jeśli średnia z próby przewyższy stałą c4 . Pozostaje problem dobrania stłej c4 . Załóżmy, że chcemy skonstruować test najmocniejszy na poziomie istotności α , czyli: P(δ = 1| H 0 ) = α . Przy załóżeniu prawdziwości hipotezy zerowej 2 statystyka testowa (średnia z próby) ma rozkład N ( µ0 , σn ), czyli: α = P(δ = 1| H 0 ) = P( X > c4 | µ = µ0 ) = P( σX /− µn > cσ /− µn | µ = µ0 ) = 1 − F ( cσ /− µn ) 0 4 0 4 0 N (0,1) gdzie F jest dystrubuantą rozkładu normalnego standardowego. Wynika stąd, że: 5 α = 1 − F ( cσ /− µn ) ⇔ F ( σc /− µn ) = 1 − α ⇔ 4 0 4 0 c4 − µ0 σ/ n = F −1 (1 − α ) ⇔ c4 − µ0 σ/ n jest kwantylem rzędu 1 − α dla rozkładu normalnego standardowego. Podsumowanie: testem najmocniejszym na poziomie istotności α jest następujący test: odrzucamy H 0 jeśli X − µ0 σ/ n > c, gdzie c jest kwantylem rzędu 1 − α dla rozkładu normalnego standardowego. 6