materiały na zajęcia 9

Transkrypt

materiały na zajęcia 9
7. Testowanie hipotez statystycznych
7.1 Populacja ma rozkład ciągły opisany funkcją gęstości f ( x) = (1 + θ ) xθ dla x ∈ [0,1].
Testowana jest hipoteza, że θ = 1 wobec hipotezy alternatywnej, że θ = 2. Wnioskujemy na
podstawie jednoelementowej próbki: jeśli wynik jest większy niż 0,8, to hipotezę zerową
odrzucamy.
a) ile wynoszą prawdopodobieństwo popełnienia błędów pierwszego i drugiego rodzaju?
b) ile wynosi moc testu?
7.2 Wyhodowano nową odmianę pewnej rośliny. Hipotezę, ze kiełkuje 60% sadzonek, wobec
hipotezy alternatywnej, że kiełkuje więcej niż 60%, weryfikujemy na podstawie próbki 6
sadzonek. Hipotezę zerową odrzucamy, gdy wykiełkuje 5 lub więcej sadzonek. Czy rozmiar
tego testu jest mniejszy niż 0,05? Jaki jest rozmiar innego testu, który odrzuca hipotezę
zerową, jeśli wszystkie sadzonki wykiełkują?
7.3 W celu zweryfikowania hipotezy, że nieznane prawdopodobieństwo sukcesu w
pojedynczej próbie jest mniejsze od 0,5 wykonuje się 20 niezależnych prób i hipotezę odrzuca
się, gdy liczba sukcesów jest większa lub równa 12. Wyznacz funkcję prawdopodobieństwa
błędu pierwszego rodzaju i funkcję prawdopodobieństwa błędu drugiego rodzaju.
7.4 Niech X 1 ,..., X n będzie próbą losową z rozkładu N ( µ ,32 ). Weryfikujemy hipotezę, że
nieznany parametr µ wynosi 0 wobec alternatywy, że µ równą (-1), za pomocą testu z
obszarem krytycznym {( x1 ,...xn ) :
1
n
∑
n
x < −5, 25}. Oblicz rozmiar testu. Jak liczna
i =1 i
musiałaby być wylosowana próbka, aby moc testu wynosiła 0,85?
7.5 Niech X 1 ,..., X 36 będzie próbą losową z rozkładu normalnego N ( µ ,1). Przeprowadzamy
test hipotezy zerowej H 0 : µ = 0 przeciw alternatywie H1 : µ = 0.2. Test jest następujący:
•
jeżeli X ≤ 0.01 to nie odrzucamy H 0 ,
• jeżeli X > 0.01 to odrzucamy H 0 .
Wyznaczyć prawdopodobieństwo popełnienia błędu I rodzaju oraz obliczyć moc testu.
7.6 Populacja generalna ma rozkład wykładniczy z parametrem β . Z tej populacji
wylosowano 10 – elementową próbkę: 2; 0.9; 1.7; 3.5; 1.9; 2.1; 3.7; 2.5; 3.4; 2.8.
Przetestować za pomocą testu najmocniejszego przy poziomie istotności α = 0, 05 hipotezę
zerową, że β = 1/ 2, przeciw hipotezie alternatywnej, że β = 1/ 3.
7.7 Cecha ma w populacji rozkład normalny z nieznanym µ i odchyleniem standardowym
równym 4,5. Z tej populacji wylosowano n-elementową próbkę. Do weryfikacji hipotezy
zerowej, że µ = 0, wobec hipotezy alternatywnej, że µ > 0, zastosowano test jednostajnie
najmocniejszy na poziomie istotności α = 0, 05.
a) podaj funkcję mocy testu;
b) ile obserwacji należy wylosować, aby moc tego testu wynosiła 0,8 dla hipotezy
alternatywnej, że µ = 1?
7.8 Dysponujemy 1 obserwacją i weryfikujemy hipotezę H 0 : obserwacja pochodzi z
rozkładu o gęstości f ( x) = e− x przy alternatywie H1 : obserwacja pochodzi z rozkładu o
gęstości f ( x) = xe− x .
a) Zbudować test najmocniejszy na poziomie istotności 0,05.
b) Oblicz moc testu.
1
7.9 Niech X będzie zmienną losową z rozkładu o gęstości f ( x) = θ xθ −1 dla x ∈ [0,1]. Na
podstawie pojedynczej obserwacji weryfikujemy hipotezę H 0 : θ = 2 przy alternatywie
H1 : θ = 6 na poziomie istotności 0,1.
a) Wyznacz obszar krytyczny testu najmocniejszego
b) Oblicz moc testu.
7.10 Niech X 1 ,..., X 9 będzie próbą losową z rozkładu normalnego N (1, σ 2 ). Rozważamy
hipotezę H 0 : σ = 2 przy alternatywie H1 : σ = 1. Skonstruować test najmocniejszy na
poziomie istotności α = 0, 05.
a) Wyznacz obszar krytyczny testu najmocniejszego
b) Obliczyć moc testu.
Praca domowa
7.1 Populacja generalna ma rozkład określony funkcją gęstości: f ( x) = λ e − λ x dla x > 0.
Weryfikuje się hipotezę zerową λ = 2 wobec hipotezy alternatywnej λ = 1/ 4 przy pomocy
pojedynczej obserwacji. Jeśli wynik jest większy niż pewna stała c, to odrzucamy hipotezę
zerową. Wyznacz stałą c tak, aby α = 0, 01 i oblicz moc testu.
2 m −1
7.2 Populacja generalna ma rozkład ciągły określony funkcją gęstości postaci: f ( x) = 1−mm x 1−m
dla x ∈ [0,1].
Weryfikujemy hipotezę H 0 : m = 2 3 wobec hipotezy alternatywnej H1 : m = 3 4 za pomocą
następującego testu: losujemy jedną obserwację i odrzucamy H 0 jeśli otrzyma się wynik
mniejszy niż ¾, a przyjmujemy H 0 w przeciwnym przypadku. Na który z błędów I-ego czy
II-ego rodzaju jesteśmy bardziej narażeni przy stosowaniu tego testu.
7.3 Populacja generalna ma rozkład ciągły określony funkcją gęstości postaci: f ( x) =
2
β2
x dla
x ∈ [0, β ].
W celu zweryfikowania H 0 : β = 2 wobec hipotezy alternatywnej H1 : β = 1/ 2 dokonuje się
pojedynczej obserwacji. Jeśli wynik obserwacji jest mniejszy niż pewna stała c, to hipoteza
zerowa zostaje odrzucona. Wyznacz stałą c tak, aby α = 0, 04 i oblicz moc testu.
7.4 Niech X 1 ,..., X 25 będzie próbą losową z rozkładu normalnego N ( µ , 22 ). Wiemy, że
średnia z próby wynosi 3,6. Zweryfikować testem najmocniejszym hipotezę H 0 : µ = 3 przy
alternatywie H1 : µ = 4 na poziomie istotności 0,01.
f ( x) =
θ
dla x > 1.
xθ +1
Weryfikujemy hipotezę H 0 : θ = 3 wobec alternatywy H 0 : θ = 5 na poziomie istotności 0,05.
Skonstruować test najmocniejszy (podać obszar krytyczny) oraz obliczyć moc testu.
7.5 Niech X będzie zmienną losową z rozkładu o gęstości
7.6 Niech X będzie zmienną losową z rozkładu o gęstości fθ ( x) = θ xθ −1 dla x ∈ [0,1], gdzie θ
jest nieznanym parametrem. Niech c będzie ustaloną dodatnią liczbą. Test jest zbudowany w
następujący sposób: jeśli X ≥ c, to należy przyjąć H1 : θ = 4, a gdy X < c, należy przyjąć
H 0 : θ = 2. Oblicz:
a) prawdopodobieństwo popełnienia błędów pierwszego i drugiego rodzaju;
b) moc testu;
2
c) wartość c, przy której suma prawdopodobieństw błędów pierwszego i drugiego rodzaju jest
najmniejsza.
7.7 Niech X 1 , X 2 , X 3 , X 4 będzie próbą losową z rozkładu N ( µ , σ 2 ). Testujemy hipotezę
H 0 : σ 2 = 2 przeciwko H1 : σ 2 > 2. Odrzucamy H 0 jeśli wartość statystyki
∑
4
i =1
( X i − X )2
przekroczy c. Dla jakiej wartości c prawdopodobieństwo błędu I rodzaju wynosi 0,1. Podać
moc testu dla hipotezy alternatywnej σ 2 = 10,7.
7.8* Niech X 1 ,..., X 100 będzie próbą z rozkładu N ( µ ,1) z nieznanym parametrem µ.
Rozważamy jednostajnie najmocniejszy test hipotezy H 0 : µ = 0 przeciw alternatywie
H1 : µ > 0 na poziomie istotności 0,05. Znaleźć taką wartość µ , że funkcja mocy testu
przyjmuje wartość 0,95.
7.9* Przeprowadzamy n = 10 niezależnych doświadczeń z nieznanym, jednakowym
prawdopodobieństwem sukcesu θ . Niech X oznacza liczbę sukcesów. Podać test
najmocniejszy dla weryfikacji hipotezy H 0 : θ = 12 wobec alternatywy H1 : θ = 34 na poziomie
istotności 0,05.
7.10* Niech X 1 , X 2 ,..., X n będzie próbą losową z rozkładu jednostajnego na przedziale (0, θ ).
Do weryfikacji hipotezy H 0 : θ = θ 0 przy alternatywie H1 : θ > θ 0 zaproponowano test: gdy
X n:n < c nie mamy podstaw do odrzucenia hipotezy H 0 , gdy X n:n ≥ c hipotezę H 0
odrzucamy.
a) Wyznaczyć stałą c, aby otrzymać test na poziomie istotności 0,1.
b) Wyznaczyć funkcję mocy testu dla hipotezy alternatywnej.
c) Wyznaczyć liczebność próby, aby prawdopodobieństwo popełnienia błędu II rodzaju
dla alternatywy θ = 1, 2θ0 było mniejsze niż 0,09.
Teoria dotycząca testowania hipotez
Niech będzie dana przestrzeń statystyczna, czyli przestrzeń próbkowa wyposażona w
rodzinę rozkładów prawdopodobieństwa {Pθ ,θ ∈ Θ}. Ponadto Θ = Θ0 ∪ Θ1 , Θ0 ∩ Θ1 = ∅.
Mówiąc o zagadnieniu testowania będziemy rozważali hipotezę zerową H 0 : θ ∈ Θ0 i hipotezę
alternatywną H1 : θ ∈ Θ1. Testem hipotezy H 0 przeciw alternatywie H1 nazywamy statystykę
δ : Ω → {0,1}, gdzie „1” oznacza decyzję o odrzuceniu H 0 , natomiast „0” oznacza, że nie
odrzucamy H 0 . Innymi słowy, testem statystycznym nazywamy metodę postępowania, która
możliwym realizacjom próby losowej X 1 ,..., X n określonej na przestrzeni statystycznej
przypisuje decyzję odrzucenia (albo przyjęcia) weryfikowanej hipotezy. W celu zbudowania
testu do weryfikacji postawionej hipotezy H 0 należy skonstruować dwa dopełniające się
zbiory W i W ′ (W ∩ W ′ = ∅, W ∩ W ′ = ℜ) oraz pewną statystykę T ( X 1 ,..., X n ), zwaną
statystyką testową, przy czym:
jeżeli T ( X 1 ,..., X n ) ∈ W , to H 0 odrzucamy
jeżeli T ( X 1 ,..., X n ) ∈ W ′, to H 0 przyjmujemy.
Zbiór W nazywamy zbiorem krytycznym, a zbiór W ′ zbiorem przyjęć. Przeważnie test ma
postać δ ( X 1 ,..., X n ) = I (T ( X 1 ,..., X n ) > c), gdzie c jest liczbą zwaną poziomem krytycznym.
W wyniku testowania hipotezy H 0 możemy popełnić jeden z dwu następujących
błędów:
1) odrzucimy weryfikowaną hipotezę H 0 , gdy jest ona prawdziwa – tzw. błąd
pierwszego rodzaju;
3
2) przyjmiemy weryfikowaną hipotezę H 0 , gdy jest ona fałszywa – tzw. błąd drugiego
rodzaju.
Stan rzeczy Decyzja
δ =0
δ =1
Błąd I rodzaju
H 0 prawdziwa
O.K.
= P(δ = 1| H 0 )
Błąd II rodzaju =
H1 prawdziwa
O.K.
P(δ = 0 | H1 )
Niech 1 − β (θ ) = Pθ (δ ( X 1 ,..., X n ) = 1) oznacza prawdopodobieństwo odrzucenia H 0 . Funkcję
1 − β (θ ) nazywamy funkcją mocy testu δ ( X 1 ,..., X n ). Interpretacja tej funkcji jest odmienna
dla θ ∈ Θ0 i θ ∈ Θ1 :
dla θ ∈ Θ0 1 − β (θ ) = Pθ (δ ( X 1 ,..., X n ) = 1) = Pθ (δ ( X 1 ,..., X n ) = 1| H 0 ) - prawdopodobieństwo
popełnienie błędu I rodzaju;
dla θ ∈ Θ1 1 − β (θ ) = Pθ (δ ( X 1 ,..., X n ) = 1) = Pθ (δ ( X 1 ,..., X n ) = 1| H1 ) =
= 1 − Pθ (δ ( X 1 ,..., X n ) = 0 | H1 ) - 1 minus prawdopodobieństwo popełnienie błędu II rodzaju;
Zgodnie z oznaczeniami przyjętymi powyżej wyrażenie P(δ = 1| H1 ) = 1 − P(δ = 0 | H1 )
nazywamy funkcją mocy testu dla hipotezy alternatywnej (lub w skócie mocą testu).
Mówimy, że δ jest testem na poziomie istotności α , jeśli sup P(δ = 1| H 0 ) ≤ α .
θ ∈Θ0
Idea testowania hipotez jest następującą: H 0 uważamy za „prawdziwe”, dopóki nie
pojawią się przesłanki (w tym wypadku dane statystyczne), które będą z nią sprzeczne. Nie
jesteśmy skłonni do rezygniacji z H 0 dopóki nie pojawią się ku temu poważne powody. Więc
będziemy się przede wszystkim starali kontrolować prawdopodobieństwo popełnia błędu I
rodzaju. Chcielibyśmy umieć konstruować testy, dla których prawdopodobieństwo błędu
pierwszego rodzaju nie przekracza zadanej z góry, małej liczby. Następnie z klasy testów
spełniających powyższy warunek chcielibyśmy wybrać ten, dla którego prawdopodobieństwo
popełnienia błędu II rodzaju jest najniższe. Opis formalnego sposobu postępowania znajduje
się poniżej.
Niech θ0 i θ1 będą ustalonymi punktami przestrzeni parametrów Θ. Rozważmy dwie
hipotezy proste: H 0 : θ = θ 0 i H1 : θ = θ1. Niech P0 i P1 oznaczają rozkłady
prawdopodobieństwa na przestrzeni próbkowej, odpowiadające wartościom parametrów θ0 i
θ1. Załóżmy, że te rozkłady mają gęstości f0 i f1. Statystyk jest zainteresowany w
jednoczesnej minimalizacji prawdopodobieństw obu błędów. Zadanie tego typu na ogół nie
ma jednak rozwiązania, gdyż zmniejszenie prawdopodobieństwa błędu jednego rodzaju
powoduje wzrost prawdopodobieństwa błędu drugiego rodzaju. Dlatego wybieramy tzw.
poziom istotności α i rozwiązujemy zadanie, które ma postać:
 P(δ = 0 | H1 ) = min!  P(δ = 1| H1 ) = max!
(*) 
⇔
 P(δ = 1| H 0 ) ≤ α
 P (δ = 1| H 0 ) ≤ α
Test, który przy ustalonym prawdopodobieństwie błędu I rodzaju minimalizuje
prawdopodobieństwo błędu II rodzaju (maksymalizuje moc testu), nazywamy testem
najmocniejszym.
Lemat Neymana – Pearsona
H 0 : θ = θ 0 ; H1 : θ = θ1 ; T – ustalona statystyka. Załóżmy, że rozkład T jest ciągły oraz: f 0 gęstość rozkładu T, gdy θ = θ 0 , f1 - gęstość rozkładu T, gdy θ = θ1. Warunek (*) jest
równoważny:
4
 f1 (t )dt = max!
W∫

 ∫ f 0 (t )dt ≤ α
W
Wówczas, w celu skonstruowania testu najmocniejszego obszar krytyczny W należy dobrać
w następujący sposób: W = {t ∈ Ω : ff10 ((tt)) > c}, gdzie c jest dobrane w taki sposób, że
∫ f (t )dt = α .
0
W
Lemat ten uogólnia się na przypadek na przypadek „dyskretnych funkcji
prawdopodobieństwa” (tzn. gdy statystyka testowa T ma rozkład skokowy). Wówczas całki
należy zastąpić sumami. Test o którym jest mowa w lemacie Neymana-Pearsona nazywamy
testem ilorazu wiarogodności.
Definicja (Test jednostajnie najmocniejszy)
Test δ * jest testem jednostajnie najmocniejszym na poziomie istotności α , jeśli
1) δ * jest testem na poziomie istotności α ;
2) dla każdego testu δ na poziomie istotności α , mamy: Pθ (δ * = 1) ≥ Pθ (δ = 1) dla każdego
θ ∈ Θ1.
Przykład
Niech X 1 , X 2 ,..., X n będzie próbą losową z rozkładu N ( µ , σ 2 ), zakładamy, że σ 2 jest znane.
Skonstruujemy test najmocniejszy dla hipotezy H 0 : µ = µ0 wobec H1 : µ = µ1 , gdzie
µ0 < µ1.
) exp(− 2σ1 2 ∑ i =1 ( xi − µ1 ) 2 )
f1 ( x1 ,..., xn ) = (
n
1
2πσ
f 0 ( x1 ,..., xn ) = (
n
1
2πσ
n
) exp(− 2σ1 2 ∑ i =1 ( xi − µ0 ) 2 )
n
Iloraz wiarogodności (iloraz łącznych gęstości):
f1 ( x1 ,..., xn )
n
n
= exp(− 2σ1 2 ∑ i =1 ( X i − µ1 ) 2 + 2σ1 2 ∑ i =1 ( X i − µ0 )2 )) > c ⇔
f 0 ( x1 ,..., xn )
−∑ i =1 ( X i − µ1 ) 2 + ∑ i =1 ( X i − µ0 )2 > 2σ 2 ln c = c1 ⇔
n
n
2∑ i =1 X i (µ1 − µ0 ) + n( µ02 − µ12 ) > c1 ⇔
n
∑
∑
n
i =1
n
i =1
X i (µ1 − µ0 ) > (c1 − n( µ02 − µ12 )) / 2 = c2 ⇔
X i > c2 /( µ1 − µ0 ) = c3 ⇔
∑
X=
n
i =1
Xi
> c3 / n = c4
n
Czyli będziemy odrzucań H 0 , jeśli średnia z próby przewyższy stałą c4 . Pozostaje problem
dobrania stłej c4 . Załóżmy, że chcemy skonstruować test najmocniejszy na poziomie
istotności α , czyli: P(δ = 1| H 0 ) = α . Przy załóżeniu prawdziwości hipotezy zerowej
2
statystyka testowa (średnia z próby) ma rozkład N ( µ0 , σn ), czyli:
α = P(δ = 1| H 0 ) = P( X > c4 | µ = µ0 ) = P( σX /− µn > cσ /− µn | µ = µ0 ) = 1 − F ( cσ /− µn )
0
4
0
4
0
N (0,1)
gdzie F jest dystrubuantą rozkładu normalnego standardowego. Wynika stąd, że:
5
α = 1 − F ( cσ /− µn ) ⇔ F ( σc /− µn ) = 1 − α ⇔
4
0
4
0
c4 − µ0
σ/ n
= F −1 (1 − α ) ⇔
c4 − µ0
σ/ n
jest kwantylem
rzędu 1 − α dla rozkładu normalnego standardowego.
Podsumowanie: testem najmocniejszym na poziomie istotności α jest następujący test:
odrzucamy H 0 jeśli
X − µ0
σ/ n
> c,
gdzie c jest kwantylem rzędu 1 − α dla rozkładu
normalnego standardowego.
6