TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy

Transkrypt

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy
TESTOWANIE HIPOTEZ
Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego
pochodzi próbka.
Hipotezy dzielimy na parametryczne i nieparametryczne.
Parametrycznymi nazywamy hipotezy dotyczące wartości nieznanego parametru θ rozkładu. Na podstawie próbki X1, . . . , Xn z rozkładu Pθ , θ ∈ Θ, mamy
zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Nieparametrycznymi
nazywamy hipotezy, które nie dotyczą parametrów rozkładu (np. hipotezy o typie rozkładu).
Na ogół mówiąc, sposób postępowania, który prowadzi do podjęcia decyzji, nazywamy testem (statystycznym).
Przykład. Na kartonie z mlekiem jest napisane ”zawartość tłuszczu wynosi 3,2%”. W celu sprawdzenia,
czy tak jest naprawdę, zmierzona została zawartość
tłuszczu w 10 losowo wybranych kartonach z mlekiem,
pochodzącym od pewnego producenta. Uzyskano następujące wyniki: 3,26%; 3,12%; 3,24%; 3,16%; 3,08%,
3,14%; 3,23%; 3,11%; 3,09%; 3,24%.
Jak wiemy, dobrym estymatorem nieznanej średniej war1
tości pewnej cechy jest średnia z próbki. Okazało się,
że x̄ = 3,167%. Czy na podstawie tego można przyjąć, że zawartość tłuszczu w mleku przeciętnie wynosi
3,2%?
Gdyby okazało się, że x̄ = 2,8% lub x̄ = 3,5%, to zapewne nie mielibyśmy wątpliwości, że hipotezę tę należy odrzucić. Natomiast w przypadku x̄ = 3,2% nie
należałoby się ją odrzucać. Ale ponieważ zaobserwowana wartość wynosi x̄ = 3,167%, to decyzja o odrzuceniu bądź nie odrzuceniu hipotezy już nie jest tak
oczywista.
Rozsądnym wydaje się następujące postępowanie. Przypuśćmy, że hipoteza jest prawdziwa, tzn. przeciętna zawartość tłuszczu w mleku wynosi 3,2%. Jeśli prawdopodobieństwo zaobserwowania przy tym przypuszczeniu
wartości x̄ = 3,167% jest bardzo małe, powiedzmy nie
większe niż α = 0,05, to nasze przypuszczenie odrzucimy, bo zdarzyło się coś, co powinno zdarzać się niezmiernie rzadko. Dalej α nazywamy poziomem istotności testu.
Na ogół, decyzja o odrzuceniu rozważanej hipotezy związana jest z podjęciem decyzji o przyjęciu pewnej hipotezy alternatywnej. W tym przykładzie może nią być
hipoteza mówiąca, że przeciętna zawartość tłuszczu w
2
mleku różni się od 3,2%. Ale może też być inna hipoteza alternatywna. Np. organizacja obrony praw
konsumentów może być zainteresowana rozważaniem
hipotezy alternatywnej postaci ”przeciętna zawartość
tłuszczu w mleku jest mniejsza niż 3,2%”, natomiast
sam producent mleka, że ”przeciętna zawartość tłuszczu w mleku jest większa od 3,2%”.
Postać hipotezy alternatywnej powinna wpływać na
naszą decyzję. Otrzymując x̄ = 3,167%, może skłonni
bylibyśmy odrzucić hipotezę pierwotną i przyjąć hipotezę obrońców praw konsumentów. Trochę mniej pewnie podjęlibyśmy decyzję o przyjęciu hipotezy, że przeciętna zawartość tłuszczu w mleku różni się od 3,2%, a
już na pewno nie przyjęlibyśmy hipotezy producenta.
Ogólny schemat postępowania.
1. Formułujemy dwie wzajemnie wykluczające się hipotezy: H0 (zerowa) i H1 (alternatywna).
2. Określamy poziom istotności testu α ∈ (0, 1) (standardowo α = 0,05).
3. Przy założeniu prawdziwości hipotezy H0, dobieramy pewną statystykę (zwaną statystyką testową), której rozkład nie zależy od nieznanych parametrów. Zgodnie z tym rozkładem oraz przyjętą wartością α określamy zbiór krytyczny K. Jest to podzbiór R taki, że
3
prawdopodobieństwo wpadnięcia do K wartości zmiennej losowej o określonym wyżej rozkładzie wynosi właśnie α (czyli jest bardzo małe).
4. Jeśli obliczona na podstawie próbki wartość statystyki testowej wpada do K, to hipotezę H0 odrzucamy.
Jeśli obliczona wartość statystyki testowej nie wpada
do K, to nie mamy podstaw do odrzucenia H0.
Uwaga. Decyzje brzmią różnie!
Testy parametryczne dotyczące nieznanej wartości oczekiwanej.
1. H0 : µ = µ0
H1 : µ ̸= µ0 lub µ < µ0 lub µ > µ0.
2. Określamy α ∈ (0, 1).
3. Rozważamy trzy przypadki:
3a. rozkład, z którego pochodzi próbka, jest normalny,
wariancja σ 2 jest znana;
3b. rozkład, z którego pochodzi próbka, jest normalny,
wariancja σ 2 nie jest znana;
3c. rozkład, z którego pochodzi próbka, jest dowolny,
ale n jest duże.
3a. Jeśli H0 jest prawdziwa, to {Xi} - niezależne zmien2
ne losowe o rozkładzie N (µ0, σ 2) =⇒ X̄ ∼ N (µ0, σn )
√ X̄−µ0
√ X̄−µ0
=⇒
n σ ∼ N (0, 1). Zatem n σ jest statystyką testową.
4
Postać zbioru krytycznego K zależy od postaci hipotezy alternatywnej H1. Pod tym względem rozróżniamy:
dwustronny obszar krytyczny
K = (−∞, −z1−α/2)∪(z1−α/2, ∞) (gdy H1 : µ ̸= µ0);
lewostronny obszar krytyczny
K = (−∞, −z1−α) (gdy H1 : µ < µ0);
prawostronny obszar krytyczny
K = (z1−α, ∞) (gdy H1 : µ > µ0).
4. Wartość statystyki testowej ∈ K =⇒ odrzucamy
H0; wartość statystyki testowej ∈
/ K =⇒ nie mamy
podstaw do odrzucenia H0.
√ X̄−µ0
3b. Statystyka testowa ma postać n S i ma rozkład Studenta tn−1.
Obszary krytyczne:
K = (−∞, −t1−α/2,n−1) ∪ (t1−α/2,n−1, ∞) lub
K = (−∞, −t1−α,n−1) lub K = (t1−α,n−1, ∞).
√ X̄−µ0
3c. Statystyka testowa ma postać n S i ma
w przybliżeniu rozkład N (0, 1).
Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
5
Test dot. nieznanej wariancji rozkładu N (µ, σ 2).
H0 : σ 2 = σ02, H1 : σ 2 ̸= σ02 lub σ 2 < σ02 lub σ 2 > σ02.
2
2
i
ma
rozkład
χ
(n−1).
Statystyka testowa ma postać (n−1)S
2
σ0
Obszary krytyczne:
K = (0, χ2α/2,n−1) ∪ (χ21−α/2,n−1, ∞) lub
K = (0, χ2α,n−1) lub K = (χ21−α,n−1, ∞).
Niech np. w Przykładzie testujemy na poziomie istotności, powiedzmy, α = 0,05 hipotezę H0 : µ = 3,2 (producent jest uczciwy) przeciw H1 : µ < 3,2 (producent
oszukuje). Przy założeniu, że cecha ma rozkład normalny i np. σ 2 = 0,004, mamy do czynienia z sytuacją
opisaną w 3a. Otrzymujemy z tablic z0,95 = 1,6449.
Więc K = (−∞, −1,6449). Wartość statystyki testowej wynosi
√ 3,167 − 3,2
≈ −1,65, czyli wpada ona do K.
10 √
0,004
Zatem należy odrzucić hipotezę H0 i przyznać, że producent mleka oszukuje.
Jeśli nie ma wiedzy o σ 2, to mamy do czynienia z sytuacją opisaną w 3b. Otrzymujemy z tablic t0,95,9 =
1,8331, zatem K = (−∞, −1,8331). Wartość staty-
6
styki testowej wynosi
√ 3,167 − 3,2
10 √
≈ −1,506, czyli nie wpada ona do K.
0,0048
Nie mamy więc podstaw do odrzucenia hipotezy H0,
czyli nie mamy podstaw do orzeczenia, że producent
mleka oszukuje.
Test dotyczący nieznanego prawdopodobieństwa
sukcesu p w rozkładzie zero-jedynkowym.
H0 : p = p0, H1 : p ̸= p0 lub p < p0 lub p > p0.
√
Statystyka testowa ma postać n √ X̄−p0
i ma
p0 (1−p0 )
w przybliżeniu rozkład N (0, 1).
Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
Testy dot. równości wartości oczekiwanych 2 prób.
H0 : µ1 = µ2, H1 : µ1 ̸= µ2 lub µ1 < µ2 lub µ1 > µ2.
(1)
(1)
(a) Mamy niezależne próbki: X1 , . . . , Xn1 ∼ N (µ1, σ12);
(2)
(2)
X1 , . . . , Xn2 ∼ N (µ2, σ22); σ1, σ2 są znane.
Statystyka testowa ma postać
X̄ − X̄2
√1 2
σ22
σ1
n1 + n2
7
i ma rozkład N (0, 1). Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
(1)
(1)
(b) Mamy niezależne próbki: X1 , . . . , Xn1 ∼ N (µ1, σ12);
(2)
(2)
X1 , . . . , Xn2 ∼ N (µ2, σ22); σ1, σ2 są nieznane, σ1 = σ2.
Statystyka testowa ma postać
√
X̄1 − X̄2
(n1 −1)S12 +(n2 −1)S22
n1 +n2 −2
2
· nn11+n
n2
i ma rozkład Studenta tn1+n2−2.
Obszary krytyczne:
K = (−∞, −t1−α/2,n1+n2−2) ∪ (t1−α/2,n1+n2−2, ∞) lub
K = (−∞, −t1−α,n1+n2−2) lub K = (t1−α,n1+n2−2, ∞).
(1)
(1)
(2)
(c) Mamy niezależne próbki: X1 , . . . , Xn1 oraz X1 ,
(2)
. . . , Xn2 o nieznanych wariancjach, ale n1, n2 są duże.
Statystyka testowa ma postać
X̄1 − X̄2
√ 2
S1
S22
n1 + n2
i ma w przybliżeniu rozkład N (0, 1). Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
(1)
(1)
(2)
(d) Mamy zależne próbki: X1 , . . . , Xn oraz X1 , . . . ,
8
(2)
Xn ; obie pochodzą z rozkładu normalnego. Oznaczmy:
(1)
(2)
Di = Xi − Xi .
√
Statystyka testowa ma postać n SD̄ i ma rozkład StuD
denta tn−1 (porównaj z 3b). Obszary krytyczne:
K = (−∞, −t1−α/2,n−1) ∪ (t1−α/2,n−1, ∞) lub
K = (−∞, −t1−α,n−1) lub K = (t1−α,n−1, ∞).
Pojęcie p-wartości. Jeśli zaobserwowana wartość statystyki testowej S to s0, to p-wartość określamy jako:
P (|S| > s0), jeśli obszar krytyczny jest dwustronny;
P (S < s0), jeśli obszar krytyczny jest lewostronny;
P (S > s0), jeśli obszar krytyczny jest prawostronny.
Możemy podejmować decyzję na podstawie porównania p-wartości z poziomem istotności testu α :
jeśli p < α, to odrzucamy H0;
jeśli p > α, to nie mamy podstaw do odrzucenia H0.
Przykład 1. Wysunięto hipotezę, że stopień wyprania
tkaniny wełnianej płatkami mydlanymi jest wyższy od
stopnia wyprania sulfapolem. W celu sprawdzenia tej
hipotezy wykonano pomiary stopnia wyprania 10 wycinków tkaniny pranej płatkami, otrzymując wyniki (w
%): 74,8; 75,1; 73,0; 72,8; 76,2; 74,6; 76,0; 73,4; 72,9; 71,6
oraz 7 wyników prania sulfapolem, otrzymując: 56,9; 57,8;
54,6; 59,0; 57,1; 58,2; 57,6. Zakładając, że stopień wy9
prania tkaniny każdym środkiem ma rozkład normalny
i wariancje są jednakowe, na poziomie istotności α =
0,05 przetestuj wysuniętą hipotezę.
Testujemy hipotezy: H0 : µp = µs, H1 : µp > µs.
Mamy sytuację z punktu (b), zbiór krytyczny jest prawostronny. Obliczamy: x̄p = 74,0, x̄s = 57,3, s2p =
2,31, s2s = 1,92. Z tablic otrzymujemy: t0,95,15 = 1,75,
więc zbiór krytyczny jest postaci K = (1,75; +∞).
Wartość statystyki testowej wynosi:
74,0 − 57,3
√
≈ 23,07.
9·2,31+6·1,92 17
· 70
15
Ponieważ wpada ona do K, odrzucamy hipotezę H0.
Przykład 2. Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed
i po podaniu takiego samego leku każdemu z badanych
pacjentów. Otrzymano następujące wyniki:
pacjent 1
2
3
4
5
6
7
przed 210 180 260 270 190 250 180
po
180 160 220 260 200 230 180
Na poziomie istotności α = 0,05 przetestuj hipotezę,
że stosowany lek nie powoduje spadku ciśnienia u pacjentów wobec hipotezy, że średnia wartość ciśnienia
10
przed podaniem leku jest wyższa niż po podaniu, zakładając, że w obu przypadkach ciśnienie tętnicze ma
rozkład normalny.
Testujemy hipotezy: H0 : µ1 = µ2, H1 : µ1 > µ2.
Mamy sytuację z punktu (d), zbiór krytyczny jest prawostronny.Wyliczamy, że wartości di wynoszą: 30, 20,
40, 10, -10, 20, 0, zatem d¯ = 15,7, sd = 12,23. Z tablic
otrzymujemy: t0,95,6 = 1,94, więc zbiór krytyczny jest
postaci K = (1,94; +∞). Wartość statystyki testowej
wynosi:
√ 15,7
7
≈ 3,40.
12,23
Ponieważ wpada ona do K, odrzucamy hipotezę H0.
11