TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy
Transkrypt
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi nazywamy hipotezy dotyczące wartości nieznanego parametru θ rozkładu. Na podstawie próbki X1, . . . , Xn z rozkładu Pθ , θ ∈ Θ, mamy zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Nieparametrycznymi nazywamy hipotezy, które nie dotyczą parametrów rozkładu (np. hipotezy o typie rozkładu). Na ogół mówiąc, sposób postępowania, który prowadzi do podjęcia decyzji, nazywamy testem (statystycznym). Przykład. Na kartonie z mlekiem jest napisane ”zawartość tłuszczu wynosi 3,2%”. W celu sprawdzenia, czy tak jest naprawdę, zmierzona została zawartość tłuszczu w 10 losowo wybranych kartonach z mlekiem, pochodzącym od pewnego producenta. Uzyskano następujące wyniki: 3,26%; 3,12%; 3,24%; 3,16%; 3,08%, 3,14%; 3,23%; 3,11%; 3,09%; 3,24%. Jak wiemy, dobrym estymatorem nieznanej średniej war1 tości pewnej cechy jest średnia z próbki. Okazało się, że x̄ = 3,167%. Czy na podstawie tego można przyjąć, że zawartość tłuszczu w mleku przeciętnie wynosi 3,2%? Gdyby okazało się, że x̄ = 2,8% lub x̄ = 3,5%, to zapewne nie mielibyśmy wątpliwości, że hipotezę tę należy odrzucić. Natomiast w przypadku x̄ = 3,2% nie należałoby się ją odrzucać. Ale ponieważ zaobserwowana wartość wynosi x̄ = 3,167%, to decyzja o odrzuceniu bądź nie odrzuceniu hipotezy już nie jest tak oczywista. Rozsądnym wydaje się następujące postępowanie. Przypuśćmy, że hipoteza jest prawdziwa, tzn. przeciętna zawartość tłuszczu w mleku wynosi 3,2%. Jeśli prawdopodobieństwo zaobserwowania przy tym przypuszczeniu wartości x̄ = 3,167% jest bardzo małe, powiedzmy nie większe niż α = 0,05, to nasze przypuszczenie odrzucimy, bo zdarzyło się coś, co powinno zdarzać się niezmiernie rzadko. Dalej α nazywamy poziomem istotności testu. Na ogół, decyzja o odrzuceniu rozważanej hipotezy związana jest z podjęciem decyzji o przyjęciu pewnej hipotezy alternatywnej. W tym przykładzie może nią być hipoteza mówiąca, że przeciętna zawartość tłuszczu w 2 mleku różni się od 3,2%. Ale może też być inna hipoteza alternatywna. Np. organizacja obrony praw konsumentów może być zainteresowana rozważaniem hipotezy alternatywnej postaci ”przeciętna zawartość tłuszczu w mleku jest mniejsza niż 3,2%”, natomiast sam producent mleka, że ”przeciętna zawartość tłuszczu w mleku jest większa od 3,2%”. Postać hipotezy alternatywnej powinna wpływać na naszą decyzję. Otrzymując x̄ = 3,167%, może skłonni bylibyśmy odrzucić hipotezę pierwotną i przyjąć hipotezę obrońców praw konsumentów. Trochę mniej pewnie podjęlibyśmy decyzję o przyjęciu hipotezy, że przeciętna zawartość tłuszczu w mleku różni się od 3,2%, a już na pewno nie przyjęlibyśmy hipotezy producenta. Ogólny schemat postępowania. 1. Formułujemy dwie wzajemnie wykluczające się hipotezy: H0 (zerowa) i H1 (alternatywna). 2. Określamy poziom istotności testu α ∈ (0, 1) (standardowo α = 0,05). 3. Przy założeniu prawdziwości hipotezy H0, dobieramy pewną statystykę (zwaną statystyką testową), której rozkład nie zależy od nieznanych parametrów. Zgodnie z tym rozkładem oraz przyjętą wartością α określamy zbiór krytyczny K. Jest to podzbiór R taki, że 3 prawdopodobieństwo wpadnięcia do K wartości zmiennej losowej o określonym wyżej rozkładzie wynosi właśnie α (czyli jest bardzo małe). 4. Jeśli obliczona na podstawie próbki wartość statystyki testowej wpada do K, to hipotezę H0 odrzucamy. Jeśli obliczona wartość statystyki testowej nie wpada do K, to nie mamy podstaw do odrzucenia H0. Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości oczekiwanej. 1. H0 : µ = µ0 H1 : µ ̸= µ0 lub µ < µ0 lub µ > µ0. 2. Określamy α ∈ (0, 1). 3. Rozważamy trzy przypadki: 3a. rozkład, z którego pochodzi próbka, jest normalny, wariancja σ 2 jest znana; 3b. rozkład, z którego pochodzi próbka, jest normalny, wariancja σ 2 nie jest znana; 3c. rozkład, z którego pochodzi próbka, jest dowolny, ale n jest duże. 3a. Jeśli H0 jest prawdziwa, to {Xi} - niezależne zmien2 ne losowe o rozkładzie N (µ0, σ 2) =⇒ X̄ ∼ N (µ0, σn ) √ X̄−µ0 √ X̄−µ0 =⇒ n σ ∼ N (0, 1). Zatem n σ jest statystyką testową. 4 Postać zbioru krytycznego K zależy od postaci hipotezy alternatywnej H1. Pod tym względem rozróżniamy: dwustronny obszar krytyczny K = (−∞, −z1−α/2)∪(z1−α/2, ∞) (gdy H1 : µ ̸= µ0); lewostronny obszar krytyczny K = (−∞, −z1−α) (gdy H1 : µ < µ0); prawostronny obszar krytyczny K = (z1−α, ∞) (gdy H1 : µ > µ0). 4. Wartość statystyki testowej ∈ K =⇒ odrzucamy H0; wartość statystyki testowej ∈ / K =⇒ nie mamy podstaw do odrzucenia H0. √ X̄−µ0 3b. Statystyka testowa ma postać n S i ma rozkład Studenta tn−1. Obszary krytyczne: K = (−∞, −t1−α/2,n−1) ∪ (t1−α/2,n−1, ∞) lub K = (−∞, −t1−α,n−1) lub K = (t1−α,n−1, ∞). √ X̄−µ0 3c. Statystyka testowa ma postać n S i ma w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub K = (−∞, −z1−α) lub K = (z1−α, ∞). 5 Test dot. nieznanej wariancji rozkładu N (µ, σ 2). H0 : σ 2 = σ02, H1 : σ 2 ̸= σ02 lub σ 2 < σ02 lub σ 2 > σ02. 2 2 i ma rozkład χ (n−1). Statystyka testowa ma postać (n−1)S 2 σ0 Obszary krytyczne: K = (0, χ2α/2,n−1) ∪ (χ21−α/2,n−1, ∞) lub K = (0, χ2α,n−1) lub K = (χ21−α,n−1, ∞). Niech np. w Przykładzie testujemy na poziomie istotności, powiedzmy, α = 0,05 hipotezę H0 : µ = 3,2 (producent jest uczciwy) przeciw H1 : µ < 3,2 (producent oszukuje). Przy założeniu, że cecha ma rozkład normalny i np. σ 2 = 0,004, mamy do czynienia z sytuacją opisaną w 3a. Otrzymujemy z tablic z0,95 = 1,6449. Więc K = (−∞, −1,6449). Wartość statystyki testowej wynosi √ 3,167 − 3,2 ≈ −1,65, czyli wpada ona do K. 10 √ 0,004 Zatem należy odrzucić hipotezę H0 i przyznać, że producent mleka oszukuje. Jeśli nie ma wiedzy o σ 2, to mamy do czynienia z sytuacją opisaną w 3b. Otrzymujemy z tablic t0,95,9 = 1,8331, zatem K = (−∞, −1,8331). Wartość staty- 6 styki testowej wynosi √ 3,167 − 3,2 10 √ ≈ −1,506, czyli nie wpada ona do K. 0,0048 Nie mamy więc podstaw do odrzucenia hipotezy H0, czyli nie mamy podstaw do orzeczenia, że producent mleka oszukuje. Test dotyczący nieznanego prawdopodobieństwa sukcesu p w rozkładzie zero-jedynkowym. H0 : p = p0, H1 : p ̸= p0 lub p < p0 lub p > p0. √ Statystyka testowa ma postać n √ X̄−p0 i ma p0 (1−p0 ) w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub K = (−∞, −z1−α) lub K = (z1−α, ∞). Testy dot. równości wartości oczekiwanych 2 prób. H0 : µ1 = µ2, H1 : µ1 ̸= µ2 lub µ1 < µ2 lub µ1 > µ2. (1) (1) (a) Mamy niezależne próbki: X1 , . . . , Xn1 ∼ N (µ1, σ12); (2) (2) X1 , . . . , Xn2 ∼ N (µ2, σ22); σ1, σ2 są znane. Statystyka testowa ma postać X̄ − X̄2 √1 2 σ22 σ1 n1 + n2 7 i ma rozkład N (0, 1). Obszary krytyczne: K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub K = (−∞, −z1−α) lub K = (z1−α, ∞). (1) (1) (b) Mamy niezależne próbki: X1 , . . . , Xn1 ∼ N (µ1, σ12); (2) (2) X1 , . . . , Xn2 ∼ N (µ2, σ22); σ1, σ2 są nieznane, σ1 = σ2. Statystyka testowa ma postać √ X̄1 − X̄2 (n1 −1)S12 +(n2 −1)S22 n1 +n2 −2 2 · nn11+n n2 i ma rozkład Studenta tn1+n2−2. Obszary krytyczne: K = (−∞, −t1−α/2,n1+n2−2) ∪ (t1−α/2,n1+n2−2, ∞) lub K = (−∞, −t1−α,n1+n2−2) lub K = (t1−α,n1+n2−2, ∞). (1) (1) (2) (c) Mamy niezależne próbki: X1 , . . . , Xn1 oraz X1 , (2) . . . , Xn2 o nieznanych wariancjach, ale n1, n2 są duże. Statystyka testowa ma postać X̄1 − X̄2 √ 2 S1 S22 n1 + n2 i ma w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub K = (−∞, −z1−α) lub K = (z1−α, ∞). (1) (1) (2) (d) Mamy zależne próbki: X1 , . . . , Xn oraz X1 , . . . , 8 (2) Xn ; obie pochodzą z rozkładu normalnego. Oznaczmy: (1) (2) Di = Xi − Xi . √ Statystyka testowa ma postać n SD̄ i ma rozkład StuD denta tn−1 (porównaj z 3b). Obszary krytyczne: K = (−∞, −t1−α/2,n−1) ∪ (t1−α/2,n−1, ∞) lub K = (−∞, −t1−α,n−1) lub K = (t1−α,n−1, ∞). Pojęcie p-wartości. Jeśli zaobserwowana wartość statystyki testowej S to s0, to p-wartość określamy jako: P (|S| > s0), jeśli obszar krytyczny jest dwustronny; P (S < s0), jeśli obszar krytyczny jest lewostronny; P (S > s0), jeśli obszar krytyczny jest prawostronny. Możemy podejmować decyzję na podstawie porównania p-wartości z poziomem istotności testu α : jeśli p < α, to odrzucamy H0; jeśli p > α, to nie mamy podstaw do odrzucenia H0. Przykład 1. Wysunięto hipotezę, że stopień wyprania tkaniny wełnianej płatkami mydlanymi jest wyższy od stopnia wyprania sulfapolem. W celu sprawdzenia tej hipotezy wykonano pomiary stopnia wyprania 10 wycinków tkaniny pranej płatkami, otrzymując wyniki (w %): 74,8; 75,1; 73,0; 72,8; 76,2; 74,6; 76,0; 73,4; 72,9; 71,6 oraz 7 wyników prania sulfapolem, otrzymując: 56,9; 57,8; 54,6; 59,0; 57,1; 58,2; 57,6. Zakładając, że stopień wy9 prania tkaniny każdym środkiem ma rozkład normalny i wariancje są jednakowe, na poziomie istotności α = 0,05 przetestuj wysuniętą hipotezę. Testujemy hipotezy: H0 : µp = µs, H1 : µp > µs. Mamy sytuację z punktu (b), zbiór krytyczny jest prawostronny. Obliczamy: x̄p = 74,0, x̄s = 57,3, s2p = 2,31, s2s = 1,92. Z tablic otrzymujemy: t0,95,15 = 1,75, więc zbiór krytyczny jest postaci K = (1,75; +∞). Wartość statystyki testowej wynosi: 74,0 − 57,3 √ ≈ 23,07. 9·2,31+6·1,92 17 · 70 15 Ponieważ wpada ona do K, odrzucamy hipotezę H0. Przykład 2. Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed i po podaniu takiego samego leku każdemu z badanych pacjentów. Otrzymano następujące wyniki: pacjent 1 2 3 4 5 6 7 przed 210 180 260 270 190 250 180 po 180 160 220 260 200 230 180 Na poziomie istotności α = 0,05 przetestuj hipotezę, że stosowany lek nie powoduje spadku ciśnienia u pacjentów wobec hipotezy, że średnia wartość ciśnienia 10 przed podaniem leku jest wyższa niż po podaniu, zakładając, że w obu przypadkach ciśnienie tętnicze ma rozkład normalny. Testujemy hipotezy: H0 : µ1 = µ2, H1 : µ1 > µ2. Mamy sytuację z punktu (d), zbiór krytyczny jest prawostronny.Wyliczamy, że wartości di wynoszą: 30, 20, 40, 10, -10, 20, 0, zatem d¯ = 15,7, sd = 12,23. Z tablic otrzymujemy: t0,95,6 = 1,94, więc zbiór krytyczny jest postaci K = (1,94; +∞). Wartość statystyki testowej wynosi: √ 15,7 7 ≈ 3,40. 12,23 Ponieważ wpada ona do K, odrzucamy hipotezę H0. 11