ZASADY TESTOWANIA HIPOTEZ STATYSTYCZNYCH. TESTY

Transkrypt

ZASADY TESTOWANIA HIPOTEZ STATYSTYCZNYCH. TESTY
ZASADY TESTOWANIA HIPOTEZ
STATYSTYCZNYCH. TESTY DOTYCZĄCE
WARTOŚCI OCZEKIWANEJ
Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
Hipotezy dzielimy na parametryczne i nieparametryczne.
Zajmiemy się hipotezami parametrycznymi. Są to hipotezy dotyczące nieznanego parametru θ (rozważamy
tylko przypadek, gdy θ = µ, czyli jest nieznaną wartością oczekiwaną rozkładu cechy).
Na podstawie próbki (x1, . . . , xn) mamy zdecydować,
czy należy odrzucić daną hipotezę o parametrze θ, czy
jej nie odrzucać.
Nieściśle mówiąc, sposób postępowania, który prowadzi do podjęcia decyzji, nazywamy testem (statystycznym).
Ogólny schemat postępowania.
1. Formułujemy dwie wzajemnie wykluczające się hipotezy: H0 (zerowa) i H1 (alternatywna).
2. Określamy poziom istotności testu α ∈ (0, 1) (standardowo α = 0.05). Jest to prawdopodobieństwo popełnienia błędu I rodzaju.
1
Błąd I rodzaju - prawdziwa jest H0, a my ją odrzucamy.
Błąd II rodzaju - prawdziwa jest H1, a my decydujemy
na rzecz H0.
stan rzeczy/decyzja przyjąć H0
przyjąć H1
H0 prawdziwa
OK
błąd I rodzaju
H1 prawdziwa
błąd II rodzaju
OK
Pożądane jest, by prawdopodobieństwa popełnienia błędów obu rodzajów były jak najmniejsze. Okazuje się,
że tego nie da się zrobić jednocześnie. Wobec tego postępujemy w sposób następujący: przede wszystkim staramy się kontrolować prawdopodobieństwo popełnienia
błędu I rodzaju. Właśnie dlatego staramy się, przy już
sformułowanych hipotezach, oznaczyć je tak, by popełnienie błędu I rodzaju miało gorsze skutki.
3. Wybieramy statystykę (nazywamy ją statystyką testową, której rozkład potrafimy określić (nie może on
zależeć od nieznanych parametrów) przy założeniu prawdziwości hipotezy H0. Zgodnie z tym rozkładem oraz
przyjętą wartością α określamy tzw. zbiór krytyczny
K. Jest to podzbiór R taki, że prawdopodobieństwo
wpadnięcia do K zmiennej losowej o określonym wyżej
rozkładzie wynosi właśnie α (czyli jest bardzo małe).
4. Jeśli obliczona na podstawie próbki wartość staty2
styki testowej wpada do K, to hipotezę H0 odrzucamy.
Jeśli obliczona wartość statystyki testowej nie wpada
do K, to nie mamy podstaw do odrzucenia H0.
Uwaga. Decyzje brzmią różnie!
Testy dotyczące wartości oczekiwanej (1 próbka).
1. H0 : µ = µ0
H1 : µ ̸= µ0 lub µ < µ0 lub µ > µ0.
2. Określamy α ∈ (0, 1).
3. Rozważamy trzy sytuacje:
3a. cecha ma rozkład normalny, wariancja σ 2 jest znana;
3b. cecha ma rozkład normalny, wariancja σ 2 nie jest
znana;
3c. cecha ma rozkład dowolny, ale n jest duże.
3a. Jeśli H0 jest prawdziwa, to {xi} - niezależne zmienne
σ2
2
losowe
o
rozkładzie
N
(µ
,
σ
)
=⇒
x̄
∼
N
(µ
,
0
√ x̄−µ0
√ x̄−µ00 n ) =⇒
n σ ∼ N (0, 1). Zatem bierzemy n σ jako statystykę testową.
Postać zbioru krytycznego K zależy od postaci hipotezy alternatywnej H1. Pod tym względem rozróżniamy:
dwustronny obszar krytyczny
K = (−∞, −z1−α/2)∪(z1−α/2, ∞) (gdy H1 : µ ̸= µ0);
3
lewostronny obszar krytyczny
K = (−∞, −z1−α) (gdy H1 : µ < µ0);
prawostronny obszar krytyczny
K = (z1−α, ∞) (gdy H1 : µ > µ0).
√ x̄−µ0
3b. Statystyka testowa ma postać n s ; przy prawdziwości hipotezy H0 ma ona rozkład Studenta o (n−1)
stopniach swobody.
Obszary krytyczne:
K = (−∞, −t1−α/2,n−1) ∪ (t1−α/2,n−1, ∞) lub
K = (−∞, −t1−α,n−1) lub K = (t1−α,n−1, ∞).
√ x̄−µ0
3c. Statystyka testowa ma postać n s ; przy prawdziwości hipotezy H0 ma ona (na mocy CTG, w przybliżeniu) rozkład N (0, 1).
Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
4. Podejmujemy decyzje.
Przykład (test dotyczący proporcji)
H0 : p = p0, H1 : p ̸= p0 lub p < p0 lub p > p0.
√
Statystyka testowa ma postać n √ pb−p0 ; przy prawp0 (1−p0 )
dziwości hipotezy H0 ma ona (na mocy Twierdzenia de
Moivre’a-Laplace’a, w przybliżeniu) rozkład N (0, 1).
4
Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
Pojęcie p-wartości. Jeśli zaobserwowana wartość statystyki testowej S to s0, to p-wartość określamy jako:
p = P (|S| > s0), jeśli obszar krytyczny jest dwustronny;
p = P (S < s0), jeśli obszar krytyczny jest lewostronny;
p = P (S > s0), jeśli obszar krytyczny jest prawostronny.
Teraz podejmujemy decyzję na podstawie porównania
p-wartości z poziomem istotności testu α :
jeśli p < α, to odrzucamy H0;
jeśli p > α, to nie mamy podstaw do odrzucenia H0.
Testy dotyczące wartości oczekiwanej (2 próbki).
H0 : µ1 = µ2, H1 : µ1 ̸= µ2 lub µ1 < µ2 lub µ1 > µ2.
(1)
(1)
(a) Mamy niezależne próbki: x1 , . . . , xn1 ∼ N (µ1, σ12);
(2)
(2)
x1 , . . . , xn2 ∼ N (µ2, σ22); σ1, σ2 są znane.
Statystyka testowa ma postać
x̄ − x̄
√1 2 2 2 ;
σ1
σ2
+
n1
n2
przy prawdziwości hipotezy H0 ma ona rozkład N (0, 1).
5
Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
(1)
(1)
(b) Mamy niezależne próbki: x1 , . . . , xn1 ∼ N (µ1, σ12);
(2)
(2)
x1 , . . . , xn2 ∼ N (µ2, σ22); σ1, σ2 są nieznane, σ1 = σ2.
Statystyka testowa ma postać
x̄1 − x̄2
√
;
(n1 −1)s21 +(n2 −1)s22 n1 +n2
· n1n2
n1 +n2 −2
przy prawdziwości hipotezy H0 ma ona rozkład Studenta o (n1 + n2 − 2) stopniach swobody.
Obszary krytyczne:
K = (−∞, −t1−α/2,n1+n2−2) ∪ (t1−α/2,n1+n2−2, ∞) lub
K = (−∞, −t1−α,n1+n2−2) lub K = (t1−α,n1+n2−2, ∞).
(1)
(1)
(2)
(2)
(c) Mamy niezależne próbki: x1 , . . . , xn1 oraz x1 , . . . , xn2
o nieznanych wariancjach, ale n1, n2 są duże. Statystyka testowa ma postać
x̄ − x̄
√1 2 22 ;
s1
s2
+
n1
n2
przy prawdziwości hipotezy H0 ma ona (na mocy CTG,
w przybliżeniu) rozkład N (0, 1).
6
Obszary krytyczne:
K = (−∞, −z1−α/2) ∪ (z1−α/2, ∞) lub
K = (−∞, −z1−α) lub K = (z1−α, ∞).
(1)
(1)
(2)
(2)
(d) Mamy zależne próbki: x1 , . . . , xn oraz x1 , . . . , xn ;
(1)
(2)
obie mają rozkład normalny. Oznaczmy: di = xi − xi .
√ ¯
Statystyka testowa ma postać n sd ; przy prawdziwod
ści hipotezy H0 ma ona rozkład Studenta o (n − 1)
stopniach swobody (porównaj z 3b).
Obszary krytyczne:
K = (−∞, −t1−α/2,n−1) ∪ (t1−α/2,n−1, ∞) lub
K = (−∞, −t1−α,n−1) lub K = (t1−α,n−1, ∞).
7