Anne prawdziwa masa

Transkrypt

Anne prawdziwa masa
Temat
Testowanie hipotez
statystycznych
Kody znaków:
Ŝółte wyróŜnienie – nowe pojęcie
pomarańczowy – uwaga
kursywa – komentarz
Anna Rajfura
1
Zagadnienia omawiane na zajęciach
Przykłady testowania hipotez dotyczących:
a. średniej z rozkładu normalnego
b. porównaniu dwóch średnich
z rozkładów normalnych
c. porównaniu dwóch wariancji
z rozkładów normalnych
d. porównaniu dwóch frakcji
z rozkładów dwupunktowych
Anna Rajfura
2
Był problem estymacji
Cecha X – waga jednego owocu pewnej
odmiany
ZałoŜenie
Cecha X ma w populacji rozkład normalny,
X ~ N( µ , σ 2 ), gdzie µ , σ 2 – nieznane
µ – średnia wartość cechy X dla odmiany,
σ 2 – wariancja cechy X dla odmiany
Cel
Wyznaczyć ocenę średniej wagi jednego
owocu tej odmiany µ (wyestymować µ )
Anna Rajfura
3
Był problem cd.
Działanie
Estymujemy parametr µ na podstawie
wylosowanej próby: x 1 , x 2 , ..., x n ;
np. 191,2; 193,0; 195,1; 184,3; 197,6;
200,8; 194,2; 198,7; 189,5; 200,2
Wynik
Średnia dla próby wynosi
x = 194 ,46 g
Ocena przedziałowa µ (przedział ufności)
μ ∈ (190,75 ; 198,17) P = 95%
Anna Rajfura
4
Jest problem
Cecha X – waga owocu pewnej odmiany
ZałoŜenie
Cecha X ma w populacji rozkład normalny,
X ~ N( µ , σ 2 ), gdzie µ , σ 2 – nieznane
Cel
Wyestymować ocenę średniej wagi jednego
owocu tej odmiany µ.
Odpowiedzieć na pytanie (np.):
Czy moŜna przyjąć, Ŝe średnia waga jednego
owocu tej odmiany µ jest równa 200?
Decyzja: tak / nie
Anna Rajfura
5
Jest problem cd.
µ = 200
Badana hipoteza
Weryfikacja hipotezy
(Testowanie hipotezy)
tak / nie
Anna Rajfura
Decyzja
6
Terminologia i oznaczenia
Hipoteza statystyczna to dowolne
przypuszczenie dotyczące rozkładu p-stwa
cechy X (typ rozkładu, parametr rozkładu)
Testowaną (badaną, rozwaŜaną) hipotezę
nazywamy hipotezą zerową, ozn.: H 0
Hipoteza alternatywna, ozn. H 1 – przyjmujemy
ją przy odrzuceniu H 0
Mówimy: weryfikujemy hipotezę zerową H 0
przeciwko hipotezie alternatywnej H 1
Funkcja testowa (test), ozn. np.: t -Studenta,
F -Fishera, χ 2 chi-kwadrat
Anna Rajfura
7
Terminologia i oznaczenia
Wartość empiryczna funkcji testowej (wartość
funkcji testowej dla próby), np.: t e m p , F em p ,
χ2emp.
Poziom istotności
α
– akceptowalne p-stwo popełnienia błędu
(przy
α
α
odrzucaniu
= 0,01 ,
α
hipotezy
prawdziwej),
np.
= 0,05
Wartość krytyczna funkcji testowej (testu)
np.: t k ry t , F k ry t , χ 2 k ry t ;
Anna Rajfura
8
Testowanie hipotezy
1. Formułujemy hipotezę zerową H 0
2. Wybieramy test do zbadania hipotezy
3. Przyjmujemy poziom istotności α
(wyznaczamy obszar krytyczny testu)
4. Losujemy próbę
5. Wyznaczamy wartości testu dla tej próby
6. Formułujemy wniosek odnośnie hipotezy
(hipotezę odrzucamy/nie odrzucamy)
Anna Rajfura
9
Hipoteza alternatywna H 1
Hipoteza alternatywna, ozn. H 1 –
przyjmujemy ją przy odrzuceniu H 0
Mówimy:
Weryfikujemy hipotezę zerową H 0
przeciwko hipotezie alternatywnej H 1
Anna Rajfura
10
Błędy wnioskowania
WNIOSEK
STAN
RZECZYWISTY
H0
prawdziwa
ODRZUCIĆ
H0
NIE
ODRZUCAĆ
H0
błąd I
rodzaju,
wniosek
prawidłowy
pstwo =
H0
nieprawdziwa
(fałszywa)
Anna Rajfura
α
wniosek
prawidłowy
błąd II
rodzaju,
pstwo =
β
11
Moc testu
Procedury testowe konstruowane są w taki
sposób, aby przy ustalonej wartości
wartość
β
α,
była jak najmniejsza.
Moc testu = 1- β (pstwo odrzucenia
fałszywej hipotezy zerowej).
Anna Rajfura
12
Hipoteza H 0 :
μ
=
μ0
ZałoŜenia:
1. cecha X ~ N( μ , σ 2 ), μ , σ 2 - nieznane
2. próba losowa: x 1 , x 2 , ..., x n ;
n
– liczebność próby
H 0 : μ = μ 0 (porównanie z normą)
test t - Studenta ; poziom istotności α
Funkcja testowa:
temp
Anna Rajfura
x − μ0
=
⋅ n
s
13
Hipoteza H 0 :
μ
=
μ0
cd.
Wnioskowanie 1:
jeŜeli | t emp | > t α,v= n-1 , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Wnioskowanie 2 (równowaŜne
z wnioskowaniem 1):
jeŜeli wartość p < α , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Anna Rajfura
14
Przykład H 0 :
μ
= 200
Cecha X – masa owocu pewnej odmiany.
ZałóŜmy, Ŝe X ~ N( μ ,
σ 2 ), μ , σ 2
Hipoteza zerowa H 0 :
μ
– nieznane
= 200
Test t -Studenta,
poziom istotności
α
=0,05
Próba: 191,2; 193,0; 195,1; 184,3; 197,6;
200,8; 194,2; 198,7; 189,5; 200,2
Anna Rajfura
15
Przykład H 0 :
μ
= 200 cd.
Parametry próby:
n =10,
x = 194,46 g ,
s
= 5,19 g
Wartość empiryczna funkcji testowej:
t emp
x − μ0
194,46 − 200
=
⋅ n=
⋅ 10 = −3,3755
s
5,19
Wartość krytyczna funkcji testowej
t
α,v = n-1
Anna Rajfura
= t
0,05, 9
= 2,2622
16
Przykład H 0 :
μ
= 200 cd.
Wnioskowanie 1 (wniosek statystyczny):
| t emp | =3,3375> 2,2622 = t 0,05,9 , zatem
hipotezę zerową H 0 odrzucamy.
Wniosek merytoryczny:
nie moŜna przyjąć, Ŝe średnia masa owocu
tej odmiany wynosi 200 g.
Anna Rajfura
17
Wartości krytyczne rozkładu t-Studenta
X ~ tν -
X zmienna losowa o rozkładzie t-Studenta z liczbą stopni swobody v,
α - poziom istotności,
t α , ν - wartość krytyczna - liczba taka, Ŝe P(|X| > t α , ν ) = α
ν \
α 0,400 0,300 0,200 0,100
1
2
3
4
5
6
7
8
9
10
11
12
0,050
0,025 0,010 0,005 0,001
1,3764
1,9626
3,0777
6,3137
12,7062
25,4519
63,6559
1,0607
1,3862
1,8856
2,9200
4,3027
6,2054
9,9250
14,0892
31,5998
0,9785
1,2498
1,6377
2,3534
3,1824
4,1765
5,8408
7,4532
12,9244
0,9410
1,1896
1,5332
2,1318
2,7765
3,4954
4,6041
5,5975
8,6101
0,9195
1,1558
1,4759
2,0150
2,5706
3,1634
4,0321
4,7733
6,8685
0,9057
1,1342
1,4398
1,9432
2,4469
2,9687
3,7074
4,3168
5,9587
0,8960
1,1192
1,4149
1,8946
2,3646
2,8412
3,4995
4,0294
5,4081
0,8889
1,1081
1,3968
1,8595
2,3060
2,7515
3,3554
3,8325
5,0414
0,8834
1,0997
1,3830
1,8331
2,2622
2,6850
3,2498
3,6896
4,7809
0,8791
1,0931
1,3722
1,8125
2,2281
2,6338
3,1693
3,5814
4,5868
0,8755
1,0877
1,3634
1,7959
2,2010
2,5931
3,1058
3,4966
4,4369
0,8726
1,0832
1,3562
1,7823
2,1788
2,5600
3,0545
3,4284
4,3178
Anna Rajfura
127,3211 636,5776
18
Przykład H 0 :
H0:
μ
=
μ0
hipoteza zerowa
Anna Rajfura
μ
= 200 cd.
H1:
μ
≠
μ0
hipoteza alternatywna
19
Hipoteza H 0 :
μ1 = μ2
ZałoŜenia:
1. cecha X 1 ~N( μ 1 ,
σ 2 ),
cecha X 2 ~N( μ 2 ,
σ 2 ),
μ1, μ2, σ2-
nieznane parametry,
2. pobrano n 1 – elementową próbę
z pierwszej populacji oraz n 2 -elementową
próbę z drugiej populacji
H0: μ1 = μ2
test t-Studenta ,
Anna Rajfura
H1: μ1 ≠ μ2
poziom istotności
α
20
Hipoteza H 0 :
μ1 = μ2
cd.
Funkcja testowa:
t emp
x1 − x 2
=
sr
gdzie:
sr =
1
1

s 
+
 błąd stand. róŜnicy średnich,
n
n
2 
 1
2
e
2
2
(
)
1
s
⋅
n
−
+
s
2
1
1
2 ⋅ (n2 − 1)
se =
wspólna wariancja;
n1 + n2 − 2
Anna Rajfura
21
Hipoteza H 0 :
μ1 = μ2
cd.
Wnioskowanie 1:
jeŜeli | t emp |> t α, v , to hipotezę H 0 odrzucamy,
w przeciwnym przypadku H 0 nie moŜna
odrzucić.
v = n1 + n2 - 2
Wnioskowanie 2:
jeŜeli p < α , to hipotezę H 0 odrzucamy,
w przeciwnym przypadku H 0 nie moŜna
odrzucić.
Anna Rajfura
22
Zadanie. Hipoteza H 0 :
μ1 = μ2
Porównywano odmiany bobiku A oraz B pod
względem średniej liczby nasion w strąku.
Otrzymano wyniki:
x A = 4,05 s A 2 = 2 ,892 n A = 20 xB = 3,53 s B 2 = 2 ,981 nB = 15
Zweryfikuj odpowiednią hipotezę na poziomie
istotności 0,05. Przyjmij, Ŝe badane cechy
mają niezaleŜne rozkłady normalne z
jednakowymi wariancjami.
(Zapisz hipotezę zerową, alternatywną,
nazwę testu statystycznego, wartość
funkcji testowej, wniosek statystyczny i
merytoryczny)
Anna Rajfura
23
Hipoteza H 0 :
σ12 = σ22
ZałoŜenia:
1. cecha X 1 ~N( μ 1 ,
μ 1 , μ 2, σ 1 2 , σ 2 2
2. pobrano
n1
σ 1 2 ),
cecha X 2 ~N( μ 2 ,
- nieznane parametry,
– elementową próbę
z pierwszej populacji oraz
próbę z drugiej populacji.
H0: σ12 = σ22
test F -Fishera ,
Anna Rajfura
σ 2 2 ),
n2
– elementową
H1: σ12 ≠ σ22
poziom istotności
α.
24
Hipoteza H 0 :
σ12 = σ22
cd.
Funkcja testowa:
Femp =
Anna Rajfura
max ( s 21 , s22 )
min ( s 21 , s22 )
25
Hipoteza H 0 :
σ12 = σ22
Wnioskowanie 1:
jeŜeli F emp > F α/2, v licz, v mian , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
UWAGA:
v licz – liczba stopni swobody dla licznika ,
v mian - liczba stopni swobody dla
mianownika, v i = n i – 1.
Anna Rajfura
26
Hipoteza H 0 :
σ12 = σ22
Wnioskowanie 2:
jeŜeli wartość p < α , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Anna Rajfura
27
Zadanie. Hipoteza H 0 :
σ12 = σ22
Z dwóch zbiorników wodnych pobrano
siedmioelementowe próbki wody do analizy
gęstości fitoplanktonu na podstawie koncentracji
zielononiebieskich alg. Otrzymano wyniki:
s1 = 6 ,9495 , s2 = 40 ,1248 .
2
2
Na poziomie istotności
0,1 zweryfikuj hipotezę o jednakowej zmienności
fitoplanktonu w obu zbiornikach wobec hipotezy
alternatywnej zakładającej, Ŝe zmienność jest
róŜna. Przyjmij, Ŝe gęstości mają niezaleŜne
rozkłady normalne.
(Zapisz hipotezę zerową, alternatywną, nazwę
testu statystycznego, wartość funkcji testowej,
wniosek statystyczny i merytoryczny)
Anna Rajfura
28
Hipoteza H 0 :
p1 = p2
ZałoŜenia:
1. cecha X 1 ma rozkład dwupunktowy
z nieznanym parametrem p 1 ,
2. cecha X 2 ma rozkład dwupunktowy
z nieznanym parametrem p 2 ,
3. pobrano
n1
– elementową próbę
z pierwszej populacji oraz
n 2 – elementową
k i – liczba
próbę z drugiej populacji,
elementów wyróŜnionych w i -tej próbie;
ki
pi =
ni
Anna Rajfura
k1 + k 2
p =
n1 + n2
29
Hipoteza H 0 :
p1 = p2
cd.
H0: p1 = p2
H1: p1 ≠ p2
test przybliŜony u (dla duŜych prób),
poziom istotności α .
Funkcja testowa:
uemp =
Anna Rajfura
p1 − p 2
 1
1
p (1 − p ) + 
 n1 n2 
30
Hipoteza H 0 : p 1 = p 2
cd.
Wnioskowanie:
jeŜeli
uemp
≥u
1−
α
,
2
to hipotezę H 0 odrzucamy,
w przeciwnym przypadku H 0 nie moŜna
odrzucić.
Anna Rajfura
31
Zadanie. Hipoteza H 0 :
p1 = p2
W dwóch dzielnicach miasta
przeprowadzono ankietę na temat
sortowania odpadków w gospodarstwach
domowych. Otrzymano następujące wyniki:
w pierwszej na 210 ankietowanych
gospodarstw w 55 sortowano odpadki,
natomiast w drugiej na 130 gospodarstw
w 51 sortowano odpadki. Na poziomie
istotności 0,01 zweryfikuj hipotezę
o jednakowej frakcji gospodarstw
sortujących odpadki w obu miastach.
Anna Rajfura
32