wykład 9 Testowanie hipotez cd

Transkrypt

wykład 9 Testowanie hipotez cd
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
WYKŁAD 9
TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Było:
Przykład 1. Badano
krąŜek
o
wymiarach
zbliŜonych
do
monety
jednozłotowej ze stronami oznaczonymi: A, B. NaleŜy ustalić,
czy krąŜek jest symetryczny?
(w wyniku rzutów tym krąŜkiem z jednakową częstością będzie pojawiać
się kaŜda ze stron).
Wykonano n = 10 rzutów, otrzymano k A = 2 wyników A.
Cecha X – liczba wyników A, X ~ B(n=10; p), p- nieznane.
Hipoteza zerowa H 0 : p = 0,5
Poziom istotności α = 0,05; obszar krytyczny dla hipotezy: { 0, 1, 2, 8, 9, 10};
wniosek statystyczny: hipotezę zerową odrzucamy;
wniosek merytoryczny: krąŜek nie jest symetryczny.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X ~ N(µ, σ 2 ), µ, σ 2 - nieznane parametry,
2. próba losowa: x 1 , x 2 , ...x n ; n – liczebność próby;
H 0 : µ = µ 0 (porównanie z normą), test t-Studenta; poziom istotności α.
t emp =
Funkcja testowa:
x − µ0
⋅ n
s
Wnioskowanie 1:
jeŜeli | t emp | > t α,
n-1 ,
to hipotezę H 0 odrzucamy, w przeciwnym przypadku
H 0 nie moŜna odrzucić.
Wnioskowanie 2 (równowaŜne z wnioskowaniem 1):
jeŜeli wartość p < α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku
H 0 nie moŜna odrzucić.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Przykład 2. Cecha X – masa owocu pewnej odmiany.
ZałoŜenie: X ~ N(µ, σ 2 ), gdzie µ, σ 2 – nieznane.
Hipoteza zerowa H0: µ = 200, test t-Studenta, poziom istotności α = 0,05.
Próba: 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2; n=10;
parametry próby: x = 194 ,46 g , s = 5,19 g.
Wartość empiryczna funkcji testowej
t emp =
x − µ0
194,46 − 200
⋅ n=
⋅ 10 = −3,3755 .
s
5,19
Wartość krytyczna funkcji testowej t α,n-1 = t 0,05, 9 = 2,2622.
Wniosek statystyczny):| t emp | =3,3375> 2,2622 = t 0,05,9 , zatem hipotezę
zerową H 0 odrzucamy.
Wniosek merytoryczny: nie moŜna przyjąć, Ŝe średnia masa owocu tej odmiany
wynosi 200 g.
Matematyka i statystyka matematyczna dla rolników w SGGW
Uwaga 1....ODRZUCIĆ / NIE ODRZUCIĆ
Uwaga 2.... HIPOTEZY: ZEROWA – ALTERNATYWNA
Anna Rajfura, KDiB
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Przykład. 3. Średnia zawartość skrobi w bulwach ziemnaków w pewnym
rejonie uprawy kształtuje się na poziomie 18%. Hodowca nowej odmiany
twierdzi, Ŝe zawartość skrobi u tej odmiany jest mniejsza niŜ 18%.
Pobrano
10-elementową
próbę,
w
której
średnia
wyniosła
16%,
a odchylenie standardowe 3%. Zweryfikuj odpowiednią hipotezę na
poziomie istotności 0,05. Przyjmij, Ŝe zawartość skrobi ma rozkład
normalny z nieznanymi parametrami.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X ~ N(µ, σ 2 ), µ, σ 2 - nieznane parametry,
2. próba losowa: x 1 , x 2 , ...x n ; n – liczebność próby;
H 0 : µ = µ 0 (porównanie z normą), test t-Studenta; poziom istotności α.
Funkcja testowa:
t emp =
x − µ0
⋅ n
s
H 0 odrzucamy, gdy:
• H 1 : µ > µ 0 , t emp > t 2α, n-1 ;
• H 1 : µ < µ 0 , t emp < -t 2α, n-1 ;
• H 1 : µ ≠ µ 0 , |t emp | > t α, n-1 .
w przeciwnym przypadku H 0 nie moŜna odrzucić.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Błędy wnioskowania o prawdziwości hipotezy zerowej
Wniosek
Stan rzeczywisty
H 0 prawdziwa
H 0 nieprawdziwa
odrzucić H 0
nie odrzucać H 0
błąd I rodzaju, pstwo = α
wniosek prawidłowy
wniosek prawidłowy
błąd II rodzaju, pstwo = β
(fałszywa)
Błąd I rodzaju - błąd wnioskowania polegający na odrzuceniu hipotezy zerowej,
która jest prawdziwa; pstwo wystąpienia tego błędu powinno być małe, np.
α = 0,05 lub α = 0,01; α - poziom istotności testu.
Błąd II rodzaju - błąd wnioskowania polegający na nieodrzuceniu hipotezy
zerowej, która jest fałszywa.
Uwaga 3...
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X 1 ~N(µ 1 , σ 2 ), cecha X 2 ~N(µ 2 , σ 2 ), µ 1 , µ 2 , σ 2 - nieznane parametry,
2. pobrano n 1 – elementową próbę losową z pierwszej populacji
n 2 -elementową próbę losową z drugiej populacji.
oraz
H 0 : µ 1 = µ 2 (porównanie średnich w dwóch populacjach), test t-Studenta, poziom
istotności α.
x1 − x2
t
=
emp
Funkcja testowa:
sr
gdzie:
1 1
sr = se2  + 
 n1 n2 
błąd stand. róŜnicy średnich,
s12 ⋅ (n1 − 1) + s22 ⋅ (n2 − 1)
s =
wspólna wariancja
n1 + n2 − 2
Wnioskowanie 1: jeŜeli |t emp |>t α,n1+n2-2 , to hipotezę H 0 odrzucamy, w przeciwnym
2
e
przypadku H 0 nie moŜna odrzucić.
Wnioskowanie 2: jeŜeli p<α, to
przypadku H 0 nie moŜna odrzucić.
hipotezę
H0
odrzucamy,
w przeciwnym
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X 1 ~N(µ 1 , σ 1 2 ), cecha X 2 ~N(µ 2 , σ 2 2 ), µ 1 , µ 2, σ 1 2 , σ 2 2 - nieznane parametry,
2. pobrano n 1 – elementową próbę losową z pierwszej populacji oraz n 2 –
elementową próbę losową z drugiej populacji.
H 0 : σ 1 2 = σ 2 2 (porównanie wariancji w dwóch populacjach), test F-Fishera,
poziom istotności α.
max ( s12 , s22 )
Femp =
Funkcja testowa:
min ( s 2 , s 2 )
1
Wnioskowanie 1:
jeŜeli
F emp > F
2
α/2, v licz, v mian ,
to
hipotezę
H0
odrzucamy,
w przeciwnym przypadku H 0 nie moŜna odrzucić.
UWAGA: v licz – liczba stopni swobody dla licznika, v mian - liczba stopni
swobody dla mianownika,
v i = n i – 1.
Wnioskowanie 2: jeŜeli wartość p<α, to hipotezę H 0 odrzucamy, w przeciwnym
przypadku H 0 nie moŜna odrzucić.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X 1 ma rozkład dwupunktowy z nieznanym parametrem p 1 ,
2. cecha X 2 ma rozkład dwupunktowy z nieznanym parametrem p 2 ,
3. pobrano n 1 – elementową próbę losową z pierwszej populacji oraz n 2 –
elementową próbę losową z drugiej populacji, k i – liczba elementów
ki
k1 + k 2
p
=
p
=
wyróŜnionych w i-tej próbie; i n ,
n1 + n 2 .
i
H 0 : p 1 = p 2 (porównanie frakcji w dwóch populacjach), test przybliŜony u
(dla duŜych prób), poziom istotności α.
u emp =
Funkcja testowa:
Wnioskowanie:
jeŜeli
u emp
p1 − p2

1 
+ 
 n1 n 2 
1
p (1 − p )
≥u
1−
α
2
,
to
hipotezę
w przeciwnym przypadku H 0 nie moŜna odrzucić.
H0
odrzucamy,
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Przykład. Porównywano odmiany bobiku A oraz B pod względem średniej liczby
nasion w strąku. Otrzymano wyniki:
x A = 4,05 , s A = 2 ,892 , n A = 20 , xB = 3,53 , s B = 2 ,981 , nB = 15 .
2
2
Zweryfikuj odpowiednią hipotezę na poziomie istotności 0,05. Przyjmij, Ŝe
badane cechy mają niezaleŜne rozkłady normalne z jednakowymi wariancjami.
Wartości krytyczne rozkładu t-Studenta
X ~ tν - X zmienna losowa o rozkładzie t-Studenta z liczbą stopni swobody v,
α - poziom istotności,
t α , ν - wartość krytyczna - liczba taka, Ŝe P(|X| > t α , ν ) = α
ν \ α
1
:
26
27
28
29
30
0,400 0,300 0,200 0,100 0,050
0,025
0,025
0,010
0,005
0,001
1,3764 1,9626 3,0777 6,3137 12,7062 25,4519 25,4519 63,6559 127,3211 636,5776
0,8557
0,8551
0,8546
0,8542
0,8538
1,0575
1,0567
1,0560
1,0553
1,0547
1,3150
1,3137
1,3125
1,3114
1,3104
1,7056
1,7033
1,7011
1,6991
1,6973
2,0555
2,0518
2,0484
2,0452
2,0423
2,3788
2,3734
2,3685
2,3638
2,3596
2,3788
2,3734
2,3685
2,3638
2,3596
2,7787
2,7707
2,7633
2,7564
2,7500
3,0669
3,0565
3,0470
3,0380
3,0298
3,7067
3,6895
3,6739
3,6595
3,6460
35
40
45
50
55
60
0,8520
0,8507
0,8497
0,8489
0,8482
0,8477
1,0520
1,0500
1,0485
1,0473
1,0463
1,0455
1,3062
1,3031
1,3007
1,2987
1,2971
1,2958
1,6896
1,6839
1,6794
1,6759
1,6730
1,6706
2,0301 2,3420
2,3420
2,3289
2,3189
2,3109
2,3044
2,2990
2,7238
2,7045
2,6896
2,6778
2,6682
2,6603
2,9961
2,9712
2,9521
2,9370
2,9247
2,9146
3,5911
3,5510
3,5203
3,4960
3,4765
3,4602
2,0211
2,0141
2,0086
2,0040
2,0003
2,3289
2,3189
2,3109
2,3044
2,2990
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Przykład. Z dwóch zbiorników wodnych pobrano siedmioelementowe próbki
wody
do
analizy
gęstości
fitoplanktonu
na
podstawie
koncentracji
2
2
zielononiebieskich alg. Otrzymano wyniki: s1 = 6 ,9495 , s2 = 40 ,1248 .
Na poziomie istotności 0,1 zweryfikuj hipotezę o jednakowej zmienności
fitoplanktonu w obu zbiornikach wobec hipotezy alternatywnej zakładającej, Ŝe
zmienność jest róŜna. Przyjmij, Ŝe gęstości mają niezaleŜne rozkłady normalne.
Wartości krytyczne rozkładu F-Snedecora
X ~ Fν1, ν2 - X zmienna losowa o rozkładzie F- Snedecora z liczbami stopni swobody (ν1, ν2)
poziom istotności α =0,05,
Fα, ν1, ν2 - wartość krytyczna - liczba taka, Ŝe P(X > Fα, ν1, ν2 ) = α
v1
v2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1 161,446 199,499 215,707 224,583 230,160 233,988 236,767 238,884 240,543 241,882 242,981 243,905 244,690 245,363 245,949
2 18,513 19,000 19,164 19,247 19,296 19,329 19,353 19,371 19,385 19,396 19,405 19,412 19,419 19,424 19,429
3 10,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,785 8,763 8,745 8,729 8,715 8,703
4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,936 5,912 5,891 5,873 5,858
5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,704 4,678 4,655 4,636 4,619
6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,027 4,000 3,976 3,956 3,938
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Przykład. W dwóch dzielnicach miasta przeprowadzono ankietę na temat
sortowania odpadków w gospodarstwach domowych. Otrzymano następujące
wyniki: w pierwszej na 210 ankietowanych gospodarstw w 55 sortowano
odpadki, natomiast w drugiej na 130 gospodarstw w 51 sortowano odpadki. Na
poziomie istotności 0,01 zweryfikuj hipotezę o jednakowej frakcji gospodarstw
sortujących odpadki w obu miastach.
Dystrybuanta standardowego rozkładu normalnego
X – zmienna losowa, f(x) – funkcja gęstości, F(x) – dystrybuanta X~N (0, 1),
f (x) =
x
0,0
:
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
1
2π
e
−
x2
2
x
,
F(x)=
∫ f ( t ) dt
−∞
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB