1 Wªasno±ci rozkªadu normalnego

Transkrypt

1 Wªasno±ci rozkªadu normalnego
1 Wªasno±ci rozkªadu normalnego
Zmienna losowa
X
pochodzi z rozkªadu normalnego je»eli jej funkcja g¦sto±ci wyra»a si¦
wzorem:
f (x) = √
1.0.1
Podstawowe wªasno±ci rozkªadu normalnego
1. Standardowy rozklad normalny
2. Je»eli
X
ma rozkªad
N (µ, σ),
3. Je»eli
X
ma rozkªad
N (0, 1),
4.
N (0, 1)
to
to
Y
Y
ma rozkªad
ma rozkªad
N (0, 1), gdzie Y =
(X−µ)
;
σ
N (µ, σ) gdzie Y = σ · X + µ;
E[X] = µ, V ar[X] = σ 2 ;
X1 , X2 , . . . Xn
N (µ, √σn )
5. Je»eli
1.0.2
(x−µ)2
1
e− 2σ2
2πσ
jest prób¡ z rozkªadu normalnego
N (µ, σ)
to
X̄
ma rozkªad
Praktyczne u»ycie tablic statystycznych
Zadanie 1
Oblicz warto±ci Φ(z) dla z = 0, 1.96, −1, 0.56, −0.25, 1.5, 2.01, 3, 1.75
Zadanie 2
Znajd¹ warto±ci z , dla których Φ(z) = 0.5, 0.05, 0.95, 0.99, 0.90, 0.025, 0.01
Zadanie 3
Niech X b¦dzie zmienn¡ losow¡ o rozkªadzie N (0, 1) oblicz:
1. P (−0.55 < z < 0.37);
2. P (0.37 < z < 0.42);
3. P (−0.55 < z < −0.15).
Zadanie 4
Niech zmienna losowa X ma rozkªad N (2, 3) oblicz pradopodobie«stwa:
1. P (X > 2);
2. P (X < 1);
3. P (|X − 2| < 0.5);
4. P (X < 1).
Zadanie 5
Zmienna losowa ma rozkªad N (12, 4). Oblicz prawdopodobie«stwo P (x < 15).
‘rednia zawarto±¢ Hb we krwi kobiet wynosi 13.7g/100ml, wariancja 1.58. Jakie jest prawdopodobie«stwo, »e losowo pobrana do bada« krew kobiet zawiera co najmniej
12g/100ml?
Zadanie 6
Zadanie 7 Dostawca saªaty gwarantuje, »e ±rednia zawarto±¢ oªowiu w jego saªacie nie przekracza 0.10ppm. Kupuj¡cy poleciª sprawdzi¢ 16 losowo wybranych próbek saªaty i otrzymaª
w nich ±redni¡ zawarto±¢ oªowiu 0.11ppm z odchyleniem standardowym 0.02ppm. Oce« czy
gwarancja producenta jest uczciwa.
1
1.0.3
Wªasno±ci rozkªadu normalnego reguªa
3σ Dla rozkªadu normalnego ma zastosowanie tzw. prawo
3σ
mówi ono, »e ok.
68%
wszyst-
kich warto±ci zmiennej odbiega od ±redniej oczekiwanej nie bardziej ni» o jedno odchylenie
95% wszystkich warto±ci nie bardziej ni» o dwa odchylenia standardowe.
99.8% odbiega o nie wi¦cej ni» 3σ od warto±ci ±redniej.
Zatem w przedziale (µ − σ, µ) i (µ, µ + σ) zna jduje si¦ w przybli»eniu ok. 34% wszystkich
pomiarów. W przedziale (µ−2σ, µ) i (µ, µ+2σ) znajduje si¦ ok. 47.72% wszystkich pomiarów.
Po za tymi przedziaªami zna jduje si¦ ju» tylko po 2.25% pomiarów.
Kiedy X ma rozkªad normalny, wspomniane 95.5% odpowiada prawdopodobie«stwu, »e
95.5% wyników losowo wybranych zawiera si¦ w przedziale o ko«cach µ + 2σ .
standardowe, ok.
Natomiast ok.
1.1
Przedziaªy ufno±ci
Niech dana b¦dzie próba losowa
rzeczywistego
X1 , X2 , . . . Xn , której rozkªad zale»y od pewnego parametru
θ.
dla parametru θ na poziomie ufno±ci 1−α (0 < α < 1) nazywamy
(θ¯1 (X1 , . . . , Xn ), θ¯2 (X1 , X2 , . . . , Xn )) o wªasno±ci
Przedziaªem ufno±ci
przedziaª
P (θ¯1 (X1 , . . . , Xn ) ¬ θ ¬ θ¯2 (X1 , X2 , . . . , Xn )) = 1 − α
dla ka»dego
1.1.1
Niech
θ.
Przedziaª ufno±ci dla parametru poªo»enia
X1 , X2 , . . . , Xn b¦dzie to próba losowa przy czym prarametr µ jest nieznany natoσ jest znany. Bezpo±rednio z Centralnego Twierdzenia Granicznego otrzy-
miast parametr
mujemy, »e
√
√
P (X̄ − aα σ/ n ¬ µ ¬ X̄ + aα σ/ n) = 1 − α
Jest to przedziaª ufno±ci dla parametru
na poziomie istotno±ci
Uwaga 1
1.1.2
Niech
i
σ.
µ utworzony na podstawie próby losowej X1 , X2 , . . . Xn
1−α
W zagadnieniach praktycznych najcz¦±ciej parametr σ nie jest znany.
Przedziaª ufno±ci dla parametru poªo»enia (parametr
X1 , X2 , . . . , Xn
b¦dzie prób¡ prost¡ z rozkªadu normalnego
σ nie jest znany).
N (µ, σ)
o
nieznanych
µ
Zmienna losowa
n
t=
ma rozkªad
α
1 X
X̄ − µ √
2
n, (gdzie Sn−1
=
(Xi − X̄)2 )
Sn−1
n − 1 i=1
t − Studenta o n − 1 stopniach swobody. Niech t(α, n − 1) oznacza kwantyl rz¦du
tego rozkªadu. Wówczas
√
√
α
α
P (X̄ − t( , n − 1)Sn−1 / n < µ < X̄ + t(1 − , n − 1)Sn−1 / n) = 1 − α.
2
2
Nale»y oszacowa¢ »ywotno±¢ wyprodukowanej partii ±wietlówek.
Wiadomo, »e czas ±wiecenia ±wietlówek ma rozkªad normalny z odchyleniem standardowym σ = 120 godzin. Wylosowano niezale»nie z tej partii towaru n = 25 ±wietlówek,
otrzymano w ten sposób nast¦puj¡ce wyniki (pomiary czasu ±wiecenia w godzinach):
Zadanie 8
2630, 2820, 2900, 2810, 2770, 2840, 2700, 2950, 2690, 2720, 2800, 2970, 2680, 2660, 2820, 2580, 2840,
3020, 2780, 2920, 3060, 2840, 2550, 2790, 2850. Przyjmuj¡c wspóªczynnik ufno±ci 0.98 znale¹¢
przedziaª ufno±ci dla ±redniej.
2
W pewnym do±wiadczeniu medycznym bada si¦ czas snu pacjentów leczonych
na pewn¡ chorob¦. Zmierzono czas snu u n = 16 wylosowanych niezale»nie pacjentów i
otrzymano nast¦puj¡ce wyniki ( w minutach): 435, 533, 393, 458, 525, 481, 324, 437, 348,
503, 383, 395, 416, 533, 500, 488. Przujmuj¡c, »e czas snu ma rozkªad N (m, 70), oszacowa¢
±redni m czasu snu pacjentów przyj¡c wspóªczynnik ufno±ci 0.99.
Zadanie 9
W pewnym eksperymencie chemicznym bada si¦ czas caªkowitego zako«czenia
reakcji. Dokonano n = 60 niezale»nych do±wiadcze« i otrzymano z nich ±redni¡ x̄ = 46
sek oraz odchylenie standardowe s = 13 sek. Przyjmuj¡c wspóªczynnik ufno±ci 0.99 znajd¹
przedziaª ufno±ci dla ±redniego czasu reakcji.
Zadanie 10
W celach antropometrycznych wylosowano n = 400 studentów i dokonano pomiarów, mierz¡c mi¦dzy innymi dªugo±¢ ich stopy. Otrzymano z tej próby x̄ = 26.4 oraz
s = 1.7 cm. Znajd¹ 0.90 przedziaª ufno±ci dla ±redniej dªugo±ci stopy.
Zadanie 11
W celu oszacowania ±redniej miesi¦cznej kwoty wydatków studentów na rozrywki, wybrano losowo prób¦ n = 200 studentów i otrzymano z niej ±redni¡ x̄ = 120 oraz
s = 84 zª. Znale¹¢ 0.95 przedziaª ufno±ci dla ±redniej.
Zadanie 12
Zadanie 13 Dokonano n = 4 niezale»ne pomiary geªeboko±ci oceanu w pewnym regionie i
uzyskano nastepuj¡ce wyniki:
4.33, 4.58, 4.47, 4.50
Wyznaczy¢ przedziaª ufno±ci dla szacowanej ±redniej gª¦boko±ci oceanu w tym rejonie, przyjmuj¡c wspóªczynnik ufno±ci 0.99.
Czas potrzebny na opracowanie 1km2 mapy przez techników ma rozkªad normalny. W celu oszacowania ±redniego czasu potrzebnego na t¦ czynno±¢ dla pewnej kategorii
trudno±ci terenu, zmierzono czasy dla n = 21 techników wylosowanych niezale»nie i otrzymano nast¦puj¡ce wyniki (w godzinach): 4.00, 3.35, 3.18, 2.89, 3.60, 3.05, 3.71,
3.30, 3.42, 2.96, 3.56, 2.97, 2.78, 2.39, 3.16, 3.04, 2.54, 2.59, 3.62, 3.28, 2.76 . Znale¹¢ 0.95 przedziaª ufno±ci.
Zadanie 14
1.2
Przedziaªy ufno±ci dla proporcji
Nie zawsze badanie statystyczne jest prowadzone ze wzgl¦du na cech¦ mierzaln¡. Czasem
badana cecha ma charakter niemierzalny (jako±ciowy). Wtedy zamiast warto±ci liczbowej
badanej cechy uzyskujemy jedynie informacj¦ o tym czy badany element w populacji ma
badan¡ cech¦ jako±ciow¡ czy te» jej nie ma. Podstawowym celem badan jest frakcja elementów
wyró»nionych (wska¹nik struktury populacji) oznaczana zwykle przez
p.
Najlepszym oszacowaniem wska¹nika p jest m/n gdzie m- liczba elementów wyró»nionych znalezionych w losowej próbie n.
Uwaga 2
Uwaga 3 Kolejn¡ metod¡ jest konstrukcja przedziaªu ufno±ci dla wska¹nika p stosujemy
wtedy wzór:
m
− aα
n
r
m
n (1
−
n
m
n)
m
<p<
+ aα
n
r
m
n (1
−
n
m
n)
.
Chcemy oszacowa¢ jaki procent pracuj¡cych mieszka«ców Warszawy jada obiady
w stoªówkach pracowniczych. Pobrano w tym celu n = 900 osób wylosowanych niezale»nie
do próby i znaleziono w tej probie 300 osób, które jedz¡ obiady w takich stoªówkach. Przyjmuj¡c wspóªczynnik ufno±ci 0.95 zbudowa¢ przedziaª ufno±ci dla proporcji osób jadaj¡cych w
stoªówkach.
Zadanie 15
3
Zadanie 16 Spo±ród »arówek wykonanych przez pewn¦ fabryk¦ wylosowano niezale»nie n =
100 sztuk i sprawdzono ich jako±¢. 16 »arówek okazaªo si¦ zªych. Przyjmuj¡c wspóªczynnik
ufno±ci 0.99 oszacowa¢ procent braków w wyprodukowanej partii »arówek.
W celu wyznaczenia siªy kieªkowania pewnej nowej odmiany grochu, wykonano
w pewnym instytucie hodowli ro±lin do±wiadczenie polegaj¡ce na wysadzeniu 800 ziaren grochu tej nowej odmiany i badaniu ile ziaren wykieªkuje. Wykieªkowaªo 728 ziaren. Przyjmuj¡c
wspóªczynnik ufno±ci 0.95 oszacowa¢ siª¦ kieªkowania.
Zadanie 17
Zadanie 18
Odªowiono 10000 motyli w tym 5433 samic. Oblicz
1. proporcj¦ samic w tej próbie
2. przedziaª ufno±ci o wspóªczynniku ufno±ci 0.95.
1.3
Przedziaª ufno±ci dla wariancji
W badaniach statystycznych do na jcz¦±ciej szacowanych parametrów populacji nale»y wariancja
σ2
lub odchylenie standardowe
σ
badanej cechy. Gdy próba pochodzi z rozkªadu
normalnego (lub zbli»onego do normalnego), wtedy mo»na zbudowa¢ przedziaª ufno±ci dla
σ2 .
1.3.1
Model 1
Próba
X1 , X2 , . . . , Xn (n < 30) pochodzi z rozkªadu normalnego N (µ, σ) o nieznanych
µ i σ . Wowczas przedziaª ufno±ci dla wariancji okre±lony jest wzorem
pa-
rametrach
nSn2
nSn2
< σ2 <
c1
c2
gdzie
c1 i c2
s¡ warto±ciami zmiennej
χ2
dla
n−1
P (χ2 ¬ c1 ) =
stopni swobody tzn.
1
α
2
1
P (χ2 ­ c2 ) = 1 − α
2
Zadanie 19
w celu oszacowania dokladno±ci pewnego przyrz¡du pomiarowego dokonano nim
5 niezale»nych pomiarów dªugo±ci pewnego odcinka i otrzymano nast¦puj¡ce wyniki (w mm):
15.15, 15.20, 15.04, 15.14, 15.22. Przyjmuj¡c wspóªczynnik ufno±ci 0.98 zbudowa¢ przedziaª uf-
no±ci dla nieznanej wariancji pomiarów tym przyrz¡dem.
W celu oszacowania rozrzutu wagi jaj dostarcznych do pewnego sklepu dokonano
pomiarów wagi 15 jaj i otrzymano nast¦puj¡ce wyniki (w g): 62, 57, 70, 58, 59, 67, 65,
69, 55, 57, 60, 54, 72, 66, 74. przyjmuj¡c wspóªczynnik ufno±ci 0.96 zbudowa¢ przedziaª ufno±ci
dla wariancji wagi dostarczanych jaj.
Zadanie 20
W celu oszacowania rozrzutu wyników uzyskiwanych w zawodach sportowych w
trójskoku przez pewnego zawodnika wylosowano spo±ród jego wyników niezale»nie 10 wyników
i otrzymano:
Zadanie 21
16.02, 15.86, 16.33, 16.42, 16.11, 16.23, 16.32, 16.67, 16.08, 15.96.
Przyjmuj¡c wspóªczynnik ufno±ci 0.90 oszacowa¢ metod¡ przedziaªow¡ odchylenie standardowe wyników tego zawodnika w trójskoku.
4
1.4
Wyznaczanie nizb¦dnej liczby pomiarów do próby
1.4.1
Model I
N (µ, σ).
Populacja generalna ma rozkªad normalny
Chcemy oszacowa¢ nieznan¡ warto±¢
µ
Wariancja w populacji
liczby
d,
µ
(tj. poªowa dªugo±ci przedziaªu ufno±ci) nie przekroczyª z góry zadanej
uα
uα σ 2
d2
N (0, 1)
jest warto±ci¡ zmiennej normalnej
P (−uα < U < uα ) = 1 − α,
±redniej µ
sposób, »e
nieznanej
1.4.2
n niezale»1 − α maksymalny
to niezb¦dn¡ do uzyskania tego celu liczno±ci¡ próby oblicza si¦ ze wzoru:
n=
gdzie
jest znana.
populacji na podstawie próby zªo»onej z
nych pomiarów. Je»eli »¡damy, by przy ustalonym wspóªczynniku ufno±ci
bª¡d szacunku
σ2
a
d
odczytan¡ z tablicy dla
1−α
w taki
- dopuszczalnym ustalonym bª¦dem szacunku
Model II
Populacja generalna ma rozkªad normalny
N (m, σ). Wariancja σ 2
w populacji jest nieznana,
ale znana jest warto±¢ statytstyki
n
2
Ŝn−1
Chcemy oszacowa¢ nieznan¡ warto±¢
1 X
(Xi − X̄)2
n − 1 i=1
µ
bª¡d szacunku
liczby
d,
µ
n niezale»1 − α maksymalny
populacji na podstawie próby zªo»onej z
nych pomiarów. Je»eli »¡damy, by przy ustalonym wspóªczynniku ufno±ci
(tj. poªowa dªugo±ci przedziaªu ufno±ci) nie przekroczyª z góry zadanej
to niezb¦dn¡ do uzyskania tego celu liczno±¢ próby oblicza si¦ ze wzoru:
n=
gdziem
tα
1.4.3
Model III
2
tα Ŝn−1
d2
jest kwantylem z rozkªadu Studenta odczytanym z tablicy.
p (tzn, p jest frakcj¡ elementów
p na podstawie próby tak
liczby d, to niezb¦dn¡ do uzyskanie
Populacja generalna ma rozkªad dwupunktowy z parametrem
wyró»nionych w populacji). Chcemy oszacowa¢ nieznan¡ warto±¢
aby bª¡d szacunku dla
p
nie przekroczyª danej z góry
tego celu liczebno±¢ próby uzyskuje si¦ ze wzoru:
n=
u2α
4d2
Ile nale»y wylosowa¢ niezale»nie do próby krów pewnej rasy by oszacowa¢ ±redni¡ dzienn¡ wydajno±¢ mleka krowy tej rasy z bª¦dem maksymalnym 0.5l, je»eli wiadomo, »e
odchylenie standardowe wydajno±ci dziennej mleka krów tej rasy wynosi 2.5l, a przyjmuje si¦
wspóªczynnik ufno±ci 0.95
Zadanie 22
Zadanie 23 Ile sztuk pewnego wyrobu nale»y niezale»nie pobra¢ do kontroli wagi aby oszacowa¢ ±redni± wag¦ tego wyrobu z bª¦dem maksymalnym 0.5dkg przy wspóªczynniku ufno±ci
0.99, je»eli wiadomo, »e wariancja tej wagi wynosi 1.
Oblicz liczebno±¢ próby potrzebnej do oszacowania ±redniej szybko±ci pocz¡tkowej pocisku z okre±lonym ªadunkiem prochu, je»eli próba wst¦pna 9 pomiarów pr¦dko±ci pocz¡tkowej pocisków wystrzelonych daj¡ wyniki: 1002.3, 1003.1, 1001.3, 1001.2, 1007.2, 999.8, 1006.5, 1003.8.
»¡dany maksymalny bª¡d szacunku ±redniej szybko±ci wynosi 3m/s.
Zadanie 24
5
Ile nale»y wylosowa¢ niezale»nie puszek konserwowych do badania jako±ci pewnej partii konsew, aby oszacowa¢ procent zepsutych, który jest dopuszczalnie 10% z bª¦dem
maksymalnym 5% . Wspóªczynnik ufno±ci 0.90.
Zadanie 25
Ile egzemplarzy ksi¡»ek w pewnej uczelnianej bibliotece nale»y wylosowa¢ niezal»nie do próby aby oszacowa¢ na tej podstawie nieznany procent ksi¡»ek napisanych w
j¦zykach obcych a znajduj¡cych si¦ w bibliotece, z bª¦dem maksymalnym 4%. Wspóªczynnik
ufno±ci 0.9.
Zadanie 26
6
2 Testowanie hipotez statystycznych - testy dla ±redniej
2.1
Model I
Populacja generalna ma rozkªad normalny
w populacji jest znane.
N (µ, σ)
przy czym
odchylenie standardowe
Nale»y na podstawie próby losowej
n-
elementowej sprawdzi¢
hipotez¦:
• H0 : µ = µ0 (µ0
ustalona warto±¢);
• H1 : µ 6= µ0 .
Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡:
u=
x̄ − µ0 √
n.
σ
−4
−2
0
x
2
4
0.4
0.0
0.1
0.2
dnorm(x)
0.3
0.4
0.3
0.2
dnorm(x)
0.0
0.1
0.2
0.1
0.0
dnorm(x)
0.3
0.4
Z tablicy rozkªadu normalnego N (0, 1) wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡
uα , by dla zaªo»onego z góry maªego prawdopodobie«stwa α (poziomu istotno±ci) zachodziªa
równo±¢ P (|U | ­ uα ) = α. Uwaga t¦ statystyk¦ testow¡ stosujemy tak»e w przypadku
du»ych prób (podstawiaj¡c Sn zamiast σ ).
−4
−2
0
x
2
4
−4
−2
0
2
4
x
Rysunek 1: Obszary krytyczne dla testu dwustronnego oraz dla testów jednostronnych
7
Zadanie 27 Maj¡c rozkªad normalny N (16.25, 1.69) sprawdzi¢ czy pomiar z = 12.35 pochodzi z tego rozkªadu na poziomie istotno±ci α = 0.05.
Zadanie 28 W pewnym eksperymencie psychiatrycznym przeprowadzonym na grupie 42
chorych otrzymano nast¦puj¡ce wyniki: (w %) 34.8, 33.9, 32.6, 49.4, 44.9, 55.2, 48.5, 40.3,
34.0, 42.1, 17.9, 36.0, 21.2, 35.9, 41.2, 40.9, 16.9, 42.9, 28.7, 51.9, 24.1, 29.1, 44.6, 41.2,17.0,
29.8, 35.0, 51.7, 42.9,54.2,25.9, 30.3, 36.9, 19.2, 59.1, 31.3, 50.0, 19.8, 30.6, 31.7, 28.8,
30.0. Czy na podstawie tych danych mo»na twierdzi¢, »e ±redni wynik jest równy 50.
Zadanie 29 Zbadano w 81 wylosowanych zakªadach pewnej gaª¦zi przemysªowej koszty materiaªowe przy produkcji pewnego wyrobu i otrzymano ±redni¡ X̄ = 540 oraz Sn = 150. Na
poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e ±rednie koszty materiaªowe wynosz¡
600.
2.2
Model II
Populacja generalna ma rozkªad normalny
jest nieznane
N (µ, σ) przy czym odchylenie standardowe
n- elementowej sprawdzi¢ hipotez¦:
Nale»y na podstawie próby losowej
• H0 : µ = µ0 (µ0
ustalona warto±¢);
• H1 : µ 6= µ0 .
Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡:
u=
Z tablicy rozkªadu studenta
t(n − 1)
x̄ − µ0 √
n.
Sn−1
wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡
by dla zaªo»onego z góry maªego prawdopodobie«stwa
równo±¢
P (|T | ­ tα ) = α. Uwaga
α
tα ,
(poziomu istotno±ci) zachodziªa
test stosowany w przypadku maªych prób.
Wiadomo, »e rozkªad wyników pomiarow gª¦boko±ci morza w pewnym rejonie
jest normalny z odchyleniem standardowym 5 m. Dokonano 5 niezale»nych pomiarów i otrzymano wyniki (w m): 862, 870, 876, 866, 871. Na poziomie istotno±ci α = 0.05 zwerykowa¢
hipotez¦, »e ±rednia gª¦boko±¢ morza w tym rejonie jest równa 870 m.
Zadanie 30
Automat produkuje okre±lonych wymiarów blaszki o nominalnej grubo±ci 0.04
mm. Wylosowana próba 25 blaszek daªa ±redni¡ grubo±¢ x̄ = 0.037 mm oraz s = 0.05 mm.
Czy mo»na zatem twierdzi¢, »e produkowane blaszki s¡ cie«sze ni» 0.04 mm ? Przyj¡¢ poziom
ufno±ci α = 0.01.
Zadanie 31
Zadanie 32 Wylosowano niezale»nie 10 indywidualnych gospodarstw rolnych w pewnej wsi
i otrzymano dla nich nast¦puj¡ce wielko±ci uzyskanych plonów owsa (w q/ha);
18.1, 17.0, 17.5, 17.8, 18.3, 16.7, 18.0, 15.9, 17.6, 18.1.
Na poziomie istotno±ci α = 0.10 zwerykowa¢ hipotez¦, »e ±redni plon owsa w tej wsi wynosi
18q/ha.
Dokonano 22 niezale»nych pomiarów strat z osypania si¦ ziarna »yta w wylosowanych gospodarstwach rolnych w 1966 roku i otrzymano nast¦puj¡ce straty (w procentach)
6.05, 5.89, 5.82, 6.31, 5.26, 5.81, 6.40, 5.92, 6.12, 6.03, 5.47, 5.64, 6.06, 5.87, 5.69, 5.88,
5.49, 5.87, 5.83, 5.75, 5.97, 5.79. Przyjmuj¡c poziom istotno±ci α = 0.01 zwerykowa¢ hipotez¦, »e ±redni procent strat z osypania si¦ ziarna »yta wynosi 5.5.
Zadanie 33
8
3 Testowanie hipotez statystycznych - porównanie dwóch
±rednich
3.1
Model I
Badamy dwie populacje generalne ma j¡ce rozkªady normalne
σ1
lenia standardowe
i
σ2
s¡ znane (nie
N (µ1 , σ1 ), N (µ2 , σ2 ).
musz¡ by¢ równe).
niezale»nych prób, odpowiednio o liczebno±ciach
n1
i
n2
Odchy-
W oparciu o wyniki dwu
wylosowanych z tych populacji na-
le»y sprawdzi¢ hipotez¦:
• H0 : µ1 = µ2
;
• H1 : µ1 6= µ2 .
Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡:
x¯1 − x¯2
.
u= q 2
σ1
σ22
+
n1
n2
Z tablicy rozkªadu normalnego N (0, 1) wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡
uα , by dla zaªo»onego z góry maªego prawdopodobie«stwa α (poziomu istotno±ci) zachodziªa
równo±¢ P (|U | ­ uα ) = α. Uwaga t¦ statystyk¦ testow¡ stosujemy tak»e w przypadku
du»ych prób (podstawiaj¡c Sn zamiast σ ).
Pragniemy stwierdzi¢, czy sªuszne jest stwierdzenie, »e zatrudnione na tych
samych stanowiskach kobiety otzymuj¡ przeci¦tnie ni»sz¡ pªac¦ ni» m¦»czy¹ni. Z populacji
kobiet wylosowano niezale»nie prób¦ n1 = 100 kobiet i otrzymano ±redni¡ pªac¦ 2180 oraz
wariancj¦ Sn2 1 = 6400. Z populacji m¦»czyzn zatrudnionych na tych samych stanowiskach
wylosowano niezale»nie n2 = 80 i otrzymano ±redni¡ 2280 oraz wariancj¦ Sn2 2 = 10000. Na
poziomie istotno±ci α = 0.01 nale»y sprawdzi¢ hipotez¦, »e ±rednie pªace kobiet s¡ ni»sze.
Zadanie 34
Zbadano w losowo wybranych PGR-ach w woj. warszawskim i pozna«skim ±rednie plony buraka cukrowego. Wiadomo, »e w obu tych województwach plony buraka maj¡
rozkªad normalny z odchyleniem standardowym σ = 20q/ha. ‘rednia z próby o liczebno±ci
n1 = 6 wybranej z województwa warszawskiego wyniosªa 310q/ha, natomiast z próby o liczebno±ci n2 = 10 wylosowanej z woj. pozna«skiego wyniosªa 318q/ha. Przyjmuj¡c poziom
istotno±ci α = 0.1 sprawdzi¢ hipotez¦, »e ±rednie plony buraka cukrowego uzyskane przez
PGR-y obu województw s¡ jednakowe.
Zadanie 35
3.2
Model II
N (µ1 , σ1 ), N (µ2 , σ2 ). Odchyσ2 s¡ nieznane. W oparciu o wyniki dwu niezale»nych prób (maªe
o liczebno±ciach n1 i n2 wylosowanych z tych populacji nale»y spraw-
Badamy dwie populacje generalne ma j¡ce rozkªady normalne
lenia standardowe
próby),
σ1
odpowiednio
i
dzi¢ hipotez¦:
• H0 : µ1 = µ2
;
• H1 : µ1 6= µ2 .
Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡:
t= r
x¯1 − x¯2
2
2
(n1 −1)Sn
+(n2 −1)Sn
1 −1
2 −1
n1 +n2 −2
Z tablicy rozkªadu studenta
tα ,
.
( n11
+
1
n2 )
t(n1 + n2 − 2) wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡
α (poziomu istotno±ci) zacho-
by dla zaªo»onego z góry maªego prawdopodobie«stwa
dziªa równo±¢
P (|T | ­ tα ) = α. Uwaga
wa»ne zaªo»enie o równo±ci wariancji powinno by¢
testowane (test F).
9
W szitalu wylosowano prób¦ 16 pacjentów chorych na chorob¦ A oraz prób¦ 26
pacjentów chorych na chorob¦ B i dokonano pomiarów czasu snu tych pacjentów. Dla pacjentów chorych na chorob¦ A otrzynano nast¦puj¡ce wyniki (czas snu w minutach):
Zadanie 36
438, 154, 374, 250, 305, 299, 434, 432, 453, 445, 466, 413, 551, 342, 123, 508
a dla pacjentów chorych na chorob¦ B otrzymano
416 454, 400, 315, 373, 370, 203, 505, 372, 249, 285, 339, 439, 262, 372, 149,
275, 452, 320, 460, 392, 272, 263, 379, 309, 358.
Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦ o jednakowych ±rednich czasach snu
w obu grupach pacjentów.
Zmierzono w dwóch ulach ±rednic¦ komórek plastra zbudowanego przez pszczoªy.
Dla 7 wylosowanych komórek z pierwszego ula otrzymano nast¦puj¡ce wyniki:
Zadanie 37
5.36, 5.20, 5.28, 5.16, 5.30, 5.08, 5.23
analogicznie dla drugiego ula otrzymano:
5.15, 5.04, 5.30, 5.22, 5.19, 5.24, 5.12;
Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e ±rednie dªugo±ci komórek w plastrach pochodz¡cych z dwóch ró»nych uli s¡ równe.
Zbadano ilo±¢ piór sterówek w dwu grupach goª¦bi pochodz¡cych od hodowców
±l¡skich oraz mazowieckich. Dla 8 goª¦bi hodowanych na ‘l¡sku otrzymano nast¦puj¡ce wyniki
( liczba piór ):
Zadanie 38
42, 31, 30, 14, 38, 25, 17, 35
natomiast dla 10 goª¦bi hodowców mazowieckich otrzymano
40, 32, 38, 36, 43, 39, 24, 28, 36, 34.
Przyjmuj¡c poziom istotno±ci α = 0.1 zwerykowa¢ hipotez¦ o ró»nych gatunkach goª¦bi
(charakteryzuj¡cych si¦ ró»n¡ liczb¡ sterówek) hodowanych na ‘l¡sku i Mazowszu.
3.3
Model III (test t dla prób sparowanych)
Czasem w praktyce zdarza si¦, »e wyniki obu prób mo»emy traktowa¢ jako wyniki pomiarów
na tym samym elemencie populacji. Jest tak wtedy, gdy stanowi¡ one pary przyporz¡dkowa-
xi przed jak¡± operacj¡ i wynik yi
i. Mo»emy wtedy analizowa¢ wyniki obu prób jako wyniki jednej
zi = yi − xi . Testujemy nast¦puj¡ce zagadnienie:
nych sobie liczb. Typow¡ sytuacj¡ jest tu model: wynik
po niej dla tego samego
próby, bior¡c ró»nice
• H0 : µZ = 0
;
• H1 : µ1 6= 0.
Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡:
t= q
Z tablicy rozkªadu studenta
tα , by dla zaªo»onego z góry
równo±¢ P (|T | ­ tα ) = α.
t(nz − 1)
z̄
Sn2 z −1
√
nz .
wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡
maªego prawdopodobie«stwa
10
α
(poziomu istotno±ci) zachodziªa
Zadanie 39 W te±cie badaj¡cym pami¦¢ uczniów, dla 8 wylosowanych uczniów otrzymano
nast¦puj¡ce liczby zapami¦tanych przez nich elementów:
16, 13, 14, 21, 19, 18, 26, 17.
Natomiast po specjalnym treningu pami¦ci grupa ta wykazaªa nast¦puj¡ce wyniki:
21, 17, 20, 26, 23, 22, 21, 18.
Przyjmuj¡c poziom istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e trening zwi¦ksza liczb¦
zapami¦tanych przez uczniów elementów.
Zmierzono czas reakcji na pewien u 8 kierowców badanych w pracowni psychotechnicznej przed i w 15 minut po wypiciu 100g wódki. Wyniki przed wypiciem wódki byªy
nast¦puj¡ce (w sekundach):
Zadanie 40
0.22, 0.18, 0.16, 0.19, 0.20, 0.23, 0.17, 0.25
a po wypiciu wódki:
0.28, 0.20, 0.3, 0.19, 0.26, 0.28, 0.24.
Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e wódka zwi¦ksza czas reakcji na
bodziec.
4 Testowanie hipotez - testy dla wariancji
4.1
Model I
Populacja generalna ma rozkªad normalny
pulacji wylosowano niezale»nie
n
N (µ, σ)
o nieznanych parametrach
µ
i
σ.
Z po-
elementów do próby, na podstawie której nale»y sprawdzi¢
hipotez¦
• H0 : σ = σ0
;
• H1 : σ 6= σ0 .
Statystyka testowa przyjmuje posta¢:
χ2 =
2
(n − 1)Sn−1
σ02
H0 rozkªad chi2 z n − 1 stopniami
swobody. Dla ustalonego z góry poziomu istotno±ci α i dla n−1 stopni swobody odczytujemy z
2
2
2
2
tablicy rozkªadu χ tak¡ warto±¢ krytyczn¡ χα aby speªniona byªa równo±¢ P (χ ­ χα ) = α.
Statystyka ta ma przy zaªo»eniu prawdziwo±ci hipotezy
Dokonano 12 pomiarów woltomierzem pewnego napi¦cia pr¡du i otrzymano z
2
tej próby Sn−1
= 0.9V 2 . Nale»y na poziomie istotno±ci α = 0.05 sprawdzi¢ hipotez¦, »e
wariancja pomiarów tym woltomierzem wynosi 0.6V 2
Zadanie 41
Dokonano 11 niezale»nych pomiarów ±rednicy odlewanych rur i otrzymano nast¦puj¡ce wyniki w (mm):
Zadanie 42
50.2, 50.4, 50.6, 50.5, 49.9, 50, 50.3, 50.1, 50, 49.6, 50.6.
Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e wariancja uzyskiwanych ±rednic
rur jest 0.04.
2
Losowa próba n = 200 studentów pewnej uczelni daªa wariancj¦ Sn−1
= 50
papierosów wypalanych dziennie przez studentów tej uczelni. Na poziomie istotno±ci α = 0.05
zwerykowa¢, hipotez¦, »e odchylenie standardowe liczby papierosów wypalanych dziennie
przez studentów wynosi 5.
Zadanie 43
11
4.2
Model II
Dane s¡ dwie populacje generalne ma j¡ce odpowiednio rozkªady normalne
N (µ1 , σ1 ) i N (µ2 , σ2 ),
gdzie parametry tych rozkªadów s¡ nieznane. Z populacji tych wylosowano niezale»nie odpowiednio
n1
oraz
n2
• H0 : σ1 = σ2
elementów do próby, na podstawie której nale»y sprawdzi¢ hipotez¦
;
• H1 : σ1 6= σ2 .
Statystyka testowa przyjmuje posta¢ (pami¦ta¢ o sposobie konstruowania tego ilorazu).:
F =
Sn2 1 −1
Sn2 2 −1
Statystyka ta ma przy zaªo»eniu prawdziwo±ci hipotezy
n2 − 1
H0
rozkªad
F
Snedecora z
n1 − 1 i
α
stopniami swobody. stopniami swobody. Dla ustalonego z góry poziomu istotno±ci
i stopni swobody odczytujemy z tablicy rozkªadu
F.
W celu stwierdzenia czy podanie pewnego preparatu farmaceutycznego zmienia
frakcj¦ pewnego biaªkaw moczu królików, dokonano 16 pomiarów frakcji tego biaªka w grupie
kontrolnej K , oraz 25 pomiarów w grupie królików Z , którym podano preparat farmaceutyczny. Wyniki byªy nast¦puj¡ce w (%)
Zadanie 44
K : 18.7, 7.4, 0.8, 34.5, 45.5, 10.1, 19.5, 40.2, 11.5, 19.2, 39.0, 1.0, 11.2, 16.1, 3.7, 7.9.
Z : 27.4, 13.9, 10.3, 0.8, 9.6, 5.7, 3.0, 19.1, 4.8, 12.2, 19.2, 20.8, 5.1,
18.5, 8.8, 16.8, 20.5, 1.9, 12.5, 28.7, 11.5, 17.5, 35.6, 6.3, 4.0.,
Sprawdzi¢ zaªo»enie o równo±ci wariancji dla tych dwóch prób, nast¦pnie wykona¢ test t dla
dwóch prób (poziom istotno±ci α = 0.05).
Dokonano po 10 pomiarów tego samego napi¦cia pr¡du przy u»yciu dwu ró»nych
woltomierzy. Dla pierwszego otrzymano wyniki:
Zadanie 45
1.07, 1.13, 1.15, 1.11, 1.09, 1.10, 1.14, 1.15, 1.11;
natomiast dla drugiego otrzymano:
1.08, 1.05, 1.03, 1.06, 1.05, 1.12, 1.06, 1.02, 1.08, 1.15
Na poziomie istotno±ci α = 0.01 zwerykowa¢ hipotez¦ o jednakowej waraiancji pomiarów
dla obu woltomierzy.
12
5 Analiza wariancji (klasykacja pojedyncza)
5.1
Model
Dla danych
k
populacji o rozkªadzie normalnym
N (µi , σi ) (i = 1, . . . , k )
zakªadamy, »e
wariancje wszystkich populacji s¡ równe, tzn.
σ12 = σ22 = . . . = σk2 .
Z ka»dej z tych wylosowano niezale»ne próby o liczebno±ci
ni
elementów. Na podstawie tych
prób nale»y zwerykowa¢ nast¦puj¡c¡ hipotez¦:
• H0 : µ1 = µ2 = . . . = µk
• H1 :
;
nie wszystkie ±rednie badanych populacji s¡ równe. .
Statystyka testowa przyjmuje posta¢ (pami¦ta¢ o sposobie konstruowania tego ilorazu).:
F =
SSA
SSE
Statystyka ta ma przy zaªo»eniu prawdziwo±ci hipotezy
n−k
H0
rozkªad
F
Snedecora z
k−1
α
stopniami swobody. stopniami swobody. Dla ustalonego z góry poziomu istotno±ci
stopni swobody odczytujemy z tablicy rozkªadu
i
i
F.
Liczba bª¦dów popeªnionych w toku przej±cia tresowanych szczurów przez labirynt ma rozkªad normalny. Do pewnych dalszych do±wiadcze« wylosowano po 5 szczurów do
4 grup, które powinny by¢ jednorodne pod wzgl¦dem stopnia wytresowania. Otrzymano dla
szczurów w poszczególnych grupach nast¦puj¡ce liczby popeªnianych przez nie bª¦dów:
Zadanie 46
GRUPA
I
II
III
IV
10
7
8
16
8
10
13
10
7
6
15
8
6
14
6
10
11
5
3
4
Na poziomie istotno±ci α = 0.10 zwerykowa¢ hipotez¦ o równo±ci ±redniej liczby bl¦dówpopeªnionych przez tresowane szczury we wszystkich grupach.
Zadanie 47 Trzech nauczycieli j¦zyka polskiego miaªo oceni¢ w skali punktowej 1 − 20 wypracowania wylosowanych czterech uczniów pewnej szkoªy. Wyniki byªy nast¦puj¡ce: Na poNAUCZYCIEL
A
B
C
19
17
20
20
20
19
10
11
9
14
15
12
ziomie istotno±ci α = 0.1 zwerykowa¢ hipotez¦, »e wszyscy nauczyciele s¡ tak samo surowi
(wystawiaj¡ ±rednio podobne oceny).
13
6 Nieparametryczne testy istotno±ci
6.1
Model I
F.
Populacja generalna ma rozkªad o dystrybuancie
Z populacji wylosowano niezale»nie
du»¡ prób¦ (conajmniej kilkadziesi¡t), której wyniki podzielono na
liczebno±ciach
ni
P
n =
w ka»dej klasie, przy czym
ni .
r
rozª¡cznych klas o
Na podstawie tej próby nale»y
sprawdzi¢ hipotez¦:
• H0 :
otrzymana próba pochodzi z rozkªadu
• H1 :
otrzymana próba nie pochodzi z rozkªadu
F
;
F.
Statystyka testowa przyjmuje posta¢:
χ2 =
r
X
(ni − npi )2
npi
i=1
która przy zaªo»eniu prawdziwo±ci hipotezy
H0
,
ma rozkªad
χ2
o
r−1
stopniach swobody.
W celu sprawdzenia czy kostka sze±cienna do gry jest rzetelna (symetryczna)
wykonao 120 rzutów t¡ kostk¡ otrzymano nast¦puj¡ce wyniki: Na poziomie istotno±ci α =
Zadanie 48
liczba oczek
liczba rzutów
1
11
2
30
3
14
4
10
5
33
6
22
0.05 zwerykowa¢ hipotez¦, »e wszystkie liczby oczek w rzucie t¡ kostk¡ maj¡ identyczne
prawdopodobie«stwo wyrzucenia.
14

Podobne dokumenty