1 Wªasno±ci rozkªadu normalnego
Transkrypt
1 Wªasno±ci rozkªadu normalnego
1 Wªasno±ci rozkªadu normalnego Zmienna losowa X pochodzi z rozkªadu normalnego je»eli jej funkcja g¦sto±ci wyra»a si¦ wzorem: f (x) = √ 1.0.1 Podstawowe wªasno±ci rozkªadu normalnego 1. Standardowy rozklad normalny 2. Je»eli X ma rozkªad N (µ, σ), 3. Je»eli X ma rozkªad N (0, 1), 4. N (0, 1) to to Y Y ma rozkªad ma rozkªad N (0, 1), gdzie Y = (X−µ) ; σ N (µ, σ) gdzie Y = σ · X + µ; E[X] = µ, V ar[X] = σ 2 ; X1 , X2 , . . . Xn N (µ, √σn ) 5. Je»eli 1.0.2 (x−µ)2 1 e− 2σ2 2πσ jest prób¡ z rozkªadu normalnego N (µ, σ) to X̄ ma rozkªad Praktyczne u»ycie tablic statystycznych Zadanie 1 Oblicz warto±ci Φ(z) dla z = 0, 1.96, −1, 0.56, −0.25, 1.5, 2.01, 3, 1.75 Zadanie 2 Znajd¹ warto±ci z , dla których Φ(z) = 0.5, 0.05, 0.95, 0.99, 0.90, 0.025, 0.01 Zadanie 3 Niech X b¦dzie zmienn¡ losow¡ o rozkªadzie N (0, 1) oblicz: 1. P (−0.55 < z < 0.37); 2. P (0.37 < z < 0.42); 3. P (−0.55 < z < −0.15). Zadanie 4 Niech zmienna losowa X ma rozkªad N (2, 3) oblicz pradopodobie«stwa: 1. P (X > 2); 2. P (X < 1); 3. P (|X − 2| < 0.5); 4. P (X < 1). Zadanie 5 Zmienna losowa ma rozkªad N (12, 4). Oblicz prawdopodobie«stwo P (x < 15). rednia zawarto±¢ Hb we krwi kobiet wynosi 13.7g/100ml, wariancja 1.58. Jakie jest prawdopodobie«stwo, »e losowo pobrana do bada« krew kobiet zawiera co najmniej 12g/100ml? Zadanie 6 Zadanie 7 Dostawca saªaty gwarantuje, »e ±rednia zawarto±¢ oªowiu w jego saªacie nie przekracza 0.10ppm. Kupuj¡cy poleciª sprawdzi¢ 16 losowo wybranych próbek saªaty i otrzymaª w nich ±redni¡ zawarto±¢ oªowiu 0.11ppm z odchyleniem standardowym 0.02ppm. Oce« czy gwarancja producenta jest uczciwa. 1 1.0.3 Wªasno±ci rozkªadu normalnego reguªa 3σ Dla rozkªadu normalnego ma zastosowanie tzw. prawo 3σ mówi ono, »e ok. 68% wszyst- kich warto±ci zmiennej odbiega od ±redniej oczekiwanej nie bardziej ni» o jedno odchylenie 95% wszystkich warto±ci nie bardziej ni» o dwa odchylenia standardowe. 99.8% odbiega o nie wi¦cej ni» 3σ od warto±ci ±redniej. Zatem w przedziale (µ − σ, µ) i (µ, µ + σ) zna jduje si¦ w przybli»eniu ok. 34% wszystkich pomiarów. W przedziale (µ−2σ, µ) i (µ, µ+2σ) znajduje si¦ ok. 47.72% wszystkich pomiarów. Po za tymi przedziaªami zna jduje si¦ ju» tylko po 2.25% pomiarów. Kiedy X ma rozkªad normalny, wspomniane 95.5% odpowiada prawdopodobie«stwu, »e 95.5% wyników losowo wybranych zawiera si¦ w przedziale o ko«cach µ + 2σ . standardowe, ok. Natomiast ok. 1.1 Przedziaªy ufno±ci Niech dana b¦dzie próba losowa rzeczywistego X1 , X2 , . . . Xn , której rozkªad zale»y od pewnego parametru θ. dla parametru θ na poziomie ufno±ci 1−α (0 < α < 1) nazywamy (θ¯1 (X1 , . . . , Xn ), θ¯2 (X1 , X2 , . . . , Xn )) o wªasno±ci Przedziaªem ufno±ci przedziaª P (θ¯1 (X1 , . . . , Xn ) ¬ θ ¬ θ¯2 (X1 , X2 , . . . , Xn )) = 1 − α dla ka»dego 1.1.1 Niech θ. Przedziaª ufno±ci dla parametru poªo»enia X1 , X2 , . . . , Xn b¦dzie to próba losowa przy czym prarametr µ jest nieznany natoσ jest znany. Bezpo±rednio z Centralnego Twierdzenia Granicznego otrzy- miast parametr mujemy, »e √ √ P (X̄ − aα σ/ n ¬ µ ¬ X̄ + aα σ/ n) = 1 − α Jest to przedziaª ufno±ci dla parametru na poziomie istotno±ci Uwaga 1 1.1.2 Niech i σ. µ utworzony na podstawie próby losowej X1 , X2 , . . . Xn 1−α W zagadnieniach praktycznych najcz¦±ciej parametr σ nie jest znany. Przedziaª ufno±ci dla parametru poªo»enia (parametr X1 , X2 , . . . , Xn b¦dzie prób¡ prost¡ z rozkªadu normalnego σ nie jest znany). N (µ, σ) o nieznanych µ Zmienna losowa n t= ma rozkªad α 1 X X̄ − µ √ 2 n, (gdzie Sn−1 = (Xi − X̄)2 ) Sn−1 n − 1 i=1 t − Studenta o n − 1 stopniach swobody. Niech t(α, n − 1) oznacza kwantyl rz¦du tego rozkªadu. Wówczas √ √ α α P (X̄ − t( , n − 1)Sn−1 / n < µ < X̄ + t(1 − , n − 1)Sn−1 / n) = 1 − α. 2 2 Nale»y oszacowa¢ »ywotno±¢ wyprodukowanej partii ±wietlówek. Wiadomo, »e czas ±wiecenia ±wietlówek ma rozkªad normalny z odchyleniem standardowym σ = 120 godzin. Wylosowano niezale»nie z tej partii towaru n = 25 ±wietlówek, otrzymano w ten sposób nast¦puj¡ce wyniki (pomiary czasu ±wiecenia w godzinach): Zadanie 8 2630, 2820, 2900, 2810, 2770, 2840, 2700, 2950, 2690, 2720, 2800, 2970, 2680, 2660, 2820, 2580, 2840, 3020, 2780, 2920, 3060, 2840, 2550, 2790, 2850. Przyjmuj¡c wspóªczynnik ufno±ci 0.98 znale¹¢ przedziaª ufno±ci dla ±redniej. 2 W pewnym do±wiadczeniu medycznym bada si¦ czas snu pacjentów leczonych na pewn¡ chorob¦. Zmierzono czas snu u n = 16 wylosowanych niezale»nie pacjentów i otrzymano nast¦puj¡ce wyniki ( w minutach): 435, 533, 393, 458, 525, 481, 324, 437, 348, 503, 383, 395, 416, 533, 500, 488. Przujmuj¡c, »e czas snu ma rozkªad N (m, 70), oszacowa¢ ±redni m czasu snu pacjentów przyj¡c wspóªczynnik ufno±ci 0.99. Zadanie 9 W pewnym eksperymencie chemicznym bada si¦ czas caªkowitego zako«czenia reakcji. Dokonano n = 60 niezale»nych do±wiadcze« i otrzymano z nich ±redni¡ x̄ = 46 sek oraz odchylenie standardowe s = 13 sek. Przyjmuj¡c wspóªczynnik ufno±ci 0.99 znajd¹ przedziaª ufno±ci dla ±redniego czasu reakcji. Zadanie 10 W celach antropometrycznych wylosowano n = 400 studentów i dokonano pomiarów, mierz¡c mi¦dzy innymi dªugo±¢ ich stopy. Otrzymano z tej próby x̄ = 26.4 oraz s = 1.7 cm. Znajd¹ 0.90 przedziaª ufno±ci dla ±redniej dªugo±ci stopy. Zadanie 11 W celu oszacowania ±redniej miesi¦cznej kwoty wydatków studentów na rozrywki, wybrano losowo prób¦ n = 200 studentów i otrzymano z niej ±redni¡ x̄ = 120 oraz s = 84 zª. Znale¹¢ 0.95 przedziaª ufno±ci dla ±redniej. Zadanie 12 Zadanie 13 Dokonano n = 4 niezale»ne pomiary geªeboko±ci oceanu w pewnym regionie i uzyskano nastepuj¡ce wyniki: 4.33, 4.58, 4.47, 4.50 Wyznaczy¢ przedziaª ufno±ci dla szacowanej ±redniej gª¦boko±ci oceanu w tym rejonie, przyjmuj¡c wspóªczynnik ufno±ci 0.99. Czas potrzebny na opracowanie 1km2 mapy przez techników ma rozkªad normalny. W celu oszacowania ±redniego czasu potrzebnego na t¦ czynno±¢ dla pewnej kategorii trudno±ci terenu, zmierzono czasy dla n = 21 techników wylosowanych niezale»nie i otrzymano nast¦puj¡ce wyniki (w godzinach): 4.00, 3.35, 3.18, 2.89, 3.60, 3.05, 3.71, 3.30, 3.42, 2.96, 3.56, 2.97, 2.78, 2.39, 3.16, 3.04, 2.54, 2.59, 3.62, 3.28, 2.76 . Znale¹¢ 0.95 przedziaª ufno±ci. Zadanie 14 1.2 Przedziaªy ufno±ci dla proporcji Nie zawsze badanie statystyczne jest prowadzone ze wzgl¦du na cech¦ mierzaln¡. Czasem badana cecha ma charakter niemierzalny (jako±ciowy). Wtedy zamiast warto±ci liczbowej badanej cechy uzyskujemy jedynie informacj¦ o tym czy badany element w populacji ma badan¡ cech¦ jako±ciow¡ czy te» jej nie ma. Podstawowym celem badan jest frakcja elementów wyró»nionych (wska¹nik struktury populacji) oznaczana zwykle przez p. Najlepszym oszacowaniem wska¹nika p jest m/n gdzie m- liczba elementów wyró»nionych znalezionych w losowej próbie n. Uwaga 2 Uwaga 3 Kolejn¡ metod¡ jest konstrukcja przedziaªu ufno±ci dla wska¹nika p stosujemy wtedy wzór: m − aα n r m n (1 − n m n) m <p< + aα n r m n (1 − n m n) . Chcemy oszacowa¢ jaki procent pracuj¡cych mieszka«ców Warszawy jada obiady w stoªówkach pracowniczych. Pobrano w tym celu n = 900 osób wylosowanych niezale»nie do próby i znaleziono w tej probie 300 osób, które jedz¡ obiady w takich stoªówkach. Przyjmuj¡c wspóªczynnik ufno±ci 0.95 zbudowa¢ przedziaª ufno±ci dla proporcji osób jadaj¡cych w stoªówkach. Zadanie 15 3 Zadanie 16 Spo±ród »arówek wykonanych przez pewn¦ fabryk¦ wylosowano niezale»nie n = 100 sztuk i sprawdzono ich jako±¢. 16 »arówek okazaªo si¦ zªych. Przyjmuj¡c wspóªczynnik ufno±ci 0.99 oszacowa¢ procent braków w wyprodukowanej partii »arówek. W celu wyznaczenia siªy kieªkowania pewnej nowej odmiany grochu, wykonano w pewnym instytucie hodowli ro±lin do±wiadczenie polegaj¡ce na wysadzeniu 800 ziaren grochu tej nowej odmiany i badaniu ile ziaren wykieªkuje. Wykieªkowaªo 728 ziaren. Przyjmuj¡c wspóªczynnik ufno±ci 0.95 oszacowa¢ siª¦ kieªkowania. Zadanie 17 Zadanie 18 Odªowiono 10000 motyli w tym 5433 samic. Oblicz 1. proporcj¦ samic w tej próbie 2. przedziaª ufno±ci o wspóªczynniku ufno±ci 0.95. 1.3 Przedziaª ufno±ci dla wariancji W badaniach statystycznych do na jcz¦±ciej szacowanych parametrów populacji nale»y wariancja σ2 lub odchylenie standardowe σ badanej cechy. Gdy próba pochodzi z rozkªadu normalnego (lub zbli»onego do normalnego), wtedy mo»na zbudowa¢ przedziaª ufno±ci dla σ2 . 1.3.1 Model 1 Próba X1 , X2 , . . . , Xn (n < 30) pochodzi z rozkªadu normalnego N (µ, σ) o nieznanych µ i σ . Wowczas przedziaª ufno±ci dla wariancji okre±lony jest wzorem pa- rametrach nSn2 nSn2 < σ2 < c1 c2 gdzie c1 i c2 s¡ warto±ciami zmiennej χ2 dla n−1 P (χ2 ¬ c1 ) = stopni swobody tzn. 1 α 2 1 P (χ2 c2 ) = 1 − α 2 Zadanie 19 w celu oszacowania dokladno±ci pewnego przyrz¡du pomiarowego dokonano nim 5 niezale»nych pomiarów dªugo±ci pewnego odcinka i otrzymano nast¦puj¡ce wyniki (w mm): 15.15, 15.20, 15.04, 15.14, 15.22. Przyjmuj¡c wspóªczynnik ufno±ci 0.98 zbudowa¢ przedziaª uf- no±ci dla nieznanej wariancji pomiarów tym przyrz¡dem. W celu oszacowania rozrzutu wagi jaj dostarcznych do pewnego sklepu dokonano pomiarów wagi 15 jaj i otrzymano nast¦puj¡ce wyniki (w g): 62, 57, 70, 58, 59, 67, 65, 69, 55, 57, 60, 54, 72, 66, 74. przyjmuj¡c wspóªczynnik ufno±ci 0.96 zbudowa¢ przedziaª ufno±ci dla wariancji wagi dostarczanych jaj. Zadanie 20 W celu oszacowania rozrzutu wyników uzyskiwanych w zawodach sportowych w trójskoku przez pewnego zawodnika wylosowano spo±ród jego wyników niezale»nie 10 wyników i otrzymano: Zadanie 21 16.02, 15.86, 16.33, 16.42, 16.11, 16.23, 16.32, 16.67, 16.08, 15.96. Przyjmuj¡c wspóªczynnik ufno±ci 0.90 oszacowa¢ metod¡ przedziaªow¡ odchylenie standardowe wyników tego zawodnika w trójskoku. 4 1.4 Wyznaczanie nizb¦dnej liczby pomiarów do próby 1.4.1 Model I N (µ, σ). Populacja generalna ma rozkªad normalny Chcemy oszacowa¢ nieznan¡ warto±¢ µ Wariancja w populacji liczby d, µ (tj. poªowa dªugo±ci przedziaªu ufno±ci) nie przekroczyª z góry zadanej uα uα σ 2 d2 N (0, 1) jest warto±ci¡ zmiennej normalnej P (−uα < U < uα ) = 1 − α, ±redniej µ sposób, »e nieznanej 1.4.2 n niezale»1 − α maksymalny to niezb¦dn¡ do uzyskania tego celu liczno±ci¡ próby oblicza si¦ ze wzoru: n= gdzie jest znana. populacji na podstawie próby zªo»onej z nych pomiarów. Je»eli »¡damy, by przy ustalonym wspóªczynniku ufno±ci bª¡d szacunku σ2 a d odczytan¡ z tablicy dla 1−α w taki - dopuszczalnym ustalonym bª¦dem szacunku Model II Populacja generalna ma rozkªad normalny N (m, σ). Wariancja σ 2 w populacji jest nieznana, ale znana jest warto±¢ statytstyki n 2 Ŝn−1 Chcemy oszacowa¢ nieznan¡ warto±¢ 1 X (Xi − X̄)2 n − 1 i=1 µ bª¡d szacunku liczby d, µ n niezale»1 − α maksymalny populacji na podstawie próby zªo»onej z nych pomiarów. Je»eli »¡damy, by przy ustalonym wspóªczynniku ufno±ci (tj. poªowa dªugo±ci przedziaªu ufno±ci) nie przekroczyª z góry zadanej to niezb¦dn¡ do uzyskania tego celu liczno±¢ próby oblicza si¦ ze wzoru: n= gdziem tα 1.4.3 Model III 2 tα Ŝn−1 d2 jest kwantylem z rozkªadu Studenta odczytanym z tablicy. p (tzn, p jest frakcj¡ elementów p na podstawie próby tak liczby d, to niezb¦dn¡ do uzyskanie Populacja generalna ma rozkªad dwupunktowy z parametrem wyró»nionych w populacji). Chcemy oszacowa¢ nieznan¡ warto±¢ aby bª¡d szacunku dla p nie przekroczyª danej z góry tego celu liczebno±¢ próby uzyskuje si¦ ze wzoru: n= u2α 4d2 Ile nale»y wylosowa¢ niezale»nie do próby krów pewnej rasy by oszacowa¢ ±redni¡ dzienn¡ wydajno±¢ mleka krowy tej rasy z bª¦dem maksymalnym 0.5l, je»eli wiadomo, »e odchylenie standardowe wydajno±ci dziennej mleka krów tej rasy wynosi 2.5l, a przyjmuje si¦ wspóªczynnik ufno±ci 0.95 Zadanie 22 Zadanie 23 Ile sztuk pewnego wyrobu nale»y niezale»nie pobra¢ do kontroli wagi aby oszacowa¢ ±redni± wag¦ tego wyrobu z bª¦dem maksymalnym 0.5dkg przy wspóªczynniku ufno±ci 0.99, je»eli wiadomo, »e wariancja tej wagi wynosi 1. Oblicz liczebno±¢ próby potrzebnej do oszacowania ±redniej szybko±ci pocz¡tkowej pocisku z okre±lonym ªadunkiem prochu, je»eli próba wst¦pna 9 pomiarów pr¦dko±ci pocz¡tkowej pocisków wystrzelonych daj¡ wyniki: 1002.3, 1003.1, 1001.3, 1001.2, 1007.2, 999.8, 1006.5, 1003.8. »¡dany maksymalny bª¡d szacunku ±redniej szybko±ci wynosi 3m/s. Zadanie 24 5 Ile nale»y wylosowa¢ niezale»nie puszek konserwowych do badania jako±ci pewnej partii konsew, aby oszacowa¢ procent zepsutych, który jest dopuszczalnie 10% z bª¦dem maksymalnym 5% . Wspóªczynnik ufno±ci 0.90. Zadanie 25 Ile egzemplarzy ksi¡»ek w pewnej uczelnianej bibliotece nale»y wylosowa¢ niezal»nie do próby aby oszacowa¢ na tej podstawie nieznany procent ksi¡»ek napisanych w j¦zykach obcych a znajduj¡cych si¦ w bibliotece, z bª¦dem maksymalnym 4%. Wspóªczynnik ufno±ci 0.9. Zadanie 26 6 2 Testowanie hipotez statystycznych - testy dla ±redniej 2.1 Model I Populacja generalna ma rozkªad normalny w populacji jest znane. N (µ, σ) przy czym odchylenie standardowe Nale»y na podstawie próby losowej n- elementowej sprawdzi¢ hipotez¦: • H0 : µ = µ0 (µ0 ustalona warto±¢); • H1 : µ 6= µ0 . Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡: u= x̄ − µ0 √ n. σ −4 −2 0 x 2 4 0.4 0.0 0.1 0.2 dnorm(x) 0.3 0.4 0.3 0.2 dnorm(x) 0.0 0.1 0.2 0.1 0.0 dnorm(x) 0.3 0.4 Z tablicy rozkªadu normalnego N (0, 1) wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡ uα , by dla zaªo»onego z góry maªego prawdopodobie«stwa α (poziomu istotno±ci) zachodziªa równo±¢ P (|U | uα ) = α. Uwaga t¦ statystyk¦ testow¡ stosujemy tak»e w przypadku du»ych prób (podstawiaj¡c Sn zamiast σ ). −4 −2 0 x 2 4 −4 −2 0 2 4 x Rysunek 1: Obszary krytyczne dla testu dwustronnego oraz dla testów jednostronnych 7 Zadanie 27 Maj¡c rozkªad normalny N (16.25, 1.69) sprawdzi¢ czy pomiar z = 12.35 pochodzi z tego rozkªadu na poziomie istotno±ci α = 0.05. Zadanie 28 W pewnym eksperymencie psychiatrycznym przeprowadzonym na grupie 42 chorych otrzymano nast¦puj¡ce wyniki: (w %) 34.8, 33.9, 32.6, 49.4, 44.9, 55.2, 48.5, 40.3, 34.0, 42.1, 17.9, 36.0, 21.2, 35.9, 41.2, 40.9, 16.9, 42.9, 28.7, 51.9, 24.1, 29.1, 44.6, 41.2,17.0, 29.8, 35.0, 51.7, 42.9,54.2,25.9, 30.3, 36.9, 19.2, 59.1, 31.3, 50.0, 19.8, 30.6, 31.7, 28.8, 30.0. Czy na podstawie tych danych mo»na twierdzi¢, »e ±redni wynik jest równy 50. Zadanie 29 Zbadano w 81 wylosowanych zakªadach pewnej gaª¦zi przemysªowej koszty materiaªowe przy produkcji pewnego wyrobu i otrzymano ±redni¡ X̄ = 540 oraz Sn = 150. Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e ±rednie koszty materiaªowe wynosz¡ 600. 2.2 Model II Populacja generalna ma rozkªad normalny jest nieznane N (µ, σ) przy czym odchylenie standardowe n- elementowej sprawdzi¢ hipotez¦: Nale»y na podstawie próby losowej • H0 : µ = µ0 (µ0 ustalona warto±¢); • H1 : µ 6= µ0 . Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡: u= Z tablicy rozkªadu studenta t(n − 1) x̄ − µ0 √ n. Sn−1 wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡ by dla zaªo»onego z góry maªego prawdopodobie«stwa równo±¢ P (|T | tα ) = α. Uwaga α tα , (poziomu istotno±ci) zachodziªa test stosowany w przypadku maªych prób. Wiadomo, »e rozkªad wyników pomiarow gª¦boko±ci morza w pewnym rejonie jest normalny z odchyleniem standardowym 5 m. Dokonano 5 niezale»nych pomiarów i otrzymano wyniki (w m): 862, 870, 876, 866, 871. Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e ±rednia gª¦boko±¢ morza w tym rejonie jest równa 870 m. Zadanie 30 Automat produkuje okre±lonych wymiarów blaszki o nominalnej grubo±ci 0.04 mm. Wylosowana próba 25 blaszek daªa ±redni¡ grubo±¢ x̄ = 0.037 mm oraz s = 0.05 mm. Czy mo»na zatem twierdzi¢, »e produkowane blaszki s¡ cie«sze ni» 0.04 mm ? Przyj¡¢ poziom ufno±ci α = 0.01. Zadanie 31 Zadanie 32 Wylosowano niezale»nie 10 indywidualnych gospodarstw rolnych w pewnej wsi i otrzymano dla nich nast¦puj¡ce wielko±ci uzyskanych plonów owsa (w q/ha); 18.1, 17.0, 17.5, 17.8, 18.3, 16.7, 18.0, 15.9, 17.6, 18.1. Na poziomie istotno±ci α = 0.10 zwerykowa¢ hipotez¦, »e ±redni plon owsa w tej wsi wynosi 18q/ha. Dokonano 22 niezale»nych pomiarów strat z osypania si¦ ziarna »yta w wylosowanych gospodarstwach rolnych w 1966 roku i otrzymano nast¦puj¡ce straty (w procentach) 6.05, 5.89, 5.82, 6.31, 5.26, 5.81, 6.40, 5.92, 6.12, 6.03, 5.47, 5.64, 6.06, 5.87, 5.69, 5.88, 5.49, 5.87, 5.83, 5.75, 5.97, 5.79. Przyjmuj¡c poziom istotno±ci α = 0.01 zwerykowa¢ hipotez¦, »e ±redni procent strat z osypania si¦ ziarna »yta wynosi 5.5. Zadanie 33 8 3 Testowanie hipotez statystycznych - porównanie dwóch ±rednich 3.1 Model I Badamy dwie populacje generalne ma j¡ce rozkªady normalne σ1 lenia standardowe i σ2 s¡ znane (nie N (µ1 , σ1 ), N (µ2 , σ2 ). musz¡ by¢ równe). niezale»nych prób, odpowiednio o liczebno±ciach n1 i n2 Odchy- W oparciu o wyniki dwu wylosowanych z tych populacji na- le»y sprawdzi¢ hipotez¦: • H0 : µ1 = µ2 ; • H1 : µ1 6= µ2 . Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡: x¯1 − x¯2 . u= q 2 σ1 σ22 + n1 n2 Z tablicy rozkªadu normalnego N (0, 1) wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡ uα , by dla zaªo»onego z góry maªego prawdopodobie«stwa α (poziomu istotno±ci) zachodziªa równo±¢ P (|U | uα ) = α. Uwaga t¦ statystyk¦ testow¡ stosujemy tak»e w przypadku du»ych prób (podstawiaj¡c Sn zamiast σ ). Pragniemy stwierdzi¢, czy sªuszne jest stwierdzenie, »e zatrudnione na tych samych stanowiskach kobiety otzymuj¡ przeci¦tnie ni»sz¡ pªac¦ ni» m¦»czy¹ni. Z populacji kobiet wylosowano niezale»nie prób¦ n1 = 100 kobiet i otrzymano ±redni¡ pªac¦ 2180 oraz wariancj¦ Sn2 1 = 6400. Z populacji m¦»czyzn zatrudnionych na tych samych stanowiskach wylosowano niezale»nie n2 = 80 i otrzymano ±redni¡ 2280 oraz wariancj¦ Sn2 2 = 10000. Na poziomie istotno±ci α = 0.01 nale»y sprawdzi¢ hipotez¦, »e ±rednie pªace kobiet s¡ ni»sze. Zadanie 34 Zbadano w losowo wybranych PGR-ach w woj. warszawskim i pozna«skim ±rednie plony buraka cukrowego. Wiadomo, »e w obu tych województwach plony buraka maj¡ rozkªad normalny z odchyleniem standardowym σ = 20q/ha. rednia z próby o liczebno±ci n1 = 6 wybranej z województwa warszawskiego wyniosªa 310q/ha, natomiast z próby o liczebno±ci n2 = 10 wylosowanej z woj. pozna«skiego wyniosªa 318q/ha. Przyjmuj¡c poziom istotno±ci α = 0.1 sprawdzi¢ hipotez¦, »e ±rednie plony buraka cukrowego uzyskane przez PGR-y obu województw s¡ jednakowe. Zadanie 35 3.2 Model II N (µ1 , σ1 ), N (µ2 , σ2 ). Odchyσ2 s¡ nieznane. W oparciu o wyniki dwu niezale»nych prób (maªe o liczebno±ciach n1 i n2 wylosowanych z tych populacji nale»y spraw- Badamy dwie populacje generalne ma j¡ce rozkªady normalne lenia standardowe próby), σ1 odpowiednio i dzi¢ hipotez¦: • H0 : µ1 = µ2 ; • H1 : µ1 6= µ2 . Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡: t= r x¯1 − x¯2 2 2 (n1 −1)Sn +(n2 −1)Sn 1 −1 2 −1 n1 +n2 −2 Z tablicy rozkªadu studenta tα , . ( n11 + 1 n2 ) t(n1 + n2 − 2) wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡ α (poziomu istotno±ci) zacho- by dla zaªo»onego z góry maªego prawdopodobie«stwa dziªa równo±¢ P (|T | tα ) = α. Uwaga wa»ne zaªo»enie o równo±ci wariancji powinno by¢ testowane (test F). 9 W szitalu wylosowano prób¦ 16 pacjentów chorych na chorob¦ A oraz prób¦ 26 pacjentów chorych na chorob¦ B i dokonano pomiarów czasu snu tych pacjentów. Dla pacjentów chorych na chorob¦ A otrzynano nast¦puj¡ce wyniki (czas snu w minutach): Zadanie 36 438, 154, 374, 250, 305, 299, 434, 432, 453, 445, 466, 413, 551, 342, 123, 508 a dla pacjentów chorych na chorob¦ B otrzymano 416 454, 400, 315, 373, 370, 203, 505, 372, 249, 285, 339, 439, 262, 372, 149, 275, 452, 320, 460, 392, 272, 263, 379, 309, 358. Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦ o jednakowych ±rednich czasach snu w obu grupach pacjentów. Zmierzono w dwóch ulach ±rednic¦ komórek plastra zbudowanego przez pszczoªy. Dla 7 wylosowanych komórek z pierwszego ula otrzymano nast¦puj¡ce wyniki: Zadanie 37 5.36, 5.20, 5.28, 5.16, 5.30, 5.08, 5.23 analogicznie dla drugiego ula otrzymano: 5.15, 5.04, 5.30, 5.22, 5.19, 5.24, 5.12; Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e ±rednie dªugo±ci komórek w plastrach pochodz¡cych z dwóch ró»nych uli s¡ równe. Zbadano ilo±¢ piór sterówek w dwu grupach goª¦bi pochodz¡cych od hodowców ±l¡skich oraz mazowieckich. Dla 8 goª¦bi hodowanych na l¡sku otrzymano nast¦puj¡ce wyniki ( liczba piór ): Zadanie 38 42, 31, 30, 14, 38, 25, 17, 35 natomiast dla 10 goª¦bi hodowców mazowieckich otrzymano 40, 32, 38, 36, 43, 39, 24, 28, 36, 34. Przyjmuj¡c poziom istotno±ci α = 0.1 zwerykowa¢ hipotez¦ o ró»nych gatunkach goª¦bi (charakteryzuj¡cych si¦ ró»n¡ liczb¡ sterówek) hodowanych na l¡sku i Mazowszu. 3.3 Model III (test t dla prób sparowanych) Czasem w praktyce zdarza si¦, »e wyniki obu prób mo»emy traktowa¢ jako wyniki pomiarów na tym samym elemencie populacji. Jest tak wtedy, gdy stanowi¡ one pary przyporz¡dkowa- xi przed jak¡± operacj¡ i wynik yi i. Mo»emy wtedy analizowa¢ wyniki obu prób jako wyniki jednej zi = yi − xi . Testujemy nast¦puj¡ce zagadnienie: nych sobie liczb. Typow¡ sytuacj¡ jest tu model: wynik po niej dla tego samego próby, bior¡c ró»nice • H0 : µZ = 0 ; • H1 : µ1 6= 0. Na podstawie wyników próby losowej oblicza si¦ nast¦puj¡c¡ statystyk¦ testow¡: t= q Z tablicy rozkªadu studenta tα , by dla zaªo»onego z góry równo±¢ P (|T | tα ) = α. t(nz − 1) z̄ Sn2 z −1 √ nz . wyznacza si¦ nast¦pnie tak¡ warto±¢ krytyczn¡ maªego prawdopodobie«stwa 10 α (poziomu istotno±ci) zachodziªa Zadanie 39 W te±cie badaj¡cym pami¦¢ uczniów, dla 8 wylosowanych uczniów otrzymano nast¦puj¡ce liczby zapami¦tanych przez nich elementów: 16, 13, 14, 21, 19, 18, 26, 17. Natomiast po specjalnym treningu pami¦ci grupa ta wykazaªa nast¦puj¡ce wyniki: 21, 17, 20, 26, 23, 22, 21, 18. Przyjmuj¡c poziom istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e trening zwi¦ksza liczb¦ zapami¦tanych przez uczniów elementów. Zmierzono czas reakcji na pewien u 8 kierowców badanych w pracowni psychotechnicznej przed i w 15 minut po wypiciu 100g wódki. Wyniki przed wypiciem wódki byªy nast¦puj¡ce (w sekundach): Zadanie 40 0.22, 0.18, 0.16, 0.19, 0.20, 0.23, 0.17, 0.25 a po wypiciu wódki: 0.28, 0.20, 0.3, 0.19, 0.26, 0.28, 0.24. Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e wódka zwi¦ksza czas reakcji na bodziec. 4 Testowanie hipotez - testy dla wariancji 4.1 Model I Populacja generalna ma rozkªad normalny pulacji wylosowano niezale»nie n N (µ, σ) o nieznanych parametrach µ i σ. Z po- elementów do próby, na podstawie której nale»y sprawdzi¢ hipotez¦ • H0 : σ = σ0 ; • H1 : σ 6= σ0 . Statystyka testowa przyjmuje posta¢: χ2 = 2 (n − 1)Sn−1 σ02 H0 rozkªad chi2 z n − 1 stopniami swobody. Dla ustalonego z góry poziomu istotno±ci α i dla n−1 stopni swobody odczytujemy z 2 2 2 2 tablicy rozkªadu χ tak¡ warto±¢ krytyczn¡ χα aby speªniona byªa równo±¢ P (χ χα ) = α. Statystyka ta ma przy zaªo»eniu prawdziwo±ci hipotezy Dokonano 12 pomiarów woltomierzem pewnego napi¦cia pr¡du i otrzymano z 2 tej próby Sn−1 = 0.9V 2 . Nale»y na poziomie istotno±ci α = 0.05 sprawdzi¢ hipotez¦, »e wariancja pomiarów tym woltomierzem wynosi 0.6V 2 Zadanie 41 Dokonano 11 niezale»nych pomiarów ±rednicy odlewanych rur i otrzymano nast¦puj¡ce wyniki w (mm): Zadanie 42 50.2, 50.4, 50.6, 50.5, 49.9, 50, 50.3, 50.1, 50, 49.6, 50.6. Na poziomie istotno±ci α = 0.05 zwerykowa¢ hipotez¦, »e wariancja uzyskiwanych ±rednic rur jest 0.04. 2 Losowa próba n = 200 studentów pewnej uczelni daªa wariancj¦ Sn−1 = 50 papierosów wypalanych dziennie przez studentów tej uczelni. Na poziomie istotno±ci α = 0.05 zwerykowa¢, hipotez¦, »e odchylenie standardowe liczby papierosów wypalanych dziennie przez studentów wynosi 5. Zadanie 43 11 4.2 Model II Dane s¡ dwie populacje generalne ma j¡ce odpowiednio rozkªady normalne N (µ1 , σ1 ) i N (µ2 , σ2 ), gdzie parametry tych rozkªadów s¡ nieznane. Z populacji tych wylosowano niezale»nie odpowiednio n1 oraz n2 • H0 : σ1 = σ2 elementów do próby, na podstawie której nale»y sprawdzi¢ hipotez¦ ; • H1 : σ1 6= σ2 . Statystyka testowa przyjmuje posta¢ (pami¦ta¢ o sposobie konstruowania tego ilorazu).: F = Sn2 1 −1 Sn2 2 −1 Statystyka ta ma przy zaªo»eniu prawdziwo±ci hipotezy n2 − 1 H0 rozkªad F Snedecora z n1 − 1 i α stopniami swobody. stopniami swobody. Dla ustalonego z góry poziomu istotno±ci i stopni swobody odczytujemy z tablicy rozkªadu F. W celu stwierdzenia czy podanie pewnego preparatu farmaceutycznego zmienia frakcj¦ pewnego biaªkaw moczu królików, dokonano 16 pomiarów frakcji tego biaªka w grupie kontrolnej K , oraz 25 pomiarów w grupie królików Z , którym podano preparat farmaceutyczny. Wyniki byªy nast¦puj¡ce w (%) Zadanie 44 K : 18.7, 7.4, 0.8, 34.5, 45.5, 10.1, 19.5, 40.2, 11.5, 19.2, 39.0, 1.0, 11.2, 16.1, 3.7, 7.9. Z : 27.4, 13.9, 10.3, 0.8, 9.6, 5.7, 3.0, 19.1, 4.8, 12.2, 19.2, 20.8, 5.1, 18.5, 8.8, 16.8, 20.5, 1.9, 12.5, 28.7, 11.5, 17.5, 35.6, 6.3, 4.0., Sprawdzi¢ zaªo»enie o równo±ci wariancji dla tych dwóch prób, nast¦pnie wykona¢ test t dla dwóch prób (poziom istotno±ci α = 0.05). Dokonano po 10 pomiarów tego samego napi¦cia pr¡du przy u»yciu dwu ró»nych woltomierzy. Dla pierwszego otrzymano wyniki: Zadanie 45 1.07, 1.13, 1.15, 1.11, 1.09, 1.10, 1.14, 1.15, 1.11; natomiast dla drugiego otrzymano: 1.08, 1.05, 1.03, 1.06, 1.05, 1.12, 1.06, 1.02, 1.08, 1.15 Na poziomie istotno±ci α = 0.01 zwerykowa¢ hipotez¦ o jednakowej waraiancji pomiarów dla obu woltomierzy. 12 5 Analiza wariancji (klasykacja pojedyncza) 5.1 Model Dla danych k populacji o rozkªadzie normalnym N (µi , σi ) (i = 1, . . . , k ) zakªadamy, »e wariancje wszystkich populacji s¡ równe, tzn. σ12 = σ22 = . . . = σk2 . Z ka»dej z tych wylosowano niezale»ne próby o liczebno±ci ni elementów. Na podstawie tych prób nale»y zwerykowa¢ nast¦puj¡c¡ hipotez¦: • H0 : µ1 = µ2 = . . . = µk • H1 : ; nie wszystkie ±rednie badanych populacji s¡ równe. . Statystyka testowa przyjmuje posta¢ (pami¦ta¢ o sposobie konstruowania tego ilorazu).: F = SSA SSE Statystyka ta ma przy zaªo»eniu prawdziwo±ci hipotezy n−k H0 rozkªad F Snedecora z k−1 α stopniami swobody. stopniami swobody. Dla ustalonego z góry poziomu istotno±ci stopni swobody odczytujemy z tablicy rozkªadu i i F. Liczba bª¦dów popeªnionych w toku przej±cia tresowanych szczurów przez labirynt ma rozkªad normalny. Do pewnych dalszych do±wiadcze« wylosowano po 5 szczurów do 4 grup, które powinny by¢ jednorodne pod wzgl¦dem stopnia wytresowania. Otrzymano dla szczurów w poszczególnych grupach nast¦puj¡ce liczby popeªnianych przez nie bª¦dów: Zadanie 46 GRUPA I II III IV 10 7 8 16 8 10 13 10 7 6 15 8 6 14 6 10 11 5 3 4 Na poziomie istotno±ci α = 0.10 zwerykowa¢ hipotez¦ o równo±ci ±redniej liczby bl¦dówpopeªnionych przez tresowane szczury we wszystkich grupach. Zadanie 47 Trzech nauczycieli j¦zyka polskiego miaªo oceni¢ w skali punktowej 1 − 20 wypracowania wylosowanych czterech uczniów pewnej szkoªy. Wyniki byªy nast¦puj¡ce: Na poNAUCZYCIEL A B C 19 17 20 20 20 19 10 11 9 14 15 12 ziomie istotno±ci α = 0.1 zwerykowa¢ hipotez¦, »e wszyscy nauczyciele s¡ tak samo surowi (wystawiaj¡ ±rednio podobne oceny). 13 6 Nieparametryczne testy istotno±ci 6.1 Model I F. Populacja generalna ma rozkªad o dystrybuancie Z populacji wylosowano niezale»nie du»¡ prób¦ (conajmniej kilkadziesi¡t), której wyniki podzielono na liczebno±ciach ni P n = w ka»dej klasie, przy czym ni . r rozª¡cznych klas o Na podstawie tej próby nale»y sprawdzi¢ hipotez¦: • H0 : otrzymana próba pochodzi z rozkªadu • H1 : otrzymana próba nie pochodzi z rozkªadu F ; F. Statystyka testowa przyjmuje posta¢: χ2 = r X (ni − npi )2 npi i=1 która przy zaªo»eniu prawdziwo±ci hipotezy H0 , ma rozkªad χ2 o r−1 stopniach swobody. W celu sprawdzenia czy kostka sze±cienna do gry jest rzetelna (symetryczna) wykonao 120 rzutów t¡ kostk¡ otrzymano nast¦puj¡ce wyniki: Na poziomie istotno±ci α = Zadanie 48 liczba oczek liczba rzutów 1 11 2 30 3 14 4 10 5 33 6 22 0.05 zwerykowa¢ hipotez¦, »e wszystkie liczby oczek w rzucie t¡ kostk¡ maj¡ identyczne prawdopodobie«stwo wyrzucenia. 14