Przedziały ufności dla średniej i wariancji
Transkrypt
Przedziały ufności dla średniej i wariancji
Wyznaczenie przedziału ufności dla średniej W związku z tym, że średnia wartość badanej cechy stanowi najczęściej szacowany parametr populacji generalnych, szczególne znaczenie ma znajomość przedziału ufności dla tego właśnie parametru. Najlepszym estymatorem wartości średniej w populacji generalnej (m) jest średnia arytmetyczna ( ) z próby. Ma ona wszelkie pożądane cechy estymatorów: zgodność, nieobciążoność, efektywność, dostateczność. Jej rozkład wykorzystuje się do budowy przedziału ufności dla wartości średniej w populacji. W zależności od przyjętych założeń otrzymuje się konkretne wzory na przedziały ufności. W naszym przypadku założymy, że populacja generalna ma rozkład normalny (N(m,σ)). Przedział ufności dla wartości średniej dany jest wówczas wzorem: Gdzie: - średnia arytmetyczna obliczona na podstawie n - elementowej populacji próby, s próbkowe oszacowanie odchylenia standardowego, uα wartość zmiennej losowej U o sdandaryzowanym rozkładzie normalnym (N(0,1)) wyznaczoną w taki sposób aby spełniona była relacja: Warto zapamiętać, że dla: 1-α = 0.95; uα = 1.96; 1-α = 0.99; uα = 2.58; Wyznaczenie przedziału ufności dla wariancji W badaniach statystycznych, do najczęściej szacowanych parametrów, obok średniej należy wariancja (σ2) (lub odchylenie standardowe (σ)) badanej cechy. Gdy rozkład badanej cechy jest normalny (lub zbliżony do normalnego), można zbudować przedział ufności dla wariancji. Tak jak zwykle przedział ufności dla wariancji, opiera się na rozkładzie statystyki będącej jej estymatorem. Najbardziej znanymi estymatorami wariancji w populacji generalnej są statystyki: (a) (b) Wprawdzie estymator wariancji ze wzoru (b) jest nieobciążonym estymatorem wariacji (σ2), podczas gdy estymator ze wzoru (a) jest obciążonym estymatorem wariacji (σ2), ale oba te estymatory są równoważne jeżeli chodzi o przedział ufności dla wariancji. Natomiast oba estymatory odchylenia standardowego (obliczone jako pierwiastki kwadratowe wariancji ze wzorów (a) i (b)) są obciążonymi estymatorami odchylenia standardowego (σ). W zależności od liczebności próby, przedział ufności budujemy w oparciu o rozkład statystyki s2 (tzn. rozkład χ2), bądź też o jej rozkład graniczny (rozkład normalny). Obliczając pierwiastki kwadratowe z krańcowych elementów przedziału ufności dla wariancji (σ2), otrzymamy przedział ufności dla odchylenia standardowego (σ). W zależności od liczebności próby mamy dwa sposoby obliczania przedziałów ufności dla odchylenia standardowego (σ). MODEL I (dla małej liczebności próby). Gdy rozkład badanej cechy w populacji generalnej jest normalny o parametrach: m i σ oraz liczebność populacji próby jest mniejsza niż 30 elementów (n<30), obliczamy ze wzoru (a) lub (b) próbkowe oszacowanie wariancji. gdy wariancję liczono ze wzoru (a): gdy wariancję liczono ze wzoru (b): Gdzie: c1, c2 - są wartościami zmiennej χ2 wyznaczone z tablicy rozkładu χ2 dla n-1 stopni swobody oraz współczynnika ufności (1-α) w taki sposób aby spełnione były relacje: W związku z tym, że powszechnie używane tablice rozkładu χ2 podają wartości krytyczne statystyki χ2, zatem dla określonego współczynnika ufności (1-α), wartość c2 znajdujemy w tablicach dla prawdopodobieństwa: 1-(1/2)α, natomiast wartość c1 dla prawdopodobieństwa: (1/2)α MODEL II (dla dużej liczebności próby). W przypadku, gdy mamy do czynienia z liczną populacją próby i rozkład badanej cechy nie podważa zgodności rozkładu cechy w populacji generalnej z rozkładem normalnym (N(m,σ)), obliczamy z próby oszacowania odchylenia standardowego (s). Wtedy przedział ufności dla odchylenia standardowego (σ) w populacji generalnej jest określony wzorem: Gdzie: s próbkowe oszacowanie odchylenia standardowego, uα wartość zmiennej losowej U o sdandaryzowanym rozkładzie normalnym (N(0,1)) wyznaczoną w taki sam sposób jak dla średniej arytmetycznej. Zadania do wykonania: Przypuśćmy, że waga noworodka ma rozkład normalny o wariancji 0, 25 kg2. Zważono 100 noworodków i okazało się, że średnia waga wyniosła 3,5 kg. Wyznaczyć przedział ufności dla wartości oczekiwanej wagi noworodka na poziomie ufności 95%. 2. Zmierzono objętości 5 losowo wybranych kulek z partii kulek łożyskowych otrzymując (w cm): 1,24 1,38 1,25 1,17 1,27. Na poziomie ufności 0,9 skonstruować przedział ufności dla średniej objętości kulki. Zakładamy, ze rozkład objętości kulek jest normalny. 3. Wylosowano 48 ziaren pszenicy i zbadano w nich zawartość białka. Otrzymano średnia równa 16,8% i odchylenie standardowe z próby s = 2, 1%. Przy założeniu, ze zawartość białka jest cecha o rozkładzie normalnym, znaleźć 99% przedział ufności dla jej wartości oczekiwanej. 4. Zużycie wody w fabryce podlega losowym wahaniom w kolejnych dniach roku. Na podstawie 365 obserwacji stwierdzono, ze średnie dzienne zużycie wody wynosi 102 hl, a wariancja ˆs2 = 81 hl2. Zakładając, ze zużycie wody ma rozkład normalny, wyznaczyć przedział ufności dla wartości oczekiwanej na poziomie ufności 0,98. 5. Przeprowadzono obserwacje dotyczące opóźnień w ruchu pociągów. Stwierdzono, ze spośród 1000 losowo wybranych pociągów 160 przyjechało z opóźnieniem. Zakładając, ze opóźnienia poszczególnych pociągów są niezależne od siebie i jednakowo prawdopodobne dla każdego pociągu, znaleźć przedział ufności dla prawdopodobieństwa występowania opóźnienia na poziomie ufności 0,9. 6. Wiadomo, ze wysokość drzew lasu brzozowego ma rozkład normalny o wariancji 0,1. Wyznaczyć liczbę drzew, jaka należy wylosować do badania, aby oszacować wartość przeciętną wysokości drzewa, przyjmując poziom ufności 0,95 i błąd oszacowania nie większy niż 0,05. 7. W oparciu o próbę 150 gospodarstw domowych uzyskano informacje, ze przeciętne wydatki tygodniowe na prasę wynoszą 2,5 zł, przy odchyleniu standardowym s = 0, 8. Zakładamy, że rozkład wydatków na prasę jest normalny. Ile należy wylosować gospodarstw do badan, aby oszacować przeciętny poziom wydatków na ten cel z błędem co najwyżej 0,05 na poziomie ufności 0,95? 8. Na próbie 200 dorosłych Polaków przeprowadzono sondaż opinii dotyczącej zabezpieczenia finansowego na przyszłość. Uzyskano 35% pozytywnych odpowiedzi. Ile osób należałoby wylosować do następnego badania, aby na poziomie ufności 98% błąd oszacowania nie przekroczył 3%? 9. Jak liczna należy wziąć próbę aby określić udział osób posiadających telefony komórkowe w populacji generalnej, zakładając, że błąd szacunku powinien wynosić maksymalnie 6%, a poziom ufności 0,99. 10. W oparciu o badania przeprowadzone w Polsce i USA, dotyczące zadowolenia z pracy, uzyskano wyniki: spośród 1167 zbadanych Polaków 78% odpowiedziało twierdząco, natomiast spośród 2000 Amerykanów 20% było niezadowolonych. Porównaj błąd oszacowania frakcji osób zadowolonych z pracy w tych krajach.