Przedziały ufności dla średniej i wariancji

Transkrypt

Przedziały ufności dla średniej i wariancji
Wyznaczenie przedziału ufności dla średniej
W związku z tym, że średnia wartość badanej cechy stanowi najczęściej szacowany parametr
populacji generalnych, szczególne znaczenie ma znajomość przedziału ufności dla tego właśnie
parametru. Najlepszym estymatorem wartości średniej w populacji generalnej (m) jest średnia
arytmetyczna ( ) z próby. Ma ona wszelkie pożądane cechy estymatorów: zgodność, nieobciążoność,
efektywność, dostateczność. Jej rozkład wykorzystuje się do budowy przedziału ufności dla wartości
średniej w populacji. W zależności od przyjętych założeń otrzymuje się konkretne wzory na
przedziały ufności. W naszym przypadku założymy, że populacja generalna ma rozkład normalny
(N(m,σ)). Przedział ufności dla wartości średniej dany jest wówczas wzorem:
Gdzie:
- średnia arytmetyczna obliczona na podstawie n - elementowej populacji próby,
s
próbkowe
oszacowanie
odchylenia
standardowego,
uα wartość zmiennej losowej U o sdandaryzowanym rozkładzie normalnym (N(0,1)) wyznaczoną w
taki sposób aby spełniona była relacja:
Warto zapamiętać, że dla:
1-α = 0.95; uα = 1.96;
1-α = 0.99; uα = 2.58;
Wyznaczenie przedziału ufności dla wariancji
W badaniach statystycznych, do najczęściej szacowanych parametrów, obok średniej należy wariancja
(σ2) (lub odchylenie standardowe (σ)) badanej cechy. Gdy rozkład badanej cechy jest normalny (lub
zbliżony do normalnego), można zbudować przedział ufności dla wariancji. Tak jak zwykle przedział
ufności dla wariancji, opiera się na rozkładzie statystyki będącej jej estymatorem. Najbardziej
znanymi estymatorami wariancji w populacji generalnej są statystyki:
(a)
(b)
Wprawdzie estymator wariancji ze wzoru (b) jest nieobciążonym estymatorem wariacji (σ2), podczas
gdy estymator ze wzoru (a) jest obciążonym estymatorem wariacji (σ2), ale oba te estymatory są
równoważne jeżeli chodzi o przedział ufności dla wariancji. Natomiast oba estymatory odchylenia
standardowego (obliczone jako pierwiastki kwadratowe wariancji ze wzorów (a) i (b)) są obciążonymi
estymatorami odchylenia standardowego (σ).
W zależności od liczebności próby, przedział ufności budujemy w oparciu o rozkład statystyki s2 (tzn.
rozkład χ2), bądź też o jej rozkład graniczny (rozkład normalny).
Obliczając pierwiastki kwadratowe z krańcowych elementów przedziału ufności dla wariancji (σ2),
otrzymamy przedział ufności dla odchylenia standardowego (σ).
W zależności od liczebności próby mamy dwa sposoby obliczania przedziałów ufności dla odchylenia
standardowego (σ).
MODEL I (dla małej liczebności próby).
Gdy rozkład badanej cechy w populacji generalnej jest normalny o parametrach: m i σ oraz liczebność
populacji próby jest mniejsza niż 30 elementów (n<30), obliczamy ze wzoru (a) lub (b) próbkowe
oszacowanie wariancji.
gdy wariancję liczono ze
wzoru (a):
gdy wariancję liczono ze
wzoru (b):
Gdzie:
c1, c2 - są wartościami zmiennej χ2 wyznaczone z tablicy rozkładu χ2 dla n-1 stopni swobody oraz
współczynnika ufności (1-α) w taki sposób aby spełnione były relacje:
W związku z tym, że powszechnie używane tablice rozkładu χ2 podają wartości krytyczne statystyki
χ2, zatem dla określonego współczynnika ufności (1-α), wartość c2 znajdujemy w tablicach dla
prawdopodobieństwa: 1-(1/2)α, natomiast wartość c1 dla prawdopodobieństwa: (1/2)α
MODEL II (dla dużej liczebności próby).
W przypadku, gdy mamy do czynienia z liczną populacją próby i rozkład badanej cechy nie podważa
zgodności rozkładu cechy w populacji generalnej z rozkładem normalnym (N(m,σ)), obliczamy z
próby oszacowania odchylenia standardowego (s). Wtedy przedział ufności dla odchylenia
standardowego (σ) w populacji generalnej jest określony wzorem:
Gdzie:
s
próbkowe
oszacowanie
odchylenia
standardowego,
uα wartość zmiennej losowej U o sdandaryzowanym rozkładzie normalnym (N(0,1)) wyznaczoną w
taki sam sposób jak dla średniej arytmetycznej.
Zadania do wykonania:
Przypuśćmy, że waga noworodka ma rozkład normalny o wariancji 0, 25 kg2. Zważono 100
noworodków i okazało się, że średnia waga wyniosła 3,5 kg. Wyznaczyć przedział ufności dla
wartości oczekiwanej wagi noworodka na poziomie ufności 95%.
2. Zmierzono objętości 5 losowo wybranych kulek z partii kulek łożyskowych otrzymując (w
cm): 1,24 1,38 1,25 1,17 1,27. Na poziomie ufności 0,9 skonstruować przedział ufności dla
średniej objętości kulki. Zakładamy, ze rozkład objętości kulek jest normalny.
3. Wylosowano 48 ziaren pszenicy i zbadano w nich zawartość białka. Otrzymano średnia
równa 16,8% i odchylenie standardowe z próby s = 2, 1%. Przy założeniu, ze zawartość
białka jest cecha o rozkładzie normalnym, znaleźć 99% przedział ufności dla jej wartości
oczekiwanej.
4. Zużycie wody w fabryce podlega losowym wahaniom w kolejnych dniach roku. Na
podstawie 365 obserwacji stwierdzono, ze średnie dzienne zużycie wody wynosi 102 hl, a
wariancja ˆs2 = 81 hl2. Zakładając, ze zużycie wody ma rozkład normalny, wyznaczyć
przedział ufności dla wartości oczekiwanej na poziomie ufności 0,98.
5. Przeprowadzono obserwacje dotyczące opóźnień w ruchu pociągów. Stwierdzono, ze
spośród 1000 losowo wybranych pociągów 160 przyjechało z opóźnieniem. Zakładając, ze
opóźnienia poszczególnych pociągów są niezależne od siebie i jednakowo prawdopodobne
dla każdego pociągu, znaleźć przedział ufności dla prawdopodobieństwa występowania
opóźnienia na poziomie ufności 0,9.
6. Wiadomo, ze wysokość drzew lasu brzozowego ma rozkład normalny o wariancji 0,1.
Wyznaczyć liczbę drzew, jaka należy wylosować do badania, aby oszacować wartość
przeciętną wysokości drzewa, przyjmując poziom ufności 0,95 i błąd oszacowania nie
większy niż 0,05.
7. W oparciu o próbę 150 gospodarstw domowych uzyskano informacje, ze przeciętne
wydatki tygodniowe na prasę wynoszą 2,5 zł, przy odchyleniu standardowym s = 0, 8.
Zakładamy, że rozkład wydatków na prasę jest normalny. Ile należy wylosować gospodarstw
do badan, aby oszacować przeciętny poziom wydatków na ten cel z błędem co najwyżej 0,05
na poziomie ufności 0,95?
8. Na próbie 200 dorosłych Polaków przeprowadzono sondaż opinii dotyczącej
zabezpieczenia finansowego na przyszłość. Uzyskano 35% pozytywnych odpowiedzi. Ile
osób należałoby wylosować do następnego badania, aby na poziomie ufności 98% błąd
oszacowania nie przekroczył 3%?
9. Jak liczna należy wziąć próbę aby określić udział osób posiadających telefony komórkowe
w populacji generalnej, zakładając, że błąd szacunku powinien wynosić maksymalnie 6%, a
poziom ufności 0,99.
10. W oparciu o badania przeprowadzone w Polsce i USA, dotyczące zadowolenia z pracy,
uzyskano wyniki: spośród 1167 zbadanych Polaków 78% odpowiedziało twierdząco,
natomiast spośród 2000 Amerykanów 20% było niezadowolonych. Porównaj błąd
oszacowania frakcji osób zadowolonych z pracy w tych krajach.