Rozkład średniej z próby Przedział ufności, gdy znane σ
Transkrypt
Rozkład średniej z próby Przedział ufności, gdy znane σ
Podstawa konstrukcji: Rozkład średniej z próby Wykład 5 Przedziały ufności • Zwykle nie znamy parametrów populacji, np. µ • Chcemy określić na ile dokładnie y estymuje µ • Konstruujemy przedział o środku y , i taki, że mamy 95% pewności, że zawiera on µ • Nazywamy go 95% przedziałem ufności (dla µ) • Ogólnie rozważamy przedziały ufności na dowolnym poziomie ufności 0%<1-α<100%: dla 95% PU mamy α = 0.05 dla 90% PU mamy α = dla 99% PU mamy α = , itd. • Jeżeli obserwacje pochodzą z rozkładu N(µ, σ), to średnia Y z n obserwacji ma rozkład σ N µ, n • Test: Ile wynosi kwantyl 50% dla Y ? Idea konstrukcji przedziału ufności: • Znajdujemy najpierw przedział, w którym Y mieści się z prawdopodobieństwem 95% • Użyjemy kwantyli rzędu 0.025 i 0.975 dla rozkładu zmiennej Y • Kwantyle standardowego rozkładu normalnego Pr(Z>1.96) = 0.025, Pr(Z< -1.96) = 0.025. Oznaczenie: Z0.025 = 1.96. Ogólnie Zα/2 jest taką liczbą, że Pr(Z > Zα/2 ) = Pr(Z < - Zα/2) = α/2, zatem P(-Zα/2 < Z < Zα/2 ) = Przedział ufności, gdy znane σ • Szukane kwantyle dla Y wynoszą µ ± Zα / 2σ / n • Np. kwantyle rzędu 0.025 i 0.975 dla Y Pr( < Y < ) = 0.95 • Inaczej ujmując: Pr( Y − 1.96 σ n < µ < Y + 1.96 σ n ) = 0.95 • Mamy 95% pewności, że odcinek • [ ] zawiera µ • Przedział ten nazywamy 95% przedziałem ufności • Niestety długość przedziału ufności zależy tu od wartości σ, której na ogół nie znamy 1 Przedział ufności dla µ, gdy σ jest nieznane • Estymujemy σ za pomocą s. • Definiujemy standardowy błąd średniej jako SE = s n • Musimy zapłacić pewną cenę za nieznajomość σ: nie możemy brać kwantyli z rozkładu normalnego: Estymacja σ wprowadza dodatkową niepewność Przedziały ufności są szersze niż w przypadku, gdy znamy σ • SE jest estymatorem odchylenia σ standardowego średniej Y : σY = , n którego użyliśmy poprzednio w PU σ • Będziemy używali SE w miejsce n Rozkład Studenta Rozkłady Studenta (i normalny) 2 2, 7 3, 4 4, 1 4, 8 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 -5 -4 ,3 -3 ,6 -2 ,9 -2 ,2 -1 ,5 -0 ,8 -0 ,1 0, 6 1, 3 Jest to rodzina ciągłych rozkładów, o gęstościach przypominających standardowy rozkład normalny, ale mających „cięższe ogony”. Zależą one od parametru df, liczby stopni swobody (degrees of freedom) Np. dla df = 1 otrzymujemy tzw. rozkład Cauchy’ego,najbardziej odległy od rozkładu normalnego: nie ma skończonej wartości oczekiwanej, nie zachodzi dla niego CTG. 1 2 5 10 50 100 200 Z Przedziały ufości cd. • Estymując σ za pomocą s, do konstrukcji przedziału ufności bierzemy kwantyle z rozkładu Studenta z df=n-1 stopniami swobody. • Rysunek i tablica wartości krytycznych z ``Introduction to the Practice of Statistics’’, D.S. Moore, G. P. McCabe 2 Przykłady: • Dla jakiej wartości t mamy P(T>t)=0.025, gdzie T jest zmienną losową o rozkładzie Studenta z 8 stopniami swobody? Przedział ufności dla µ, gdy σ jest nieznane: konkluzja • Znajdź dwie symetryczne wartości z takie, że między nimi zawiera się 95% masy rozkładu Studenta z 11 stopniami swobody. Kwantyle rozkładu T wykorzystamy do konstrukcji przedziałów ufności dla µ. • Przykład: Z n = 5 obserwacji, obliczono y = 31.72 i s = 8.729. Wyznacz 95% przedział ufności dla µ. Uwagi ogólne • Znajdź 90% PU: • 90% PU jest niż 95% PU. • Gdy n wzrasta to szerokość przedziału ufności na ogół 3 Szerokość przedziału ufności wzrasta wraz z poziomem ufności • Większy poziom ufności -> Szerszy przedział • Mniejszy poziom ufności-> Węższy przedział Szerokość przedziału ufności zmniejsza się wraz ze wzrostem rozmiaru próby: • Większa próba-> zwykle węższy przedział • Mniejsza próba-> zwykle szerszy przedział 4