Rozkład średniej z próby Przedział ufności, gdy znane σ

Transkrypt

Rozkład średniej z próby Przedział ufności, gdy znane σ
Podstawa konstrukcji:
Rozkład średniej z próby
Wykład 5
Przedziały ufności
• Zwykle nie znamy parametrów populacji, np. µ
• Chcemy określić na ile dokładnie y estymuje µ
• Konstruujemy przedział o środku y , i taki, że
mamy 95% pewności, że zawiera on µ
• Nazywamy go 95% przedziałem ufności (dla µ)
• Ogólnie rozważamy przedziały ufności na
dowolnym poziomie ufności 0%<1-α<100%:
dla 95% PU mamy α = 0.05
dla 90% PU mamy α =
dla 99% PU mamy α =
, itd.
• Jeżeli obserwacje pochodzą z rozkładu N(µ, σ), to
średnia Y z n obserwacji ma rozkład
 σ 
N  µ,

n

• Test: Ile wynosi kwantyl 50% dla Y ?
Idea konstrukcji przedziału ufności:
• Znajdujemy najpierw przedział, w którym Y
mieści się z prawdopodobieństwem 95%
• Użyjemy kwantyli rzędu 0.025 i 0.975 dla
rozkładu zmiennej Y
• Kwantyle standardowego rozkładu normalnego
Pr(Z>1.96) = 0.025, Pr(Z< -1.96) = 0.025.
Oznaczenie: Z0.025 = 1.96.
Ogólnie Zα/2 jest taką liczbą, że
Pr(Z > Zα/2 ) = Pr(Z < - Zα/2) = α/2,
zatem
P(-Zα/2 < Z < Zα/2 ) =
Przedział ufności, gdy znane σ
• Szukane kwantyle dla
Y wynoszą
µ ± Zα / 2σ / n
• Np. kwantyle rzędu 0.025 i 0.975 dla Y
Pr(
< Y <
) = 0.95
• Inaczej ujmując:
Pr( Y
− 1.96
σ
n
< µ <
Y + 1.96
σ
n
) = 0.95
• Mamy 95% pewności, że odcinek
• [
] zawiera µ
• Przedział ten nazywamy 95% przedziałem ufności
• Niestety długość przedziału ufności zależy tu od
wartości σ, której na ogół nie znamy
1
Przedział ufności dla µ, gdy σ jest nieznane
• Estymujemy σ za pomocą s.
• Definiujemy standardowy błąd średniej jako
SE =
s
n
• Musimy zapłacić pewną cenę za
nieznajomość σ: nie możemy brać
kwantyli z rozkładu normalnego:
Estymacja σ wprowadza dodatkową
niepewność
Przedziały ufności są szersze niż w
przypadku, gdy znamy σ
• SE jest estymatorem odchylenia
σ
standardowego średniej Y : σY =
,
n
którego użyliśmy poprzednio w PU
σ
• Będziemy używali SE w miejsce n
Rozkład Studenta
Rozkłady Studenta (i normalny)
2
2,
7
3,
4
4,
1
4,
8
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-5
-4
,3
-3
,6
-2
,9
-2
,2
-1
,5
-0
,8
-0
,1
0,
6
1,
3
Jest to rodzina ciągłych rozkładów, o gęstościach
przypominających standardowy rozkład
normalny, ale mających „cięższe ogony”.
Zależą one od parametru df, liczby stopni
swobody (degrees of freedom)
Np. dla df = 1 otrzymujemy tzw. rozkład
Cauchy’ego,najbardziej odległy od rozkładu
normalnego: nie ma skończonej wartości
oczekiwanej, nie zachodzi dla niego CTG.
1
2
5
10
50
100
200
Z
Przedziały ufości cd.
• Estymując σ za pomocą s, do konstrukcji
przedziału ufności bierzemy kwantyle z
rozkładu Studenta z df=n-1 stopniami
swobody.
• Rysunek i tablica wartości krytycznych z
``Introduction to the Practice of Statistics’’,
D.S. Moore, G. P. McCabe
2
Przykłady:
• Dla jakiej wartości t mamy P(T>t)=0.025,
gdzie T jest zmienną losową o rozkładzie
Studenta z 8 stopniami swobody?
Przedział ufności dla µ, gdy σ jest nieznane:
konkluzja
• Znajdź dwie symetryczne wartości z takie,
że między nimi zawiera się 95% masy
rozkładu Studenta z 11 stopniami
swobody.
Kwantyle rozkładu T wykorzystamy do
konstrukcji przedziałów ufności dla µ.
• Przykład: Z n = 5 obserwacji, obliczono
y = 31.72 i s = 8.729. Wyznacz 95%
przedział ufności dla µ.
Uwagi ogólne
• Znajdź 90% PU:
• 90% PU jest
niż 95% PU.
• Gdy n wzrasta to szerokość przedziału
ufności na ogół
3
Szerokość przedziału ufności wzrasta wraz z poziomem
ufności
• Większy poziom ufności -> Szerszy przedział
• Mniejszy poziom ufności-> Węższy przedział
Szerokość przedziału ufności zmniejsza się wraz
ze wzrostem rozmiaru próby:
• Większa próba-> zwykle węższy przedział
• Mniejsza próba-> zwykle szerszy przedział
4