Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Transkrypt

Rozkłady zmiennych losowych
Estymacja przedziałowa
Statystyka matematyczna. Wykład III.
Edward Kozłowski
e-mail:[email protected]
Edward Kozłowski
Spis treści
1
Rozkład χ2
Rozkład t-Studenta
Rozkład Fischera
2
Przedziały ufności dla nieznanej wartości przeciętnej µ
Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia
standardowego σ
Edward Kozłowski
Rozkład χ2
Definicja 1.
Niech zmiwenne losowe Ui , i = 1, 2, ..., n mają rozkład normalny
N (0; 1), wtedy zmienna losowa
Xn =
n
X
Ui2
i=1
ma rozkład χ2 o n stopniach swobody oraz oznaczamy jako Xn ∼ χ2 (n).
Funkcja gęstości
(
f (x, n) =
√
n
x
1
x 2 −1 e− 2 ,
2n Γ( n
2)
dla x > 0
dla x ¬ 0
0,
gdzie gamma-funkcja Γ (·) jest dana wzorem
Z∞
Γ (m) = sm−1 e−s ds.
0
Edward Kozłowski
Własności:
Wartoś oczekiwana zmiennej losowej Xn o rozkładzie χ2 (n) i
wariancja wynoszą
EXn
V ar (Xn )
= n
=
2n
Zmienna losowa jest asymptotycznie zbieżna (według rozkładu)
Xn − n F
√
−→ U dla n −→ ∞
2n
gdzie zmienna
U ∼ N (0; 1). Zatem dla dośc dużego n mamy
√ losowa
Xn ∼ N n; 2n . Powyższą aproksymację możemy stosowac dla
n 30.
Edward Kozłowski
Zastosowanie:
Niech X1 , ..., Xn oznacza n−elementowa próba której elementy są
podporządkowane rozkładowi normalnemu N (µ, σ). Niech
n
S2
=
2
1X
Xi − X̄ ,
n i=1
X̄
=
1X
Xi .
n i=1
n
Zmienna losowa
Yn =
nS 2
σ2
ma rozkład χ2 (n − 1) i nie zależy od X̄!!!
Edward Kozłowski
Rozkład t-Studenta
Definicja 2.
Niech U oraz Xn będą niezależnymi zmiennymi losowymi o rozkładach
U ∼ N (0; 1) oraz Xn ∼ χ2 (n) odpowiednio. Zmienna losowa
U
Tn = q
Xn
n
ma rozkład t-Stunenta o n stopniach swobody, oznaczamy jako
Tn ∼ t (n).
Funkcja gęstości jest dana wzorem
− n+1
2
Γ n+1
t2
2
1+
f (t, n) = √
n
n
nπΓ 2
Edward Kozłowski
Własności:
Dla n 2 wartoś oczekiwana i wariancja zmiennej losowej Tn o
rozkładzie t (n) wynoszą
ETn
=
0
n
n−2
Dla n = 1 rozkład t-Studenta jest rozkładem Cauchy’ego, gdzie
funkcja gęstości wynosi
1 1
f (t) =
π 1 + t2
Wartoś oczekiwana i wariancja w tym przypadku nie istnieją!!
Za
1
t
lim
dt = +∞
a−→+∞ π
1 + t2
V ar (Tn )
=
0
Zmienna losowa Tn jest asymptotycznie zbieżna (według rozkładu)
do rozkładu normalnego N (0; 1), tzn.
F
Tn −→ U dla n −→ ∞
gdzie zmienna losowaEdward
U Kozłowski
∼ N (0; 1).
Powyższą aproksymację
Zastosowanie:
Niech n−elementowa próba X1 , ..., Xn jest podporządkowana rozkładowi
normalnemu N (µ, σ) oraz X̄ i S 2 oznaczają estymatory średniej i
wariancji odpowiednio. Zmienna losowa postaci
Tn =
X̄ − µ √
n−1
S
ma rozkład t-Studenta o n − 1 stopniach swobody (Tn ∼ t (n − 1)).
Edward Kozłowski
Rozkład Fischera
Definicja 3.
Niech zmienne Xn oraz Xm mają rozkłady χ2 o n i m stopniach
swobody odpowiednio( Xn ∼ χ2 (n), Xm ∼ χ2 (m)). Zmienna losowa
Vn,m =
Xn
n
Xm
m
ma rozkład Fischera o n i m stopniach swobody (oznaczamy jako
Vn,m ∼ F (n, m)).
Funkcja gęstości jest dana wzorem

n
n
m
 Γ( n+m
2 )
x 2 −1
2
2
n+m ,
n
m n m
Γ
Γ
(2) ( 2 )
f (x, n, m) =
(m+nx) 2
 0,
Edward Kozłowski
dla x > 0,
dla x ¬ 0.
Własności:
Wartość oczekiwana zmiennej losowej Vn,m
EVn,m =
m
m−2
dla m > 2.
Wariancja zmiennej losowej Vn,m
V ar (Vn,m ) =
2m2 (m + n − 2)
2
n (m − 2) (m − 4)
dla m > 4.
Edward Kozłowski
Zastosowanie:
Niech n−elementowa próba X1 , ..., Xn jest podporządkowana rozkładowi
normalnemu N (µX , σ), natomiast m−elementowa próba Y1 , ..., Ym jest
podporządkowana rozkładowi normalnemu N (µY , σ). Zmienne losowe
X1 , ..., Xn , Y1 , ..., Ym są niezależne. Niech X̄ i Ȳ oznaczają estymatory
średnich zmiennych losowych X i Y odpowiednio. Zmienna losowa
1
n−1
Vn,m =
1
m−1
n
P
i=1
n
P
Xi − X̄
2
Yi − Ȳ
2
i=1
ma rozkład F (n − 1, m − 1).
Edward Kozłowski
Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ
Metoda przedziałowa polega na określeniu przedziałów ufności dla
nieznanych parametrów rozkładu.
Definicja 4.
Dla ustalonego poziomu ufności 1 − α (poziomu istotności 0 < α < 1)
przedziałem ufności parametru Θ nazywamy przedział (Θ1 , Θ2 ) gdzie
końce tego przedziału Θ1 = Θ1 (X1 , ..., Xn ) i Θ2 = Θ2 (X1 , ..., Xn ) są
funkcjami próby losowej oraz spełniają warunek
P (Θ1 (X1 , ..., Xn ) < Θ < Θ2 (X1 , ..., Xn )) = 1 − α.
Widzimy że końce przedziału ufności są zmiennymi losowymi. Nieznana
wartość parametru Θ może należeć do przedziału (Θ1 , Θ2 ) lub tez nie!
Dla różnych próbek losowych x1 , ..., xn znajdujemy różne przedziały
ufności.
Stosunek przedziałów ufności które zawierają nieznany parametr Θ do
wszystkich przedziałów skonstruowanych w oparciu o próby x1 , ..., xn
wynosi 1 − α.
Edward Kozłowski
Przykład 1.
Dla poziomu ufności 1 − α w oparciu o próbę losową X1 , ..., Xn znaleźć
przedział ufności dla nieznanej wartości µ populacji, w której cecha X
ma rozkład normalny N (µ, σ) oraz prametr σ jest znany.
Z twierdzenia Lindeberga - Levy’ego zmienna losowa
X̄ =
X1 + X2 + ... + Xn
n
dąży do rozkładu N µ, √σn , natomiast statystyka
U=
X̄ − µ √
n
σ
ma rozkład normalny N (0, 1). Zadanie polega na wyznaczeniu kwantyli
u1 i u2 tak aby spełniona była równość
P (u1 < U < u2 ) = F (u2 ) − F (u1 ) = 1 − α.
Edward Kozłowski
Przyjmuąc u2 = F −1 (1 − α2 ) oraz u1 = F −1 (α1 ), gdzie α = α1 + α2 ,
mamy
F (u2 ) − F (u1 ) = 1 − α2 − α1 = 1 − α
Rozwiązując nierówność
u1 <
otrzymujemy
X̄ − µ √
n < u2
σ
σ
σ
X̄ − u2 √ < µ < X̄ − u1 √ .
n
n
Edward Kozłowski
Uwaga.
Wybierając dowolne α1 , α2 tak aby była spełniona równość
α = α1 + α2 otrzymujemy różne przedziały ufności.
Jeżeli α1 = α2 = α2, to dla rozkładu
normalnego N (0, 1)
mamy F −1 1 − α2 = −F −1 α2 , stąd −u1 = u2 . Zatem przedział
ufności jest postaci
σ
σ
X̄ − u √ < µ < X̄ + u √ ,
n
n
α
−1
1− 2 .
gdzie u = F
W przypadku, gdy α1 = α, to mamy
P (u < U ) = 1 − α.
X̄ − µ √
n
σ
otrzymujemy lewostronny przedział ufności
σ
µ < X̄ − u √ ,
n
u<
gdzie u = F −1 (α).
Edward Kozłowski
Uwaga cd.
W przypadku, gdy α2 = α, to
P (U < u) = 1 − α.
X̄ − µ √
n<u
σ
otrzymujemy prawostronny przedział ufności
σ
X̄ − u √ < µ,
n
gdzie u = F −1 (1 − α).
Edward Kozłowski
Przedziały ufności dla nieznanej wartości przeciętnej
* Cecha X ma rozkład normalny N (µ, σ), gdzie prametr µ jest
nieznany, natomiast znane jest ochylenie standardowe σ. Dla
poziomu ufności 1 − α w oparciu o próbę X1 , ..., Xn przedział ufności dla
nieznanej wartości µ populacji wynosi (patrz przykład 1)
gdzie u = F −1
σ
σ
X̄ − u √ < µ < X̄ + u √ ,
n
n
1 − α2 .
Edward Kozłowski
* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ są
nieznane oraz n < 100. Statystyka
X̄ − µ √
n−1
S
ma rozklad t-Studenta o n − 1 stopniach swobody, gdzie
Tn =
n
X̄
=
S
=
1X
Xi
n i=1
v
u n
u1 X
2
t
Xi − X̄
n i=1
Z tablic rozkładu t-Studenta na poziomie ufności 1 − α odczytujemy
kwantyle rzędu 1 − α2 oraz α2 . Ponieważ rozkład t-Studenta jest
rozkładem symetrycznym, to
α
α
t∗ = t−1
, n − 1 = −t−1 1 − , n − 1 ,
2
2
gdzie t(x, n) oznacza dystrybuantę rozkladu t-Studenta o n stopniach
swobody.
Edward Kozłowski
Dla poziomu ufności 1 − α w oparciu o próbę X1 , ..., Xn przedział
ufności dla nieznanej wartości µ populacji wyznaczamy z równości
X̄ − µ √
P −t∗ <
n − 1 < t∗ = 1 − α.
S
Ostatecznie otrzymujemy
X̄ − S √
t∗
t∗
< µ < X̄ + S √
.
n−1
n−1
Edward Kozłowski
* Cecha X ma dowolny rozkład o nieznanych wartości średniej µ i
odchyleniu standardowym σ (σ < ∞). Dla dużych populacji n 100 z
twierdzenia Lindeberga - Levy’ego statystyka
U=
X̄ − µ √
n
S1
ma rozkład asymptotycznie zbieżny do N (0, 1), gdzie
n
2
P
1
Xi − X̄ jest nieobciążonym estymatorem odchylenia
S12 = n−1
i=1
standardowego σ.
Dla poziomu ufności 1 − α w oparciu o próbę X1 , ..., Xn przedział
ufności dla nieznanej wartości µ populacji wynosi
gdzie u = F −1
S1
S1
X̄ − u √ < µ < X̄ + u √ ,
n
n
1 − α2 .
Edward Kozłowski
Przedziały ufności dla nieznanej wariancji i odchylenia
standardowego
nieznane. Dla próby o liczebności n ¬ 50 statystyka
χ2 =
nS 2
σ2
ma rozkład χ2 (chi-kwadrat) o n − 1 stopniach swobody. Z tablic
rozkładu χ2 na poziomie ufności 1 − α odczytujemy
kwantyle rzędu
1 − α2 oraz α2 i oznaczamy je jako χ2 α2 , n − 1 , χ2 1 − α2 , n − 1 . Dla
poziomu istotności α w oparciu o próbę X1 , ..., Xn przedział ufności dla
nieznanej wariancji w populacji wyznaczamy z równości
nS 2
α
α
, n − 1 < 2 < χ2 1 − , n − 1
= 1 − α.
P χ2
2
σ
2
Edward Kozłowski
Ostatecznie, przedział ufności dla wariancji σ 2 wynosi
χ2
nS 2
nS 2
< σ2 <
,
α
α
1 − 2,n − 1
χ2 2 , n − 1
natomiast dla odchylenia standardowego σ
√
√
S n
S n
q
<σ< q
.
χ2 1 − α2 , n − 1
χ2 α2 , n − 1
Edward Kozłowski
nieznane. Dla próby o liczbności n 50 statystyka
r
p
nS 2
S√
2χ2 = 2 2 =
2n
σ
σ
√
dąży do rozkładu normalnego N
2n − 3, 1 . Zatem dla poziomu
istotności α w oparciu o próbę X1 , ..., Xn przedział ufności dla nieznanej
wariancji w populacji wyznaczamy z równości
√
S√
2n − 2n − 3 < u = 1 − α,
P −u <
σ
gdzie u jest kwantylem rzędu 1 − α2 dla rozkładu normalnego N (0, 1).
Ostatecznie przedział ufności dla odchylenia standardowego σ wynosi
√
√
S 2n
S 2n
√
<σ< √
.
2n − 3 + u
2n − 3 − u
Edward Kozłowski

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Transkrypt

Podobne dokumenty

Cecha niezależna

Rachunek prawdopodobieństwa: Lista 9-10

Zestawienie ośmiu najważniejszych przedziałów ufności

Podstawy statystyki

Przykładowe pytania

Liczba godzin ćwiczeń

Seminaria ZTV - Instytut Radioelektroniki

Bootstrapowe przedziały ufności