1 Przedziały ufności

Transkrypt

1 Przedziały ufności
1
Przedziały ufności
W tym rozdziale będziemy zajmować się przede wszystkim zadaniami związanymi z przedziałami ufności.
Będą nas również interesować statystki pozycyjne oraz estymatory największej wiarygodności.
1. (Eg 48/10) Niech X1 , X2 , ..., Xn , n > 5 będą niezależnymi zmiennymi losowymi o rozkładzie
jednostajnym na przedziale (0, θ), gdzie θ > 0 jest nieznanym parametrem. Wyznaczamy przedział
ufności dla parametru θ postaci
[2X3,n , 2Xn−2,n ],
gdzie Xk,n oznacza k-tą statystykę pozycyjną z próby X1 , X2 , ..., Xn . Dla jakiej najmniejszej liczebności próby losowej n zachodzi
Pθ (θ ∈ [2X2,n , 2Xn−2,n ]) > 0, 9.
Odp: D-> 11.
Rozwiązanie. Należy pamiętać, że dla ustalonej wartości t zdarzenie Xk,n 6 t jest osiągnięciem
co najmniej k sukcesów w doświadczeniu Bernoulliego z prawdopodobieństwem sukcesu F (t) = t/θ
dla 0 < t < θ, gdzie F jest dystrybuantą rozkładu jednostajnego na (0, θ). Zatem z prawdopodobieństwem sukcesu F (t) = t/θ dla 0 < t < θ, gdzie F jest dystrybuantą rozkładu jednostajnego
na (0, θ). Zatem
θ
Pθ (X2,n 6 6 Xn−2,n ) = P(2 6 S 6 n − 2),
2
gdzie S pochodzi z rozkładu B(n, 21 ). Obliczamy
P(2 6 S 6 n−2) = 1−P(S 6 2)−P(S > n−2) = 1−2(
n −n
2 +n2−n +2−n ) = 1−(n2 +n+2)2−n .
2
Dla n = 11 otrzymujemy po raz pierwszy wartość (n2 + n + 2)2−n mniejszą od 0, 1.
333333
2. (Eg 49/10) Niech X1 , X2 , ..., X10 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
o gęstości
fθ (x) = θxθ−1 1x∈(0,1) ,
gdzie θ > 0 jest nieznanym parametrem. Wyznaczamy przedział ufności dla parametru θ postaci
[cθ̂, dθ̂],
gdzie θ̄ = θ̄(X1 , X2 ..., X10 ) jest estymatorem największej wiarogodności, a stałe c i d są dobrane
tak, aby Pθ (θ < cθ̂) = Pθ (θ > dθ̂) = 0, 05. Wyznaczyć c i d. Odp: A-> c = 0, 54 i d = 1, 57.
Rozwiązanie. Obliczamy wiarygodność
L(θ, x) = θ10
10
Y
xθ−1
1xi ∈(0,1) .
i
i=1
Zatem dla ustalonego x funkcja f (θ) = ln L(θ, x) osiąga maksimum dla θ spełniającego f 0 (θ) = 0,
czyli
10
1 X
10 +
ln xi = 0.
θ i=1
Stąd
10
θ̄ = − P10
.
i=1 ln xi
1
Pozostaje znaleźć c i d takie, że
Pθ (θ < cθ̄) = Pθ (θ > dθ̄) = 0, 05.
P10
Nietrudno sprawdzić, że − ln Xi ma rozkład wykładniczy z parametrem θ. Stąd − i=1 ln Xi ma
rozkład Gamma(10, θ). Zatem θ/θ̄ ma rozkład Gamma(10, 10), który dalej jest tym samym co
1
20 1
1 2
20 Gamma( 2 , 2 ) czyli 20 χ (20). To oznacza, że 20c będzie dolnym a 20d górnym kwantylem dla
2
rozkładu χ (20) dla wartości 0, 05. Korzystając z tablica znajdujemy c ' 0, 54, d ' 1, 57.
3. (Eg 50/5) Niech X1 , ..., Xn , n > 1 będzie próbką z rozkładu jednostajnego o gęstości danej wzorem:
fθ (x) =
1
1x∈(0,θ) ,
θ
gdzie θ jest nieznanym parametrem. Zmienne losowe X1 , ..., Xn nie są w pełni obserwowalne.
Obserwujemy zmienne losowe Yi = min(Xi , M ), gdzie M jest ustaloną liczbą dodatnią. Oblicz
estymator największej wiarogodności θ̂ parametru θ jeśli wiadomo, że w próbce Y1 , ..., Yn , jest K
obserwacji o wartościach mniejszych niż M i K ∈ {1, ..., n − 1} Odp: B-> M n/K.
Rozwiązanie. Z danych zadania dostajemy, że θ > M . Szansa, że dokładnie K zmiennych będzie
mniejszych niż M wynosi
n M K θ − M n−K
)
.
( ) (
θ
θ
K
Warto zauważyć, że przy okazji jest to funkcja wiarygodności. Poszukujemy wartości θ dla której
funkcja f (θ) = ln L(θ, x) przyjmuje maksimum czyli punktu θ takiego, że f 0 (θ) = 0. Zachodzi
1
1
−n + (n − K)
= 0.
θ
θ−M
Zatem θ̄ = M n/K.
4. (Eg 51/2) Załóżmy, że X1 , X2 , ..., Xn ,P
n > 2 są niezależnymi zmiennymi losowymi o jednakowym
n
rozkładzie wykładniczym. Niech S = i=1 Xi . Oblicz
p = P(X1 6 S/2, ..., Xn 6 S/2).
Odp: D-> 1 −
n
2n−1 .
Rozwiązanie.
Kluczowe to aby zauważyć, że zdarzeniem przeciwnym do X1 6 S/2, ..., Xn 6 S/2
Sn
jest i=1 {Xi > S/2}. Zatem
P(X1 6 S/2, ..., Xn 6 S/2) = 1 − nP(X1 > S/2).
Rozkład X1 /S jest postaci Beta(1, n − 1). Stąd
Z
P(X1 6 S/2) =
1
(n − 1)(1 − y)n−2 dy =
1
2
1
2n−1
.
Stąd p = 1 − n2−n+1 .
5. (Eg 52/9) Załóżmy, że X1 , X2 , ..., Xn , ... jest ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie wykładniczym o gęstości
f (x) =
1
exp(−x/µ) dla x > 0.
µ
2
Zmienna losowa N jest niezależna od X1 , X2 , ..., Xn , ... i ma rozkład geometryczny dany wzorem:
P(N = n) = p(1 − p)n dla n = 0, 1, 2, ...
PN
Niech SN = i=1 (przy tym S0 = 0, zgodnie z konwencją). Oblicz E(N |SN = s), dla s > 0.
Odp: D-> s(1 − p)/µ + 1.
Rozwiązanie. Stosujemy ogólny wzór Bayesa. Najpierw wyznaczamy gęstość (N, S) względem
µ ⊗ λ, gdzie µ jest miarą liczącą na Z, a λ miarą Lebesgue’a na R. Przypomnijmy, że Sn ma
rozkład Gamma(n, µ1 )
fN,SN (n, s) = p(1 − p)n
s
sn−1
e− µ 1s>0 1N =0 .
(n − 1)!µn
Rozkład (N, SN ) ma też atom w (0, 0) który osiąga z prawdopodobieństwem p. Obliczamy gęstość
warunkową dla s > 0
[(1 − p)s]n−1 (1−p)s
fN,SN (n|s) =
e µ 1n>0 .
(n − 1)!µn−1
Zatem
∞
X
n[(1 − p)s]n−1 − (1−p)s
s(1 − p)
µ
e
=1+
.
n−1
(n
−
1)!µ
µ
n=1
E(N |Sn = s) =
6. (Eg 53/6) Rozważmy zmienne losowe N, X, Y . Wiadomo, że rozkład warunkowy zmiennej losowej
N , gdy X = x i Y = y jest rozkładem Poissona o wartości oczekiwanej x. Rozkład warunkowy
zmiennej losowej X, gdy Y = y jest rozkładem Gamma(2, y), a rozkład zmiennej Y jest rozkładem
Gamma(4, 3), gdzie rozkład Gamma(α, β) ma gęstość
pα,β =
β α α−1 −βx
x
e
1x>0 .
Γ(α)
Wtedy wariancja VarN jest równa
Odp: B-> 7.
Rozwiązanie. Obliczamy
VarN = EN 2 − (EN )2 = EE(N 2 |X, Y ) − (EE(N, X, Y ))2 = E(X 2 + X) − (EX)2 =
6
2
2
= EE(X 2 + X|Y ) − (EE(X|Y ))2 = E 2 + − (E )2 .
Y
Y
Y
Dla zmiennej Z z rozkładu Gamma(α, β) jeśli α > 2, to EZ −2 =
EZ
−1
=
β
α−1 .
Zatem EY
−2
=
3
2,
EY
−1
=
3
3
β2
(α−1)(α−2)
oraz jeśli α > 1, to
= 1. Czyli
VarN = 9 + 2 − 4 = 7.
7. (Eg 54/8) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
o gęstości
pa,b = be−b(x−a) 1x>a
gdzie a ∈ R i b > 0 są nieznanymi parametrami. Rozważmy estymator największej wiarygodności
(Ta , Tb ) wektora parametrów (a, b). Wartości oczekiwane ETa i ETb są równe
1
n
Odp: D-> ETa = a + nb
, ETb = n−2
b.
3
Rozwiązanie. Obliczamy wiarygodność
L((a, b), x) = bn exp(−b
n
X
(xi − a))1min(xi )>a .
i=1
Szukamy punktu (a, b) maksymalizującego wiarygodność. Oczywiście Ta = min(x1 , ..., xn ) natomiast b wyznaczamy korzystając z funkcji f (b) = ln L((Ta , b), x), rozwiązując równanie f 0 (b) = 0
czyli
n
n X
n
.
=
(xi − Ta ), zatem Tb = Pn
b
i=1 (xi − Ta )
i=1
Obliczamy
Z
∞
n
Z
P(Xi − a > t) dt =
ETa − a =
∞
e−nbx dx =
0
0
1
,
nb
Pn
1
czyli ETa = a + nb
. Z powodu braku pamięci rozkładu wykładniczego rozkład i=1 (xi − Ta )
będzie rozkładem (n − 1) zmiennych niezależnych o rozkładzie wykładniczym z parametrem b
czyli Gamma(n − 1, b). Obliczamy
Z ∞ n−1
b
n
ETb = n
xn−2 e−bx dx =
b.
(n − 2)!
n−2
0
8. (Eg 55/6) Niech N oraz X1 , X2 , ... będą niezależnymi zmiennymi losowymi, przy czym N ma
rozkład Poissona z wartością oczekiwaną λ = 1, zaś rozkład każdej ze zmiennych Xn podaje
następująca tabelka:
x
1 2 3
.
P(Xn = x) 21 14 14
PN
Niech S =
i=1 Xi dla N > 0 i S = 0 dla N = 0. Oblicz warunkową wartość oczekiwaną
E(N |S = 3).
27
.
Odp: A-> 19
Rozwiązanie. Mamy klasyczny wzór Bayesa
E(N |S = 3) =
∞
X
nP(N = n|S = 3) =
n=0
∞
X
P(S = 3|N = n)P(N = n)
n P∞
.
m=0 P(S = 3|N = m)P(N = m)
n=0
Nadto
∞
X
nP(S = 3|N = n)P(N = n) = P(X1 = 3)P(N = 1) + 2(P(X1 = 2, X2 = 1)+
n=0
+ P(X1 = 1, X2 = 2))P(N = 2) + 2P(X1 = X2 = X3 = 1)P (N = 3) =
1 1
1
= e−1 ( + + )
4 4 16
oraz
∞
X
P(S = 3|N = m)P(N = m) = P(X1 = 3)P(N = 1)+
m=0
+ (P(X1 = 2, X2 = 1) + P(X1 = 1, X2 = 2))P (N = 2) + P(X1 = X2 = X3 = 1) =
1 1
1
= e−1 ( + + )
4 8 48
Stąd E(N |S = 3) =
27
19 .
4
9. (Eg 56/9) Niech X1 , X2 , ..., Xn będą zmiennymi losowymi o rozkładzie P areto(1, a1 ) a Y1 , Y2 , ..., Ym
będą zmiennymi losowymi o rozkładzie P areto(1, a2 ), gdzie a1 , a2 > 0 są nieznanymi parametrami.
Wszystkie zmienne są niezależne. Na poziomie ufności 1 − α budujemy przedział ufności [dT, cT ]
dla parametru aa12 na podstawie estymatora największej wiarogodności T tegoż parametru w ten
sposób, że
a1
a1
α
Pa1 ,a2 (cT < ) = Pa1 ,a2 (dT > ) = .
a2
a2
2
Jeśli α = 0, 1 i m = 4 i n = 5, to przedział ufności ma długość
Odp: E-> 3, 02T .
Rozwiązanie. Jeśli m = 4 i n = 5, to funkcja wiarygodności ma postać
L((a1 , a2 ), (x, y)) = α15 α24
5
Y
(xi )−α1 −1 1xi >1
i=1
4
Y
(yj )−α2 −1 1yj >1 .
j=1
Zatem estymatorem EN W (α1 , α2 ) jest punkt minimum funkcji f (α1 , α2 ) = ln L((a1 , a2 ), (x, y)),
∂f
∂f
= ∂α
= 0. Obliczamy
czyli rozwiązanie równania ∂α
1
2
5
4
X
X
5
4
ln xi ,
ln yi .
=
=
α1
α2
i=1
i=1
Stąd α̂1 =
P5 5
,
i=1 ln Xi
α̂2 =
P4 4
i=1
ln Yi
. Zatem
P4
α̂1
5 i=1 ln Yi
T =
= P5
.
α̂2
4 i=1 ln Xi
P5
P4
Oczywiście i=1 ln Xi ma rozkład Gamma(5, α1 ), a i=1 ln Yi rozkład Gamma(4, α2 ) nadto te
P4
P5
1
2
zmienne są niezależne. Stąd 2α1 i=1 ln Xi ma rozkład Gamma( 10
i=1 ln Yi
2 , 2 ) = χ (10), a 2α2
ma rozkład Gamma( 82 , 12 ) = χ2 (8). Zatem aa12 T ma rozkład Fishera-Snedecora F (10, 8). Odczytujemy z tablic c = 3, 347, d = 0, 326. Stąd długość [dT, cT ] wynosi w przybliżeniu 3, 021T .
10. (Eg 57/7) Niech X1 , X2 , ..., X10 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
o nieznanej medianie m. Budujemy przedział ufności dla parametru m postaci [X3:10 , X7:10 ], gdzie
Xk:10 oznacza k-tą statystykę pozycyjną z próby X1 , X2 , ..., X10 . Prawdopodobieństwo P(m ∈
[X3:10 , X7:10 ]) jest równe
114
Odp: A-> 128
.
Rozwiązanie. Należy zauważyć, że dla ustalonego t szansa, że Xk:10 6 t jest równe prawdopodobieństwu uzyskania co najmniej k sukcesów w doświadczeniu Bernoulliego z prawdopodobieństwem F (t), gdzie F jest dystrybuantą wspólnego rozkładu zmiennych X1 , ..., X10 . Przyjmujemy,
że rozkład jest ciągły (ściślej, że F (m) = 21 ), w przeciwnym razie zadanie nie daje się rozwiązać.
Wówczas przyjmując, że zmienna S ma rozkład B(10, 12 ) zachodzi równość
P(m ∈ [X3:10 , X7:10 ]) = P(3 6 S < 7) = 1 −
2(1 + 10 + 45) + 120
23 (14 + 15)
99
=
1
−
=
.
210
29
128
11. (Eg 58/2) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi z rozkładu Pareto o gęstości
θλθ
1x>0 ,
fθ (x) =
(λ + x)θ+1
gdzie θ, λ > 0 są nieznanymi parametrami. Rozważmy estymatory największej wiarygodności
θ̄n , λ̄n parametrów θ i λ. Chcemy dobrać stałą t tak aby przy n dążącym do nieskończoności
5
√
prawdopodobieństwo zdarzenia |θ̄n − θ| n > t było równe 0, 1. Jeżeli θ = 3 i λ = 1, to stała t jest
równa
Odp: A -> 19, 7.
Rozwiązanie. W tym zadaniu najprościej skorzystać z twierdzeń o asymptotycznej zbieżności.
Twierdzenia te bazują na analizie wiarygodności
L((θ, λ), x) =
n
X
θλθ
,
ln
L((θ,
λ),
x)
=
n(ln
θ
+
θ
ln
λ)
−
(θ
+
1)
ln(λ + xi ).
(λ + xi )θ+1
i=1
i=1
n
Y
Aby zachodziła asymptotyczna normalność po pierwsze musi być spełniony warunek zgodności.
To znaczy, że (θ̄n , λ̄n ) → (θ, λ) przynajmniej według prawdopodobieństwa. Okazuje się, że przy
różniczkowalnej funkcji wiarygodności wystarczy aby ∂ ln L = 0, czyli równanie
∂ ln L((θ, λ), x)
∂ ln L((θ, λ), x)
= 0,
=0
∂θ
∂λ
miało dokładnie jedno rozwiązanie dla dowolnego n. Sprawdzamy warunek
n
X
∂ ln L((θ, λ), x)
1
= n( + ln λ) −
ln(λ + xi ) = 0,
∂θ
θ
i=1
n
X
θ
1
∂ ln L((θ, λ), x)
= n − (θ + 1)
= 0.
∂λ
λ
λ
+
xi
i=1
Zatem w rozwiązaniu tego równania parametr θ można wyrazić jako funkcję λ to znaczy
Pn
λ
θ=
n−
i=1 λ+xi
λ
i=1 λ+xi
Pn
.
Natomiast powstała po podstawieniu wyliczonego θ funkcja od λ czyli
n( Pn
n
λ
i=1 λ+xi
− 1) + n
n
X
ln
i=1
λ
λ + xi
jest malejąca i zmienia się od +∞ dla λ = 0 do −n dla λ = ∞ zatem ma tylko jedno miejsce
zerowe.
Jeśli teraz skończone są również drugie pochodne funkcji ln L to rozkłady (λ̄n , θ̄n ) mają asymptotycznie rozkład normalny N ((λ, θ), Cn ), gdzie macierz kowariancji Cn = −(E∂ 2 ln L)−1 . Obliczamy
zatem drugie pochodne
"
#
Pn
1
n
− nλ + i=1 λ+x
2
θ2
i
Pn
Pn
−∂ ln L(θ, λ) =
.
1
1
nθ
− nλ + i=1 λ+x
i=1 (λ+xi )2
λ2 − (θ + 1)
i
Pozostaje obliczyć odpowiednie parametry dla θ = 3 i λ = 1
n
n
= ,
θ2
9
n
n X
1
3
n
E− +
= −n + n = − ,
λ i=1 λ + Xi
4
4
E
gdzie korzystamy z faktu E(λ + Xi )k =
Cn =
n
9
− n4
3
3+k ,
− n4
E
n
X
nθ
1
3
3n
−
(θ
+
1)
= 3n − 4n =
,
2
λ2
(λ
+
X
)
5
5
i
i=1
dla k > 0. Stąd wynika, że
−1
3n
5
6
15 · 16
=
n2
3n
5
n
4
n
4
n
9
.
√
n
W szczególności oznacza to, że (θ̄n −3)
zbiega według rozkładu do Z z rozkładu N (0, 1). Obli12
czamy
√
√
|θ̄n − 3| n
t
t
lim P(|θ̄n − θ| n > t) = lim P(
>
) = P(|Z| >
) = 0, 1.
n→∞
n→∞
12
12
12
t
Z tablic dostajemy 12
' 1, 64. Stąd t ' 19, 68.
12. (Eg 59/10) Niech X1 , X2 , ..., X10 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
Pareto o gęstości
2θ θ
1x>0 ,
fθ (x) =
(2 + x)θ+1
gdzie θ > 0jest nieznanym parametrem. W oparciu o estymator największej wiarogodności T
parametru θ zbudowano przedział ufności dla θ na poziomie ufności 0, 95 postaci [cT, dT ], gdzie
liczby c i d dobrano tak, aby Pθ (θ < cT ) = Pθ (θ > dT ) = 0, 025. Liczby c i d są równe Odp: A->
c = 0, 48 i d = 1, 71.
Rozwiązanie. Obliczamy estymator EN W (θ), wiarygodność ma postać
10
Y
2θ θ
,
(2 + xi )θ+1
i=1
L(θ, x) =
stąd
ln L(θ, x) = 10θ ln 2 + 10 ln θ − (θ + 1)
10
X
ln(2 + xi ).
i=1
Należy znaleźć rozwiązanie równania
∂ ln L(θ,x)
∂θ
= 0, czyli
10
10 ln 2 +
10 X
−
ln(2 + xi ) = 0.
θ
i=1
To znaczy
10
θ = P10
i=1 (ln(2
+ xi ) − ln 2)
.
Wyznaczmy rozkład ln(2 + Xi ) − ln 2. Dla t > 0
P(ln(2 + Xi ) − ln 2 > t) = P(Xi > 2et − 2) = 2θ (2et )−θ = e−θt ,
P10
czyli rozkładem ln(2+Xi )−ln 2 jest rozkład wykładniczy z parametrem θ. Stąd i=1 (ln(2+Xi )−
1
ln 2) ma rozkład Gamma(10, θ). Zatem 1/T ma rozkład 10−1 Gamma(10, θ) = 20−1 θ−1 Gamma( 20
2 , 2)
−1 −1 2
2
czyli 20 θ χ (20). Niech Z będzie z rozkładu χ (20), zachodzi
Pθ (θ < cT ) = P(Z < 20c) = 0, 025, Pθ (θ > dT ) = P(Z > 20d) = 0, 025.
Z tablic rozkładu χ2 otrzymujemy 20c ' 9, 591, 20d ' 34, 170, czyli c ' 0, 48, d ' 1, 71.
13. (Eg 60/1) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi z rozkładu o gęstości
fθ (x) =
1 − 1 −1
x θ 1x>1 ,
θ
gdzie θ ∈ (0, 1) jest nieznanym parametrem. Rozważamy nieobciążony estymator parametru θ
postaci Tn = aY , gdzie Y = min(ln X1 , ln X2 ..., ln Xn ) i a jest odpowiednio dobraną stałą (być
może zależną od liczebności próby n). Dla θ = 31 i ε = 61 zachodzi
1
3
Odp: C-> Pθ (|Tn − θ| > ε) = 1 − e− 2 + e 2 .
7
Rozwiązanie. Jak nietrudno stwierdzić ln Xi ma rozkład wykładniczy Exp( θ1 ). Dalej rozkład Y
n
). Stąd a = n, niech teraz Z będzie z rozkładu
ma postać Exp( nθ ) i w końcu aY ma rozkład Exp( aθ
Exp(1), zachodzi
Pθ (|Tn − θ| > ε) = P(|θZ − θ| > ε) = P(|Z − 1| >
1
).
2
Czyli
3
1
1 3
lim Pθ (|Tn − θ| > ε) = 1 − P(Z ∈ [ , ]) = 1 − e− 2 + e− 2 .
n→∞
2 2
14. (Eg 61/7) Zmienna losowa X ma rozkład o gęstości
fθ (x) =
θ
1x>1 ,
xθ+1
gdzie θ > 0 jest nieznanym parametrem. Nie obserwujemy zmiennej X ale zmienną Y równą X,
gdy X jest większe od 2. Nie wiemy, ile było obserwacji zmiennej X nie większych niż 2 ani
jakie były ich wartości. W wyniku tego eksperymentu otrzymujemy próbkę losową Y1 , Y2 , ..., Y8
Na podstawie próbki budujemy przedział ufności dla parametru θ postaci [c1 T, c2 T ], gdzie T jest
estymatorem największej wiarogodności parametru θ, a stałe c1 i c2 dobrane są tak, by
P(θ < c1 T ) = P(θ > c2 T ) = 0, 05
Wtedy długość przedziału ufności jest równa
Odp: C-> 1, 146T .
Rozwiązanie. Interesuje nas rozkład warunkowy X pod warunkiem, że X > 2 który ma gęstość
gθ (x) =
θ2θ
1x>2 .
xθ+1
Dalej zadanie jest standardowe, wyznaczamy estymator EN W (θ) z równania
∂ ln L(x,θ)
∂θ
= 0, czyli
8
8 ln 2 +
8 X
ln xi = 0.
−
θ i=1
Stąd
8
T = P8
.
− ln 2)
P8
Dalej zauważamy, że ln Xi −ln 2 ma rozkład Exp(θ). Stąd i=1 (ln Xi −ln 2) ma rozkład Gamma(8, θ)
1
−1 −1 2
i wreszcie T −1 ma rozkład 16−1 θ−1 Gamma( 16
θ χ (16). To pozwala obliczyć stałe c1
2 , 2 ) = 16
2
i c2 z tablic rozkładu χ . Istotnie niech Z będzie z rozkładu χ2 (16), zachodzi
i=1 (ln Xi
P(θ < c1 T ) = P(Z < 16c1 ) = 0, 05, P(θ > c2 T ) = P(Z > 16c2 ).
Zatem 16c1 ' 7, 962, 16c2 ' 26, 296, czyli c1 ' 0, 498, c2 = 1, 644. Długość przedziału ufności
wynosi w przybliżeniu 1, 146T .
15. (Eg 62/7) Niech X1 , ..., X10 , ..., X30 będzie próbką losową z rozkładu normalnego N (µ, σ 2 ), z nieznanymi parametrami µ i σ 2 . Niech
10
X̄10 =
1 X
Xi ,
10 i=1
10
2
S 2 = S10
=
30
X̄30 =
1 X
Xi ,
30 i=1
1X
(Xi − X̄10 )2 .
9 i=1
8
Skonstruowano przedział [X̄10 − aS, X̄10 + aS] taki, że
P(X̄30 ∈ [X̄10 − aS, X̄10 + aS]) = 0, 95.
Liczba a jest równa
Odp: E-> 0, 584.
Rozwiązanie. W tym zadaniu
do rozkładu t-Studenta. Mamy
P30istotne jest aby umiejętnie przejść
1
1
2
niezależność X̄10 , X̄20 = 20
i=11 Xi oraz S. Nadto X̄30 = 3 X̄10 + 3 X̄20 . Stąd
P(X̄30 ∈ [X̄10 − aS, X̄10 + aS]) = P(|X̄20 − X̄10 | <
2
Teraz X̄20 − X̄10 ma rozkład N (0, 3σ
20 ). Natomiast
Z=
√
√20 (X̄20
3
− X̄10 )
S
P10
i=1 (Xi
3
aS)
2
− X̄10 ma rozkład σ 2 χ2 (n − 1). Stąd
, ma rozkład t-Studenta
a 9 stopniami swobody. Zatem
P(X̄30 ∈ [X̄10 − aS, X̄10 + aS]) = P(|Z| >
Zatem
√
√
15a) = 0, 95.
15a = 2, 262, czyli a ' 0, 584
16. (Eg 63/9) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
Laplace’a o gęstości
fθ (x) = exp(−2|x − θ|) dla x ∈ R,
gdzie θ jest nieznanym parametrem rzeczywistym. Rozważamy estymator θ̄ parametru θ równy
medianie z próby X1 , X2 , ..., Xn
θ̄ = X[0,5n]:n .
W oparciu o ten estymator budujemy przedział ufności dla parametru θ postaci
(θ̄ − a, θ̄ + a),
gdzie a dobrane jest tak, aby dla każdego θ ∈ R
lim Pθ (θ ∈ (θ̄ − a, θ̄ + a)) = 0, 95.
n→∞
Wtedy a jest równe
√ .
Odp: C-> 0,98
n
Rozwiązanie. Niech Fθ będzie dystrybuantą rozkładu fθ , czyli
1 − 12 exp(−2|t − θ|) t > θ
Fθ (t) =
1
t 6 θ.
2 exp(−2|t − θ|)
Przypomnijmy, że rozkład X[0,5n]:n można wyznaczyć korzystając ze zmiennej Borelowskiej Sn (t)
z rozkładu B(n, Fθ (t)) to znaczy
Pθ (X[0,5n]:n 6 t) = P(Sn (t) > [0, 5n]).
Z warunków zadania
Pθ (θ ∈ (θ̄ − a, θ̄ + a)) = Pθ (θ − a < θ̄ < θ + a) =
= P(Sn (θ − a) > [0, 5n]) − P(Sn (θ + a) > [0, 5n]),
9
gdzie korzystamy z tego, że X[0,5n]:n ma rozkład ciągły. Będziemy tak dobierać ciąg a aby zachodziło CTG. Niech Z będzie z rozkładu N (0, 1), wówczas jeśli a = √cn wtedy na mocy CTG
lim P(Sn (θ − a) > [0, 5n]) = P(Z > −2c),
n→∞
gdzie korzystamy z równości
[0, 5n] − Fθ (θ − a)
lim p
) = −2c.
nFθ (θ − a)(1 − Fθ (a − θ))
n→∞
Istotnie zauważmy, że
lim
p
n→∞
Fθ (θ − a)(1 − Fθ (a − θ)) =
1
2
nadto na mocy przybliżenia e−x ' 1 − x dla małych x otrzymujemy
lim
n→∞
2([0, 5n] − Fθ (θ − a))
√
= −2c
n
Analogicznie
lim P(Sn (θ + a) > [0, 5n]) = P(Z > 2c).
n→∞
Dobieramy zatem 2c tak aby P(Z ∈ (−2c, 2c)) = 0, 95. Zatem 2c = 1, 96, czyli c = 0, 98.
10

Podobne dokumenty