Estymatory nieobciążone Zadanie 1. Pobieramy próbkę X1,...,Xn

Transkrypt

Estymatory nieobciążone Zadanie 1. Pobieramy próbkę X1,...,Xn
Estymatory nieobciążone
Zadanie 1. Pobieramy próbkę X1 , . . . , Xn niezależnych obserwacji z rozkładu Poissona o nieznanym parametrze λ. Szacujemy p0 = e−λ za pomocą estymatora p̂0 = e−X̄ , gdzie X̄ jest średnią z próbki. Wyznaczyć
znak obciążenia E p̂0 − p0 tego estymatora.
Odp. dodatni
Zadanie 2. Sygnały pojawiają się zgodnie z procesem Poissona, a oczekiwana ilość sygnałów na jednostkę
czasu wynosi λ. Obserwujemy proces od momentu T0 do momentu Tn pojawienia się n-tego sygnału, przy
czym n jest z góry ustaloną liczbą całkowitą równą co najmniej 2. Wyznaczyć nieobciążony estymator
parametru λ.
Odp. Tn−1
n −T0
Zadanie 3. Pobrano sto niezależnych obserwacji z rozkładu normalnego o nieznanej wartości oczekiwanej µ
i wariancji σ 2 . Obliczono dziesięć sum po dziesięć obserwacji, a następnie zgubionoP
dane źródłowe. Zamiast
9
pierwotnych obserwacji X1 , . . . , X100 mamy więc obserwacje Y1 , . . . , Y10 , gdzie Yi = j=0 X10i−j . Szacujemy
P
10
wariancję σ 2 używając estymatora postaci const i=1 (Yi − Ȳ )2 . Wyznaczyć stałą const tak, by estymator
był nieobciążony.
Odp. 1/90
Zadanie 4. Niech (X1 , Y1 ), . . . , (Xn , Yn ) będzie próbą z dwuwymiarowego
rozkładu normalnego o wektorze
1 %
. Dla jakich % nieobciążonym estymatorem
wartości oczekiwanych (µX , µY ) i macierzy kowariancji
% 1
1 Pn
P
n
parametru min{µX , µY } jest statystyka min n i=1 Xi , n1 i=1 Yi ?
Odp. % = 1
Zadanie 5. Każda ze zmiennych losowych X1 , . . . , Xn ma taką samą wartość oczekiwaną µ. Wiadomo, że
2
σ , dla i = j,
Cov(Xi , Xj ) = σ2
2 , dla i 6= j.
Pn
Pn
Niech S 2 (c) = c i=1 (Xi − X̄)2 , gdzie X̄ = n1 i=1 Xi . Dla jakiej wartości c, S 2 (c) jest nieobciążonym
estymatorem parametru σ 2 ?
2
Odp. n−1
Zadanie 6. Niech X1 , . . . , Xn , gdzie n > 1, będzie próbą losową z rozkładu wykładniczego o gęstości
−x
1
µ
fµ (x) = µ e , dla x > 0,
0,
poza tym.
Niech
n
µ̂1 =
1X
Xi ,
n i=1
µ̂2 = n min{X1 , . . . , Xn }
będą dwoma estymatorami parametru µ. Udowodnić, że oba estymatory są nieobciążone oraz, że estymator
µ̂1 ma zawsze mniejszą wariancję niż µ̂2 .
Odp. —
Zadanie 7. Wykonano dziesięć pomiarów pewnej nieznanej wielkości µ jednym przyrządem pomiarowym,
a następnie pięć pomiarów innym przyrządem. Zakładamy, że wyniki pomiarów X1 , . . . , X10 , X11 , . . . , X15
są niezależnymi zmiennymi losowymi, przy czym każda ze zmiennych X1 , . . . , X10 ma rozkład normalny
o parametrach (µ, (0.1)2 ), podczas gdy każda ze zmiennych X11 , . . . , X15 ma rozkład normalny o parameP15
trach (µ, (0.2)2 ). Dobrać współczynniki c1 , . . . , c15 tak, żeby estymator µ̂ = i=1 ci Xi był nieobciążonym
estymatorem o minimalnej wariancji parametru µ.
1
8
, c11 = · · · = c15 = 45
Odp. c1 = · · · = c10 = 90
zadania aktuarialne (estymacja), modyfikacja WZ, strona 1
Zadanie 8. Niech x1 , . . . , x25 będzie realizacją próby losowej z rozkładu N (µ, σ 2 ), zaś x26 , . . . , x50 - realizacją
próby losowej z rozkładu N (ν, τ 2 ), gdzie µ, ν, σ 2 , τ 2 są nieznanymi parametrami. Wiadomo, że
25
50
1 X
xi = 10.4,
25 i=1
x̄50 =
1 X
xi = 10.0,
50 i=1
1 X
(xi − x̄25 )2 = 3.333,
24 i=1
s250 =
1 X
(xi − x̄50 )2 = 2.000.
49 i=1
x̄25 =
25
s225 =
50
Obliczyć na tej podstawie wartość nieobciążonego estymatora wariancji τ 2 .
Odp. 0.417
Zadanie 9. Niech X1 , . . . , Xn będzie próbą z rozkładu normalnego o nieznanych parametrach (µ, σ 2 ) i niech
n > 1 oraz σ 2 > 0. Niech
n
X̄ =
n
1X
Xi ,
n i=1
S2 =
1 X
(Xi − X̄)2 ,
n − 1 i=1
t(µ0 ) =
X̄ − µ0
√
,
S2
gdzie µ0 jest ustaloną liczbą. Niech tα będzie dwustronną wartością krytyczną rozkładu Studenta z n − 1
stopniami swobody. Rozważmy następujący estymator µ̂ parametru µ:
µ̂ =
µ0 ,
X̄,
jeżeli |t(µ0 )| < tα ,
w przeciwnym przypadku.
Dla jakich µ obciążenie Eµ µ̂ − µ estymatora jest dodatnie?
Odp. µ < µ0
Zadanie 10. Niech X1 , . . . , Xn będzie próbą z rozkładu o gęstości
fc,µ (x) =
x−c
1 − µ
,
µe
0,
dla x > c,
poza tym,
gdzie c ∈ RP
i µ > 0 są nieznanymi parametrami. Wyznaczyć nieobciążony estymator parametru µ.
n
1
n
Odp. n−1
i=1 Xi − n−1 min{X1 , . . . , Xn }
Zadanie
11. Niech N1 , . . . , Nn będzie próbą z rozkładu Poissona o wartości oczekiwanej λ i niech N̄ =
Pn
1
N
będzie średnią z tej próby. Dla jakiej wartości C estymator C N̄ parametru e−λ będzie nieobciąi
i=1
n
żony? n
n
Odp. n−1
Zadanie 12. Proces pojawiania się szkód jest procesem Poissonowskim z parametrem intensywności λ, tzn.
)n −λT
prawdopodobieństwo pojawienia się n szkód na odcinku czasu (0, T ] jest równe (λT
. Obserwujemy
n! e
proces od momentu 0. Niech T1 , T2 , T3 , . . . oznaczają momenty pojawiania się kolejnych szkód. Ustalamy
z góry liczbę n taką, że obserwację procesu przerwiemy w momencie Tn pojawienia się n-tej szkody. Dla
jakiej wartości C estymator TCn , parametru λ jest estymatorem nieobciążonym?
Odp. n − 1 dla n > 1
Zadanie 13. Niech X będzie pojedynczą obserwacją z rozkładu jednostajnego na przedziale (θ − 0.5, θ + 0.5)
z nieznanym parametrem θ. Wiemy, że θ jest liczbą rzeczywistą. Za pomocą estymatora |X| estymujemy
wartość bezwzględną parametru θ. Wyznaczyć maksymalne obciążenie Eθ |X| − θ tego estymatora.
Odp. 0.25
zadania aktuarialne (estymacja), modyfikacja WZ, strona 2
Zadanie 14. X1 , . . . , Xn jest prostą próbą losową z rozkładu geometrycznego: P (Xi = k) = p(1 − p)k ,
k = 0, 1, . . ., gdzie p ∈ (0, 1) i liczebność próby przekracza 1. W klasie estymatorów parametru p danych
wzorem:
a
Pn
a + i=1 Xi
dobrać parametr a tak, aby otrzymać estymator nieobciążony.
Odp. n − 1
Zadanie 15. Niech X1 , . . . , Xn będzie próbą niezależnych obserwacji z rozkładu jednostajnego na przedziale
(ϕ0 , ϕ1 ) z nieznanymi oboma parametrami i niech n > 1. Interesuje nas szerokość przedziału ϕ1 − ϕ0 .
Dobrać parametr a tak, aby estymator a(max{X1 , . . . , Xn } − min{X1 , . . . , Xn }) szerokości przedziału był
nieobciążony.
n+1
Odp. n−1
Zadanie 16. Dla t = 1, . . . , T obserwujemy niezależne realizacje zmiennej losowej Xt , o których zakładamy
iż pochodzą z rozkładu o parametrach EXt = nt µ i V arXt = nt σ 2 , gdzie wartości n1 , . . . , nT są nam
znane (i dodatnie), natomiast parametry µ oraz σ 2 są nieznane. Wybieramy estymator parametru σ 2 z klasy
PT
PT
PT
estymatorów postaci c t=1 (Xt − nt X̄)2 , gdzie X̄ = n1 t=1 Xt oraz n = t=1 nt , zaś c jest pewną liczbą
rzeczywistą (parametrem konkretnego estymatora). Dla jakiej wartości c otrzymamy estymator nieobciążony.
Odp. nTn−n
Zadanie 17. Mamy dwie niezależne obserwacje X1 oraz X2 z rozkładu normalnego, przy czym jedna z nich
pochodzi z rozkładu o parametrach (µ, σ 2 ), a druga z rozkładu o parametrach (2µ, 2σ 2 ). Niestety zgubiliśmy
informację, która z obserwacji z którego z rozkładów pochodzi. Parametry (µ, σ 2 ) są nieznane. W tej sytuacji
wybieramy estymator parametru σ 2 z klasy estymatorów postaci
σ̂ 2 = a(X1 − X2 )2 + b(X1 + X2 )2 ,
gdzie (a, b) to para liczb rzeczywistych (parametry konkretnego estymatora). Dla jakich (a, b) otrzymamy
estymator nieobciążony.
Odp. a = 3/8, b = −1/24
Zadanie 18. Niech X1 , . . . , Xn , . . . , Xn+m będzie próbą prostą z rozkładu normalnego N (µ, σ 2P
), gdzie m, n >
n+m
1
1. Bezpośrednio dostępne są tylko obserwacje X1 , . . . , Xn , ale znamy średnią X̄n+m = n+m
i=1 Xi . Dla
Pn
2
2
jakiej liczby c estymator c i=1 (Xi − X̄n+m ) wariancji σ jest nieobciążony?
n+m
Odp. n1 n+m−1
Zadanie 19. Przeprowadzamy wśród wylosowanych osób ankietę na delikatny temat. Ankietowana osoba
rzuca kostką do gry i w zależności od wyniku rzutu kostką (wyniku tego nie zna ankieter) podaje odpowiednio
zakodowaną odpowiedź na pytanie: Czy zdarzyło się Panu/Pani w roku 1999 dać łapówkę w klasycznej
formie pieniężnej, przekraczającą kwotę 100 zł? Przyjmijmy, iż interesująca nas cecha X przyjmuje wartość
1, jeśli odpowiedź brzmi „TAK” i 0, jeśli odpowiedź brzmi „NIE”. Pierwszych 100 osób udziela odpowiedzi
Z1 , . . . , Z100 zgodnie z regułą: jeśli wynik rzutu kostką, to liczba oczek równa 1, 2, 3 lub 4, to Zi = Xi ,
natomiast jeśli wynik rzutu kostką, to liczba oczek równa 5 lub 6, to Zi = 1 − Xi . Następnych 100 osób
udziela odpowiedzi Z101 , . . . , Z200 zgodnie z regułą: jeśli wynik rzutu kostką, to liczba oczek równa 1 lub
2, to Zi = Xi , natomiast jeśli wynik rzutu kostką to liczba oczek równa 3, 4, 5 lub 6, to Zi = 1 − Xi .
Dla uproszczenia zakładamy, że dwieście ankietowanych osób to próba prosta z (hipotetycznej) populacji
o nieskończonej liczebności, a podział na podpróby jest także całkowicie losowy. Interesujący nas parametr
tej populacji to oczywiście qX = P (X = 1). W wyniku przeprowadzonej ankiety dysponujemy średnimi
P100
P200
1
1
z podpróbek: Z̄1 = 100
i=1 Zi i Z̄2 = 100
i=101 Zi . Estymator parametru qX uzyskany metodą największej
wiarogodności ma postać q̂X = a0 + a1 Ẑ1 + a2 Ẑ2 . Dla jakich a0 , a1 , a2 estymator ten jest nieobciążony?
Odp. a0 = 0.5, a1 = 1.5, a2 = −1.5
zadania aktuarialne (estymacja), modyfikacja WZ, strona 3
Zadanie 20. Rozważmy dwie niezależne próbki X1,1 , . . . , X1,n1 ∼ N (µ, σ 2 ), X2,1 , . . . , X2,n2 ∼ N (µ, 2σ 2 ).
Pn1
Pn2
2 X̄2
Niech X̄1 = n11 i=1
X1,i , X̄2 = n12 i=1
X2,i oraz X̄ = n1 X̄n11 +n
. Dla jakiego c estymator parametru σ 2
+n2
Pn1
P
n2
2
2
postaci c
jest nieobciążony?
i=1 (X1,i − X̄) +
i=1 (X2,i − X̄)
Odp. n1 +n1 2 −1
Zadanie 21. Niech X1 , . . . , Xn będzie próbką prostą z rozkładu wykładniczego o gęstości fλ (x) = λe−λx
dla x > 0, gdzie λ > 0 jest nieznanym parametrem oraz n > 1. Niech a > 0 będzie daną liczbą. Interesuje
nas estymacja
parametru p = e−λa = Pλ (X1 > a). Niech Na oznacza liczbę obserwacji większych od a, zaś
Pn
S = i=1 Xi . Rozważmy trzy estymatory parametru p:
n
p̂1 = exp −a
,
S
p̂2 =
na
,
N
p̂3 =
0,
S−a n−1
S
gdy S ≤ a,
.
, gdy S > a
Które z poniższych zdań jest zdaniem prawdziwym?
(A) estymatory p̂1 , p̂2 i p̂3 są nieobciążone;
(B) estymator p̂2 jest nieobciążony, zaś p̂1 i p̂3 są obciążone;
(C) estymatory p̂1 i p̂2 są nieobciążone, zaś p̂3 jest obciążony;
(D) estymatory p̂2 i p̂3 są nieobciążone i V ar(p̂2 ) < V ar(p̂3 );
(E) estymatory p̂2 i p̂3 są nieobciążone i V ar(p̂2 ) > V ar(p̂3 ).
Odp. E
Zadanie 22. Niech X1 , . . . , X10 , X11 , . . . , X20 będą niezależnymi zmiennymi losowymi. Zmienne losowe
X1 , . . . , X10 mają rozkład normalny N (µ1 , σ 2 ), zaś X11 , . . . , X20 mają rozkład normalny N (µ2 , σ 2 ). Niech
10
1 X
X̄1 =
Xi ,
10 i=1
20
1 X
X̄2 =
Xi ,
10 i=11
20
1 X
X̄ =
Xi .
20 i=1
Dobrać liczby α i β tak, żeby statystyka
σ̂ 2 = α
20
X
(Xi − X̄)2 + β(X̄1 − X̄2 )2
i=1
była nieobciążonym estymatorem parametru σ 2 .
Odp. α = 1/18, β = −5/18
Zadanie 23. Niech Y1 , Y2 , Y3 , Y4 będą niezależnymi zmiennymi losowymi, przy czym Yk ma rozkład normalny
N (kµ, σ 2 ), dla k = 1, 2, 3, 4. Rozważamy estymatory nieznanego parametru µ postaci
µ̂ = a1 Y1 + a2 Y2 + a3 Y3 + a4 Y4 .
Znaleźć najmniejszą wariancję estymatora powyższej postaci, przy założeniu, że jest to estymator nieobciążony.
Odp. σ 2 /30
Zadanie 24. Załóżmy, że X1 , X2 ,P
X3 są niezależnymi zmiennymi losowymi o jednakowym rozkładzie nor3
malnym N (µ, σ 2 ). Niech S 2 = 12 i=1 (Xi − X̄)2 będzie nieobciążonym estymatorem wariancji. Obliczyć
P (S 2 ≤ σ 2 ).
Odp. 0.63212
zadania aktuarialne (estymacja), modyfikacja WZ, strona 4
Zadanie 25. Niech X1 , . . . , Xn , Xn+1 , . . . , Xm będzie próbką z rozkładu normalnego N (µ, σ 2 ) z nieznanymi
2
parametrami
Pm µ i σ . Obserwujemy zmienne X1 , . . . , Xn i ponadto znamy średnią ze wszystkich zmiennych
1
X̄m = m i=1 Xi . Znaleźć stałą cn,m taką, żeby statystyka
n
1 X
cn,m
(Xi − X̄m )2
i=1
była nieobciążonym
estymatorem wariancji σ 2 .
1
Odp. n 1 − m
Zadanie 26. Niech X1 , . . . , Xn będzie próbką z rozkładu prawdopodobieństwa o gęstości
fλ (x) =
λe−λx , dla x > 0,
0,
poza tym.
Pn
Parametr λ > 0 jest nieznany. Niech X̄ = n1 i=1 Xi . Znaleźć taką liczbę c, żeby c(X̄)2 był nieobciążonym
estymatorem wariancji pojedynczej zmiennej Xi .
n
Odp. n+1
Zadanie 27. Niech N1 , . . . , N10 będzie próbką z rozkładu Poissona z nieznanym parametrem λ. Interesuje nas
drugi moment obserwacji, czyli wielkość m2 (λ) = Eλ (N12 ). Chcemy skonstruować taki estymator wielkości
m2 (λ), który jest nieobciążony i który jest funkcją zmiennej S = N1 + · · · + N10 (zależy tylko od sumy
obserwacji).
1
Odp. 100
S(S + 9)
Zadanie 28. Rozpatrzmy następujący model regresji liniowej bez wyrazu wolnego:
Yi = βxi + εi ,
i = 1, . . . , n,
gdzie xi są znanymi liczbami, β jest nieznanym parametrem, zaś εi są błędami losowymi. Zakładamy, że
Eεi = 0,
V arεi = x2i σ 2 ,
i = 1, . . . , n.
Skonstruować estymator β̂ parametru β o następujących
własnościach:
Pn
β̂ jest liniową funkcją obserwacji, tzn. β̂ = i=1 ci Yi ,
β̂ jest nieobciążony, tzn. E β̂ = β,
β̂ ma najmniejszą
wariancję spośród estymatorów liniowych i nieobciążonych.
Pn
Odp. n1 i=1 Yi
Zadanie 29. Niech X1 , . . . , Xn będą niezależnymi zmiennymi losowymi z rozkładu Weibulla o gęstości
(
fθ (x) =
2
exp − xθ , gdy x > 0,
0,
poza tym,
2
θ
gdzie θ > 0 jest nieznanym parametrem. Rozważamy nieobciążony estymator parametru θ postaci Tn = aY ,
gdzie Y = min{X12 , . . . , Xn2 } i a jest odpowiednio dobraną stałą (być może zależną od liczebności próby n).
Pokazać, że
ε ε
− exp −
.
(∀θ > 0)(∀0 < ε < 1) Pθ {|Tn − θ| > ε} = 1 − exp(−1) exp
θ
θ
Odp. —
zadania aktuarialne (estymacja), modyfikacja WZ, strona 5
Zadanie 30. Niech X1 , . . . , X9 będą niezależnymi zmiennymi losowymi o rozkładzie normalnym N (µ, σ 2 ),
P9
P9
gdzie µ ∈ R, σ 2 > 0 są nieznanymi parametrami. Niech X̄ = 91 i=1 Xi , S 2 = 18 i=1 (Xi − X̄)2 . Wyznaczyć
estymator nieobciążony o minimalnej wariancji parametru µ/σ.
3
X̄
Odp. Γ(3.5)
S
Zadanie 31. Zakładamy, że X1 , . . . , X10 , X11 , . . . , X20 są niezależnymi zmiennymi losowymi o rozkładach
2
normalnych, przy czym EXi = µ1 i V arXi = σ 2 dla i = 1, . . . , 10
oraz EXi = µP
dla
2 i V arXi = 2σ
P10
P20
20
1
1
1
i = 11, . . . , 20. Parametry µ1 , µ2 , σ są nieznane. Niech X̄1 = 10 i=1 , X̄2 = 10 i=11 , X̄ = 20 i=1 .
Dobrać stałe a i b tak, aby statystyka
σ̂ 2 = a
20
X
(Xi − X̄)2 + b(X̄1 − X̄2 )2
i=1
była nieobciążonym estymatorem parametru σ 2 .
Odp. a = 1/27, b = −5/27
Zadanie 32. Niech X1 , X2 , . . . , Xn , . . . będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
jednostajnym na przedziale (0, θ), gdzie θ > 0 jest nieznanym parametrem. Rozważamy estymator nieobciążony parametru θ postaci Tn (X1 , X2 , . . . , Xn ) = Tn = aX1:n , gdzie X1:n = min{X1 , X2 , . . . , Xn } i a jest
pewną stałą. Udowodnić, że
ε
ε
(∃ε > 0)(∃θ > 0) lim Pθ (|Tn − θ| > ε) = 1 + exp −1 −
− exp −1 +
.
n→∞
θ
θ
Odp. —
zadania aktuarialne (estymacja), modyfikacja WZ, strona 6
Ryzyko estymatorów
Zadanie 33. Niech X1 , . . . , Xn będą niezależnymi zmiennymi losowymi o rozkładach normalnychP
o nieznanej
n
średniej i wariancji. Rozpatrzmy klasę estymatorów wariancji określonych wzorem S(c) = c i=1 (Xi −
X̄)2 , X̄ jest średnią z próbki, a c jest pewną liczbą rzeczywistą. Wyznaczyć wartość c, przy której błąd
średniokwadratowy estymatora S(c) osiąga minimum.
Odp. 1 + n+1 1
2
Zadanie 34. Niech X1 , . . . , Xn będzie próbką z niezależnych obserwacji z rozkładu jednostajnego na przedziale (0, ϕ) z nieznanym prawym końcem przedziału ϕ. Estymator n+1
n max{X1 , . . . , Xn } jest nieobciążony.
Wyznaczyć wariancję tego estymatora.
ϕ2
Odp. n(n+2)
Zadanie 35. Zakładamy, że X1 , . . . , Xn jest próbą z rozkładu normalnego N (µ, γ 2 σ 2 ), gdzie µ ∈ R jest
nieznanym parametrem, zaś γ 2 znanym współczynnikiem. Wyznaczyć estymator postaci µ̂ = c1 X1 + · · · +
cn Xn parametru µ, który ma jednostajnie najmniejszy błąd średniokwadratowy Eµ (µ̂ − µ)2 .
1
Odp. c1 = · · · = cn = 1+γ
2
Zadanie 36. Niech (X, Y ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (µX , µY ), wariancji każdej ze współrzędnych równej σ 2 oraz kowariancji równej %σ 2 . Staramy się obserwować niezależne
realizacje tej zmiennej, ale nie w pełni to wychodzi - czasem udaje się zaobserwować jedynie pierwszą lub
jedynie drugą ze współrzędnych. Przyjmijmy ważne założenie, iż do „zgubienia” obserwacji (całkowitego,
jej pierwszej współrzędnej lub jej drugiej współrzędnej) dochodzi całkowicie niezależnie od wartości tych
obserwacji. Załóżmy, iż otrzymaliśmy próbkę, zawierającą 20 obserwacji wyłącznie pierwszej współrzędnej,
60 obserwacji całej pary oraz 20 obserwacji wyłącznie drugiej współrzędnej. Niech teraz X̄ oznacza średnią
z próbki (osiemdziesięciu) obserwacji na zmiennej X, Ȳ oznacza średnią z próbki (osiemdziesięciu) obserwacji
na zmiennej Y oraz niech X − Y oznacza średnią z próbki (sześćdziesięciu) obserwacji na różnicy zmiennych
X − Y . Niech X̄ − Ȳ oraz X − Y oznaczają dwa alternatywne estymatory różnicy µX − µY . Dla jakiej
wartości współczynnika % estymatory te mają jednakową wariancję?
Odp. 4/7
Pn
1
Zadanie 37. Niech X1 , . . . , Xn będzie próbką z rozkładu normalnego N (µ, σ 2 ). Niech S 2 = n−1
i=1 (Xi −
Pn
1
S 2 −σ 2
2
X̄) , gdzie X̄ = n i=1 Xi . Interesuje nas względny błąd estymacji: R = σ2 . Wyznaczyć rozmiar n
próbki, dla którego E(R2 ) = 0.01.
Odp. 201
Zadanie 38. Załóżmy, że X1 , . . . , Xn jest próbką z rozkładu prawdopodobieństwa o dystrybuancie
1 − e−x , dla x > 0,
Fθ (x) = Pθ (Xi ≤ x) =
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Rozważmy następujący estymator: θ̂ = min{X1 , . . . , Xn }. Wyznaczyć funkcję ryzyka tego estymatora:
R(θ) = Eθ (θ̂ − θ)2 .
Odp.
2 −nθ
n2 e
Zadanie 39. Załóżmy, że X1 , . . . , Xn jest próbką z rozkładu normalnego N (µ, σ 2 ) z nieznanymi parametrami.
Rozważmy nieobciążony estymator wielkości µ2 dany wzorem
µ2 = (X̄)2 −
Pn
gdzie X̄ = n1 i=1 Xi i S 2 =
2
Odp. n4 µ2 σ 2 + n(n−1)
σ2
1
n−1
Pn
i=1 (Xi
S2
,
n
− X̄)2 . Obliczyć V ar(µ2 ).
zadania aktuarialne (estymacja), modyfikacja WZ, strona 7
Zadanie 40. Załóżmy, że K oznacza liczbę sukcesów w n próbach Bernoulliego z nieznanym prawdopodobieństwem sukcesu θ. Rozważmy estymator parametru θ postaci
θ̂ =
a+K
.
b+n
Niech n = 16. Przypuśćmy, że dodatnie liczby a i b dobrane zostały tak, że funkcja ryzyka estymatora,
R(θ) = Eθ (θ̂ − θ)2 jest funkcją stałą, czyli R(θ) = R dla każdej wartości parametru θ. Podać liczbę R.
Odp. 0.01
Zadanie 41. Niech X1 , . . . , Xn będzie próbką z rozkładu o gęstości danej wzorem:
1 1/θ−1
x
, dla 0 < x < 1,
fθ (x) = θ
0,
poza tym.
Znaleźć estymator największej wiarogodności θ̂ parametru θ i obliczyć błąd średniokwadratowy tego estymatora R(θ) = Eθ (θ̂ − θ)2 .
Odp. θ2 /n
Zadanie 42. Niech W1 , . . . , Wn (n > 1) będzie próbką z rozkładu wykładniczego o wartości oczekiwanej µ.
Rozważmy estymatory parametru µ postaci
µ̂ = aS,
gdzie S =
n
X
Wi .
i=1
Znaleźć liczbę a, dla której błąd średniokwadratowy estymatora, czyli wielkość Eµ (µ̂ − µ)2 jest najmniejszy.
1
Odp. n+1
Zadanie 43. Niech X1 , X2 , X3 , X4 będą niezależnymi zmiennymi losowymi, przy czym zmienna losowa Xi
ma rozkład normalny o wartości oczekiwanej µ i wariancji iµ2 , i = 1, 2, 3, 4, gdzie µ 6= 0 jest nieznanym
parametrem. Rozważamy estymatory parametru µ postaci
µ̂ = a1 X1 + a2 X2 + a3 X3 + a4 X4 .
Znaleźć współczynniki ai , i = 1, 2, 3, 4, dla których estymator ma najmniejszy błąd średniokwadratowy, czyli
współczynniki minimalizujące funkcję Eµ (µ̂ − µ)2 .
Odp. a1 = 12/37, a2 = 6/37, a3 = 4/37, a4 = 3/37
Zadanie 44. Zmienna losowa N ma rozkład Poissona z nieznanym parametrem λ > 0. O parametrze
λ zakładamy, że podlega rozkładowi a priori gamma G(2, 8). Zmienna losowa θ ma rozkład beta b(1, 2).
Zmienne N i θ są niezależne i zmienne λ i θ są niezależne. Obserwujemy zmienną losową X, która przy
znanych wartościach N i θ ma rozkład dwumianowy B(N, θ). Wyznaczyć wartości a i b najlepszego liniowego
predyktora zmiennej losowej N , to znaczy liczby a i b minimalizujące wielkość E(N − aX − b)2 .
54
35
Odp. a = 53
, b = 212
Zadanie 45. Niech X1 , X2 , X3 , X4 będą niezależnymi zmiennymi losowymi, przy czym EXi = iµ oraz
V arXi = i2 µ2 , i = 1, 2, 3, 4. Niech µ̃ będzie estymatorem parametru µ minimalizującym błąd średniokwadratowy w klasie estymatorów postaci
µ̃ = a1 X1 + a2 X2 + a3 X3 + a4 X4 ,
gdzie a1 , a2 , a3 , a4 są liczbami rzeczywistymi. Wyznaczyć błąd średniokwadratowy Eµ (µ̃ − µ)2 .
Odp. µ2 /5
zadania aktuarialne (estymacja), modyfikacja WZ, strona 8
Zadanie 46. Pobieramy próbkę niezależnych realizacji zmiennych losowych o rozkładzie Poissona z wartością
oczekiwaną λ > 0. Niestety sposób obserwacji uniemożliwia odnotowanie realizacji o wartości 0. Pobieranie
próbki kończymy w momencie, gdy liczebność odnotowanych realizacji wynosi n. Tak więc, każda z naszych
kolejnych odnotowanych realizacji K1 , . . . , Kn wynosi co najmniej 1 i nic nie wiemy o tym, ile w międzyczasie
pojawiło się obserwacji o wartości 0. Estymujemy parametr λ za pomocą estymatora postaci
λ̂ =
∞
X
iNi ,
i=2
gdzie Ni jest liczbą obserwacji o wartości i. Obliczyć wariancję estymatora λ̂.
2
−λ+λeλ
Odp. λn(e
λ −1)
Zadanie 47. Niech X1 , . . . , Xn będzie próbką prostą z rozkładu normalnego N (µ, σ 2 ) oraz niech S 2 =
Pn
Pn
1
1
S 2 −σ 2
2
i=1 (Xi − X̄) , gdzie X̄ = n
i=1 Xi . Interesuje nas względny błąd estymacji R =
n
σ 2 . Przy n = 10
wyznaczyć wartość oczekiwaną E(R2 ).
Odp. 0.19
Zadanie 48. Niech X1 , . . . , Xn , gdzie n > 1, będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
o gęstości
4
4c
fc (x) = x5 , gdy x > c,
0,
poza tym,
gdzie c > 0 jest nieznanym
Rozważamy dwa estymatory parametru c: T1 = a min{X1 , . . . , Xn }
Pparametrem.
n
i T2 = bX̄, gdzie X̄ = n1 i=1 Xi oraz a, b są dobrane tak, aby estymatory były nieobciążone. Wyznaczyć
różnicę ryzyk estymatorów, czyli
R = Ec (T2 − c)2 − Ec (T1 − c)2 .
Odp.
(n−1)c2
4n(2n−1)
Zadanie 49. Niech X = (X1 , . . . , Xk ) będzie zmienną losową o rozkładzie wielomianowym z parametrami
Pk
(n, p1 , . . . , pk ), gdzie wektor p = (p1 , . . . , pk ) (pi ≥ 0 dla i = 1, . . . , k oraz
i=1 pi = 1) jest wektorem
nieznanych parametrów. Rozważamy problem estymacji wektora p przy kwadratowej funkcji straty L(p̂, p) =
Pk
1
2
i=1 (p̂i − pi ) . Wśród estymatorów wektora p postaci p̂ = (aX1 + b, . . . , aXk + b) (gdzie a i b są liczbami
k
rzeczywistymi) o ryzyku (tzn. EL(p̂, p)) stałym, niezależnym od p, wyznaczyć estymator o najmniejszym
ryzyku.
Odp. a = n+1√n , b = k(n+1√n)
zadania aktuarialne (estymacja), modyfikacja WZ, strona 9
Estymatory największej wiarogodności
Zadanie 50. Zmienna losowa N ma rozkład Poissona z parametrem λ, który chcemy oszacować. Niestety
możemy obserwować jedynie zmienną losową M , która przyjmuje wartość zero, jeśli N równa się zero,
a wartość jeden, jeśli N jest większa od zera. Średnią arytmetyczną z próbki niezależnych obserwacji zmiennej
M oznaczmy
przez
m̄. Wyznaczyć estymator największej wiarogodności parametru λ.
Odp. ln 1−1m̄
Zadanie 51. Niech X1 , . . . , X100 będzie próbą losową z rozkładu wykładniczego o nieznanej wartości oczekiwanej µ. Estymujemy µ na podstawie częściowej informacji o próbce, a mianowicie na podstawie tego,
że 80 obserwacji miało wartości poniżej 3 oraz średnia arytmetyczna z tych 80-ciu wartości wynosi 2. Obliczyć wartość estymatora największej wiarogodności parametru µ skonstruowanego na podstawie podanej
informacji.
Odp. 11/4
Zadanie 52. Przyjmujemy, że liczby wypadków N1 , . . . , Nk zgłoszonych w kolejnych k latach są niezależnymi
zmiennymi losowymi. Zakładamy, że zmienna Ni ma rozkład Poissona z wartością oczekiwaną λmi , gdzie
mi jest znaną liczbą samochodów ubezpieczonych w i-tym roku, zaś λ nieznanym parametrem. Wyznaczyć
estymator
P największej wiarogodności parametru λ.
k
Odp. Pki=1
i=1
Ni
mi
Zadanie 53. X1 , . . . , Xn jest próbą losową z rozkładu o dystrybuancie
Fα (x) =
1
,
(1 + e−1 )α
x ∈ R, α > 0.
Wyznaczyć estymator największej wiarogodności parametru α.
Pn
−1
Odp. n [ i=1 ln(1 + exp(−Xi ))]
Zadanie 54. X1 , . . . , Xn jest próbą losową z rozkładu o gęstości
fθ (x) =
e−(x−θ) ,
0,
dla x > θ,
poza tym.
Znaleźć estymator największej wiarogodności parametru θ.
Odp. min{X1 , . . . , Xn }
Zadanie 55. Niech X1 , . . . , X8 , X9 będą niezależnymi zmiennymi losowymi, przy tym gęstość zmiennej Xi
(i = 1, . . . , 8) jest dana wzorem
λe−λx , dla x > 0,
fλ (x) =
0,
poza tym.
Zmienna X9 ma rozkład o gęstości
gλ (x) =
λ2 xe−λx ,
0,
dla x > 0,
poza tym.
Wyznaczyć estymator największej wiarogodności parametru λ.
Odp. P910
i=1
Xi
zadania aktuarialne (estymacja), modyfikacja WZ, strona 10
Zadanie 56. W pewnej populacji prawdopodobieństwo tego, że osobnik przeżyje rok jest równe (1 − θ).
Jeżeli osobnik przeżył rok, to (warunkowe) prawdopodobieństwo tego, że przeżyje następny rok też jest równe
(1 − θ). W próbce liczącej n osobników z tej populacji zanotowano n0 przypadków, kiedy osobnik nie przeżył
roku, n1 przypadków, kiedy osobnik przeżył rok, ale nie przeżył drugiego oraz n2 przypadków, kiedy osobnik
przeżył dwa lata. Wyznaczyć estymator największej wiarogodności parametru θ.
n0 +n1
Odp. n+n
1 +n2
Zadanie 57. Wykonano n doświadczeń Bernoulliego z prawdopodobieństwem sukcesu p = 1/3. Liczba n jest
nieznanym parametrem. Okazało się, że liczba porażek jest o cztery większa od liczby sukcesów. Wyznaczyć
wartość estymatora największej wiarogodności parametru n.
Odp. 8
Zadanie 58. Wiemy, że zmienna losowa X ma rozkład normalny o wartości oczekiwanej µ i wariancji 4.
Na podstawie czteroelementowej próbki estymujemy µ2 . Zaobserwowano x1 = 2, x2 = 3.5, x3 = 3, x4 =
7. Wyznaczyć różnicę między wartością estymatora największej wiarogodności a wartością nieobciążonego
estymatora o minimalnej wariancji.
Odp. 1
Zadanie 59. Pobieramy próbkę niezależnych realizacji zmiennej losowej o rozkładzie Poissona z wartością
oczekiwaną równą λ (dodatnią). Niestety nasz sposób obserwacji uniemożliwia odnotowanie realizacji o wartości zero. Pobieranie próbki kończymy w momencie, gdy liczebność odnotowanych realizacji wynosi T . Tak
więc każda z naszych kolejnych odnotowanych realizacji k1 , . . . , kT wynosi co najmniej 1, i nic nie wiemy
o tym, ile w międzyczasie pojawiło się (i umknęło z naszego pola widzenia) obserwacji zerowych. Wyznaczyć
estymator największej wiarogodności parametru λ.
PT
Odp. estymator jest rozwiązaniem równania 1−eλ−λ = T1 t=1 kt
Zadanie 60. Niech X1 , . . . , Xn będzie próbką z rozkładu o gęstości
1 θ1 −1
, dla x ∈ (0, 1),
fθ (x) = θ x
0,
poza tym.
Niech θ̂ będzie estymatorem największej wiarogodności nieznanego parametru θ > 0. Obliczyć wariancję tego
estymatora.
Odp. θ2 /n
Zadanie 61. W urnie jest r czarnych kul. O liczbie r wiemy tylko tyle, że jest większa od zera. Powtarzamy
trzy razy następujące czynności: losujemy jedną kulę z urny i odkładamy ją na bok (nie zwracamy), a następnie wrzucamy do urny jedną kulę białą. Wynikiem doświadczenia jest sekwencja trzech liter - C lub B
na przykład CBB oznacza, iż wylosowaliśmy po kolei kulę czarną, potem białą, i znowu białą. Wyznaczyć
wartość estymatora r̂ największej wiarogodności nieznanej liczby r, gdy zaobserwowano ciąg CBC.
Odp. 2
Zadanie 62. Zakładając, że X1 , . . . , X10 jest próbką prostą z rozkładu wykładniczego o gęstości:
−x
1
µ
fµ (x) = µ e , dla x > 0,
0,
poza tym,
przeprowadzono estymację parametru µ metodą największej wiarogodności i otrzymano wartość estymatora
EN W (µ) równą 50. Największa zaobserwowana w próbce wartość max{X1 , . . . , X10 } wyniosła 100, a dziewięć pozostałych było ściśle mniejszych od 100. Okazało się jednak, że w istocie zaobserwowane przez nas
wartości X1 , . . . , X10 stanowią próbkę z uciętego rozkładu wykładniczego Xi = min{Yi , 100}, gdzie zmienne
losowe Yi pochodzą z rozkładu wykładniczego o gęstości fµ . Obliczyć wartość estymatora największej wiarogodności EN W (µ) po uwzględnieniu modyfikacji założeń.
Odp. 55.555 . . .
zadania aktuarialne (estymacja), modyfikacja WZ, strona 11
Zadanie 63. Niech X1 , . . . , Xn będzie próbką z rozkładu o gęstości prawdopodobieństwa:
fθ (x) =
1 θ1 −1
,
θx
0,
dla 0 < x < 1,
poza tym,
Niech θ̂ będzie estymatorem największej wiarogodności nieznanego parametru θ. Obliczyć funkcję ryzyka
tego estymatora, tzn. R(θ) = Eθ (θ̂ − θ)2 .
Odp. θ2 /n
Zadanie 64. Rozważmy losową liczbę zmiennych losowych X1 , . . . , XN . Zakładamy, że zmienne Xi są wzajemnie niezależne i niezależne od zmiennej losowej N . Wiemy, że każda ze zmiennych Xi ma jednakowy
rozkład wykładniczy o gęstości fα (x) = αe−αx , dla x > 0. Zmienna N ma rozkład Poissona z parametrem
λ. Zarówno λ > 0 jak i α > 0 są nieznane. Obserwujemy tylko te spośród zmiennych X1 , . . . , XN , które
przekraczają wartość 10. Nie wiemy, ile jest pozostałych zmiennych ani jakie są ich wartości. Przypuśćmy,
że zaobserwowaliśmy pięć wartości większych od 10: 15, 23, 11, 32, 19. Na podstawie tych danych obliczyć
wartości estymatorów największej wiarogodności parametrów λ i α.
Odp. λ̂ = 5e, α̂ = 0.1
Zadanie 65. Niech X1 , . . . , Xn będzie próbką z rozkładu prawdopodobieństwa o gęstości
fθ,α (x) =
1 −(x−θ)/α
,
αe
0,
dla x > θ,
poza tym.
Wyznaczono estymatory największej wiarogodności (θ̂, α̂) parametrów (θ, α) w sytuacji, gdy oba parametry
są nieznane (α > 0). Znaleźć taką liczbę c, żeby cα̂ był nieobciążonym estymatorem parametru α.
n
Odp. n−1
Zadanie 66. Niech W1 , . . . , Wn będzie próbką z rozkładu wykładniczego o gęstości dla w > 0 danej wzorem
fλ (w) = λ exp(−λw). Nie obserwujemy dokładnych wartości zmiennych Wi , tylko wartości zaokrąglone
w górę do najbliższej liczby całkowitej. Innymi słowami, dane są wartości zmiennych losowych Z1 , . . . , Zn ,
gdzie Zi = dWi e (symbol dae oznacza najmniejszą liczbę całkowitą k taką, że a ≤ k). Wyznaczyć estymator
największej wiarogodności
λ̂ parametru
λ oparty na obserwacjach Z1 , . . . , Zn .
Pn
Odp. − ln 1 − Sn , gdzie S = i=1 Zi
Zadanie 67. Wektor losowy (X, Y ) ma łączny rozkład prawdopodobieństwa dany następującą tabelką:
X=1
X=2
Y =1
θ)
1
4 (1 −
3
4θ
Y =2
1
4θ
3
4 (1 − θ)
gdzie θ ∈ (0, 1) jest nieznanym parametrem. Na podstawie 25-elementowej próbki z tego rozkładu wyznaczono
estymator największej wiarogodności θ̂. Obliczyć wariancję V arθ̂ estymatora.
Odp. θ(1−θ)
25
Zadanie 68. Zakładamy, że każda pojedyncza szkoda, niezależnie od pozostałych, z prawdopodobieństwem θ
jest likwidowana w roku, w którym została zgłoszona, w drugim roku po zgłoszeniu - z prawdopodobieństwem
θ(1 − θ), w trzecim roku lub później - z prawdopodobieństwem (1 − θ)2 . Dane, którymi dysponujemy dotyczą
szkód. Wiemy, że spośród nich n1 zostało zlikwidowanych w roku, w którym zostały zgłoszone, n2 zostało
zlikwidowanych w drugim roku po zgłoszeniu oraz n3 zostało zlikwidowanych w trzecim roku lub później,
gdzie n1 + n2 + n3 = n. Podać estymator największej wiarogodności parametru θ na podstawie tych danych.
n1 +n2
Odp. 2n−n
1
zadania aktuarialne (estymacja), modyfikacja WZ, strona 12
Zadanie 69. Niech X1 , . . . , Xn będą niezależnymi zmiennymi losowymi z rozkładu normalnego N (µ, σ 2 ),
gdzie oba parametry są nieznane. Estymując parametr µ2 wyznaczono dwa estymatory T1 - estymator największej wiarogodności i T2 - estymator nieobciążony o minimalnej wariancji. Wyznaczyć różnicę ryzyk
estymatorów T1 i T2 przy kwadratowej funkcji straty.
2
Odp. nσ2 (n−3)
(n−1)
Zadanie 70. Niech X1 , . . . , Xm+n będą niezależnymi zmiennymi losowymi, przy czym zmienne losowe Xi ,
i = 1, . . . , m, mają rozkład Weibulla o gęstości
√
θ
−θ x
√
, dla x > 0,
fθ (x) = 2 x e
0,
poza tym,
a Xi , i = m + 1, . . . , m + n, mają rozkład Weibulla o gęstości
√
√θ e−2θ x , dla x > 0,
x
gθ (x) =
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Niech m = n = 5. Obliczyć błąd średniokwadratowy estymatora
największej wiarogodności wyznaczonego na podstawie próby X1 , . . . , Xm+n .
Odp. θ2 /6
Zadanie 71. Niech X1 , . . . , X10 będą niezależnymi zmiennymi losowymi o rozkładzie prawdopodobieństwa
o gęstości
θxθ−1 , dla x ∈ (0, 1),
pθ (x) =
0,
poza tym,
a Y1 , . . . , Y10 będą niezależnymi zmiennymi losowymi o rozkładzie prawdopodobieństwa o gęstości
2θx2θ−1 , dla x ∈ (0, 1),
fθ (x) =
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Wszystkie zmienne losowe są niezależne. Dobrać stałą a tak, aby
T
Pθ
> a = 0.9,
θ
wiedząc, że T jest estymatorem największej wiarogodności parametru θ otrzymanym na podstawie zmiennych
losowych X1 , . . . , X10 i Y1 , . . . , Y10 .
Odp. 0.772
Zadanie 72. Niech T oznacza liczbę pełnych okresów przeżytych przez pacjenta po pewnej operacji. Załóżmy,
że T jest zmienną losową o rozkładzie geometrycznym Pθ (T = t) = θ(1 − θ)t dla t = 0, 1, 2, . . ., przy czym
θ ∈ (0, 1) jest nieznanym parametrem. Obserwujemy losową grupę stu niezależnych pacjentów, przy czym dla
tych pacjentów, dla których T ≤ 5, znamy T dokładnie, a jeżeli pacjent żyje co najmniej sześć okresów, to jego
czas życia jest nieznany, zatem dla każdego z pozostałych pacjentów wiemy tylko, że T ≥ 6. Estymujemy θ na
podstawie tych obserwacji. Wyznaczyć wartość estymatora największej wiarogodności parametru θ wiedząc,
że suma okresów życia pacjentów, którzy przeżyli co najwyżej pięć pełnych okresów jest równa 120 oraz
liczba tych pacjentów jest równa 40.
Odp. 1/13
Zadanie 73. Na podstawie prostej próby losowej X1 , . . . , Xn z rozkładu gamma o gęstości
θ2 xe−θx , gdy x > 0,
fθ (x) =
0,
poza tym,
estymujemy parametr θ wykorzystując estymator największej wiarogodności θ̂. Wyznaczyć w przybliżeniu
rozmiar próby n taki, że
!
|θ̂ − θ|
≤ 0.05 ≈ 0.95.
Pθ
θ
Posłużyć się aproksymacją rozkładem normalnym.
Odp. 800
zadania aktuarialne (estymacja), modyfikacja WZ, strona 13
Zadanie 74. Niech X1 , . . . , X6 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie jednostajnym na przedziale (−θ, θ), gdzie θ > 0 jest nieznanym parametrem. Niech θ̂ oznacza estymator największej
wiarogodności parametru θ. Obliczyć
Pθ (θ̂ < θ < 2θ̂).
Odp. 0.9844
Zadanie 75. Zmienne losowe X1 , . . . , X5 , Y1 , . . . , Y4 są niezależne o tym samym rozkładzie z gęstością
θ
, dla x > 0,
fθ (x) = (1+x)θ+1
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Wyznaczono estymatory największej wiarogodności θ̂1 i θ̂2 parametru θ: estymator θ̂1 na podstawie próby X1 , . . . , X5 i estymator θ̂2 na podstawie próby Y1 , . . . , Y4 . Wyznaczyć
stałe a i b, tak aby
!
!
θ̂1
θ̂1
Pθ
< a = Pθ
> b = 0.05.
θ̂2
θ̂2
Odp. a = 0.299, b = 3.072
Zadanie 76. Zakładamy, że X1 , . . . , Xn , Y1 , . . . , Yn są niezależnymi zmiennymi losowymi o rozkładach normalnych, przy czym EXi = EYi = µ, V arXi = σ 2 , V arYi = 4σ 2 dla i = 1, . . . , n. Parametry µ i σ są
nieznane. Niech σ̂ 2 będzie estymatorem największej wiarogodności parametru σ 2 w tym modelu. Wyznaczyć
stałą a, tak aby σ̃ 2 = aσ̂ 2 był estymatorem nieobciążonym parametru σ 2 .
2n
Odp. 2n−1
Zadanie 77. W urnie znajduje się razem 76 kul: białych i czarnych. Wylosowano dziesięć kul, wśród których
było sześć kul białych. Wyznaczyć wartość estymatora największej wiarogodności liczby kul białych w urnie.
Odp. 46
Zadanie 78. Zakładając, że obserwacje X1 , . . . , X10 stanowią próbkę losową z rozkładu Pareto o gęstości
3θ θ
fθ (x) = (3+x)θ+1 , dlax¿0,
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem, wyznaczono wartość estymatora największej wiarogodności parametru θ i otrzymano θ̂ = 2. W próbce były dwie obserwacje o wartości sześć, a pozostałe osiem obserwacji miało
wartości mniejsze od 6. Okazało się, że w rzeczywistości zaobserwowane wartości stanowiły próbkę z uciętego rozkładu Pareto, czyli były realizacjami zmiennych losowych Xi = min{Yi , 6}, gdzie Yi , i = 1, . . . , 10,
są niezależnymi zmiennymi losowymi z rozkładu o gęstości fθ . Wyznaczyć wartość estymatora największej
wiarogodności parametru θ po uwzględnieniu modyfikacji założeń.
Odp. 1.50
Zadanie 79. Zmienna losowa N ma rozkład Poissona z parametrem λ > 0. Rozważamy losową liczbę
zmiennych losowych X1 , . . . , XN , przy czym zmienne losowe X1 , . . . , XN są niezależne wzajemnie i niezależne
od zmiennej losowej N . Każda ze zmiennych losowych ma rozkład Weibulla o gęstości
2θx exp(−θx2 ), dla x > 0,
fθ (x) =
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Obserwujemy tylko te spośród zmiennych X1 , . . . , XN , które są
większe od 10. Nie wiemy ile jest pozostałych zmiennych ani jakie są ich wartości. Przypuśćmy, że zaobserwowaliśmy cztery wartości większe od 10 i suma ich kwadratów jest równa 1200. Na podstawie tych danych
wyznaczyć wartości estymatorów
największej wiarogodności parametrów θ i λ.
√
Odp. θ̂ = 1/200 i λ̂ = 4 e
zadania aktuarialne (estymacja), modyfikacja WZ, strona 14
Zadanie 80. Niech X1 , . . . , Xn będzie próbą z rozkładu wykładniczego o wartości oczekiwanej 1/λ. Nie
obserwujemy dokładnych wartości zmiennych Xi , tylko wartości zaokrąglone w górę do najbliższej liczby
całkowitej. Innymi słowami, dane są wartości zmiennych losowych Z1 , . . . P
, Zn , gdzie Zi = dXi e (symbol
n
dae oznacza najmniejszą liczbę całkowitą k, taką, że a ≤ k). Niech S =
i=1 Zi . Wyznaczyć estymator
największej wiarogodności
λ̂
nieznanego
parametru
λ
oparty
na
obserwacjach
Z1 , . . . , Z n .
Odp. λ̂ = − ln 1 − Sn
Zadanie 81. Niech X1 , . . . , X16 będzie próbą z rozkładu jednostajnego na przedziale (0, θ). Zmienne losowe
X1 , . . . , X16 nie są w pełni obserwowalne. Obserwujemy zmienne losowe Yi = min{Xi , 10}. Wyznaczyć
wartość estymatora największej wiarogodności θ̂ parametru θ na podstawie następującej próbki
(Y1 , . . . , Y16 ) = (4, 8, 10, 5, 10, 9, 7, 5, 8, 10, 6, 10, 3, 10, 6, 10).
Odp. 16
Zadanie 82. Zmienne losowe X1 , . . . , Xn , . . . są niezależne i mają identyczny rozkład dany gęstością
fθ (x) =
4θx3 exp(−θx4 ),
0.
dla x > 0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Niech Tn oznacza estymator największej wiarogodności funkcji
g(θ) = Pθ (X1 > 1)√= e−θ wyznaczony w oparciu o próbę losową X1 , . . . , Xn . Niech θ = 2. Udowodnić, że
lim P {|Tn − e−2 | n > 2e−2 } = 0.32.
n→∞
Odp. —
zadania aktuarialne (estymacja), modyfikacja WZ, strona 15
Estymatory najmniejszych kwadratów
Zadanie 83. Rozważmy model regresji liniowej
Yi = axi + εi ,
i = 1, 2, 3, 4,
gdzie εi są niezależnymi zmiennymi losowymi o rozkładzie normalnym z wartością oczekiwaną 0 i nieznaną
wariancją σ 2 , x1 , x2 , x3 , x4 są nielosowymi punktami z przedziału [0, 3], natomiast a jest nieznanym współczynnikiem. Dla jakich x1 , x2 , x3 , x4 wariancja estymatora â otrzymanego metodą najmniejszych kwadratów
jest najmniejsza?
Odp. (3, 3, 3, 3)
Zadanie 84. Obserwujemy zmienną yt oraz zmienne [xt,1 . . . , xt,K ], co w postaci macierzowej zapisujemy:


y1
 
y =  ...  ,
yT

x1,1
 ..
X= .
···
..
.
xT,1
···

x1,K
..  .
. 
xT,K
Zakładamy, że rząd macierzy X wynosi K, a rząd macierzy rozszerzonej [y|X] wynosi K + 1 oraz ilość
obserwacji T > K + 1. Niech β = [β1 , . . . , βk ]0 oznacza hipotetyczny wektor współczynników regresji liniowej
oraz niech b = (X 0 X)−1 X 0 y oznacza jego estymator uzyskany zwykłą metodą najmniejszych kwadratów.
Niech e = y − Xb będzie wektorem reszt. Pokazać, że suma reszt jest zero wtedy i tylko wtedy, gdy istnieje
taka kombinacja liniowa kolumn macierzy X, która równa jest wektorowi jedynek.
Odp. —
Zadanie 85. Zakładamy, iż oczekiwany roczny koszt obsługi grupy ubezpieczonych jest liniową funkcją
liczebności grupy (wielkości nielosowej), co możemy sformalizować następująco: EY = ax + b, gdzie Y jest
rocznym kosztem obsługi grupy (w złotówkach), x jest ilością ubezpieczonych w grupie, natomiast a, b są
nieznanymi parametrami. Zakłada się ponadto, że V arY nie zależy od x. Zanotowano roczny koszt obsługi
dla czterech grup o różnych liczebnościach:
x
Y
50
2000
100
3000
200
7000
500
9000
Do estymacji parametrów a, b stosujemy estymator najlepszy wśród wszystkich estymatorów liniowych i równocześnie nieobciążonych. Jaka jest wyestymowana wartość kosztu stałego (parametru b)?
Odp. 2050
Zadanie 86. Zakładamy, że zależność czynnika Y od czynnika x (nielosowego) opisuje model regresji liniowej
Y = β0 + β1 xi + εi . Obserwujemy dwudziestoelementową próbkę, w której x1 = · · · = x10 = 1 i x11 = · · · =
x20 = 3. Zmienne losowe Y1 , . . . , Y20 są niezależne i błędy mają rozkłady normalne o wartości oczekiwanej
0, przy czym V arεi = σ 2 , gdy i = 1, . . . , 10 i V arεi = 4σ 2 , gdy i = 11, . . . , 20. Wyznaczono estymatory
β̂0 i β̂1 parametrów β0 i β1 wykorzystując metodę najmniejszych kwadratów, czyli minimalizując wielość
P
20
2
i=1 (Yi −β0 −β1 xi ) . Wyznaczyć stałe z0 i z1 tak, aby P (|β̂0 −β0 | < z0 σ) = 0.95 i P (|β̂1 −β1 | < z1 σ) = 0.95.
Odp. z0 = 1.18 i z1 = 0.69
Zadanie 87. Zakładamy, że zależność czynnika Y od nielosowego czynnika x opisuje model regresji liniowej
Yi = βxi + εi . Obserwujemy pięcioelementową próbkę, w której xi = i dla i = 1, 2, . . . , 5. Zmienne losowe
Y1 , Y2 , . . . , Y5 są niezależne i błędy mają rozkłady normalne o wartości oczekiwanej 0, przy czym V arεi = iσ 2 ,
gdy i = 1, 2, . . . , 5. Wyznaczono estymator β̂ parametru β wykorzystując ważoną metodę najmniejszych
2
P5
i)
kwadratów, to znaczy minimalizując sumę i=1 (YVi −βx
arεi . Wyznaczyć stałą z tak, by P(|β̂ −β| < zσ) = 0.95.
Odp. 0.51
zadania aktuarialne (estymacja), modyfikacja WZ, strona 16
Zadanie 88. Zakładamy, że zależność czynnika Y od czynnika x (nielosowego) opisuje model regresji liniowej
Yi = β0 +β1 xi +εi . Obserwujemy dziesięcioelementową próbkę, w której x1 = · · · = x5 = 1 i x6 = · · · = x10 =
4. Zmienne losowe są Y1 , . . . , Y10 niezależne i błędy mają rozkłady normalne o wartości oczekiwanej zero,
przy czym V arεi = σ 2 dla i = 1, . . . , 5 oraz V arεi = 9σ 2 dla i = 6, . . . , 10. Wyznaczono estymatory β̂0 i β̂1
parametrów β0 i β1 wykorzystując ważoną metodę najmniejszych kwadratów, to znaczy minimalizując sumę
P10 (Yi −β0 −β1 xi )2
. Wyznaczyć stałe z0 i z1 tak, aby P (|β̂0 − β0 | < z0 σ) = 0.95 i P (|β̂1 − β1 | < z1 σ) = 0.95.
i=1
V arεi
Odp. z0 = 1.46 i z1 = 0.92
zadania aktuarialne (estymacja), modyfikacja WZ, strona 17
Estymatory bayesowskie
Zadanie 89. Niech X będzie zmienną losową o rozkładzie geometrycznym
fθ (x) = Pθ (X = x) = θx (1 − θ),
x = 0, 1, 2, . . .
Załóżmy, że nieznany parametr θ jest realizacją zmiennej losowej Θ, która ma gęstość (a priori)
3θ2 , dla 0 < θ < 1,
π(θ) =
0,
poza tym.
Wyznaczyć wartość bayesowskiego estymatora parametru θ obliczona na podstawie zaobserwowanej wartości
X = 0, czyli E(Θ|X = 0).
Odp. 0.6
Zadanie 90. Niech X1 , . . . , Xn będzie próbką prostą z rozkładu jednostajnego na przedziale (0, θ). Zakładamy, że nieznany parametr θ jest zmienną losową o rozkładzie jednostajnym na przedziale (0, 1]. Wyznaczyć
gęstość a posteriori π(θ|X1 , . . . , Xn ).
Odp. proporcjonalna do θ−n na przedziale [M, 1], gdzie M = max{X1 , . . . , Xn }
Zadanie 91. Niech X1 , . . . , Xn będzie próbką z rozkładu prawdopodobieństwa Pareto o dystrybuancie
1 − x1θ , dla x > 0,
Fθ (x) =
0,
poza tym.
Przyjmując bayesowski punkt widzenia, zakładamy, że nieznany parametr θ jest zmienną losową o rozkładzie
a priori wykładniczym z gęstością
λe−λθ , dla θ ≥ 0,
π(θ) =
0,
poza tym.
Wyznaczyć bayesowski estymator parametru θ, czyli wartość oczekiwaną a posteriori θ̂ = E(θ|X1 , . . . , Xn ).
n+1
Odp. P ln
X +λ
i
Zadanie 92. Niech X1 , . . . , Xn będą niezależnymi zmiennymi losowymi z rozkładu o gęstości
2θ
, dla x > θ,
fθ (x) = x3
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Dla parametru θ zakładamy rozkład a priori o gęstości
θ
, dla θ ∈ (0, 2),
π(θ) = 2
0, poza tym.
Wyznaczyć wartość estymatora bayesowskiego parametru θ przy kwadratowej funkcji straty, jeżeli zaobserwowano próbkę spełniającą warunek min{X1 , . . . , Xn } = 1.
2n+2
Odp. 2n+3
Zadanie 93. Niech X1 , . . . , Xn będą niezależnymi zmiennymi losowymi z rozkładu wykładniczego o gęstości
θe−θx , dla x > 0,
fθ (x) =
0,
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Dla parametru θ zakładamy rozkład a priori o gęstości
9θe−3θ , dla θ > 0,
π(θ) =
0,
poza tym.
Estymujemy parametr θ przy funkcji straty postaci
L(θ, a) = e(θ−a) − (θ − a) − 1.
Wyznaczyć estymator bayesowski
Pan parametru θ.
,
gdzie
T
=
Odp. (n + 2) ln 3+T
i=1 Xi
2+T
zadania aktuarialne (estymacja), modyfikacja WZ, strona 18
Zadanie 94. Niech X1 , . . . , Xn , gdzie n > 1, będą niezależnymi zmiennymi losowymi o tym samym rozkładzie
Weibulla o gęstości
2θx exp(−θx2 ), dla x > 0,
fθ (x) =
0.
poza tym,
gdzie θ > 0 jest nieznanym parametrem. Zakładamy, że parametr θ ma rozkład a priori o gęstości
π(θ) =
β α α−1
Γ(α) θ
0,
exp(−βθ),
dla θ > 0,
poza tym.
Wyznaczyć estymator bayesowski θ̂ parametru θ przy funkcji straty Esschera L(θ, θ̂) = ecθ (θ − θ̂)2 , gdzie
c 6= 0 jest ustaloną liczbą.
Odp. β+Pα+n
n
X 2 −c
i=1
i
zadania aktuarialne (estymacja), modyfikacja WZ, strona 19

Podobne dokumenty