Lista czwarta

Transkrypt

Lista czwarta
Inżynierskie zastosowania statystyki — ćwiczenia
Tydzień 4: Estymacja parametrów rozkładu metodą największej wiarogodności
Poniżej opisano używane pojęcia i zebrano charakterystyczne dla tego tematu typy zadań
Zadania
1. Wyznacz estymator µ dla niezależnych zmiennych losowych X1 , X2 , . . . , Xn pochodzących z rozkładu
normalnego N (µ, 1).
Przypomnienie: Funkcja gęstości rozkładu N (µ, σ) wynosi fσ (x) =
√1
σ 2π
2
exp( −(x−µ)
2σ 2 ).
Rozwiązanie tego zadania omówione jest na kolejnej stronie wyjaśniającej metodę estymacji
metodą największej wiarogodności.
2. Dana jest próbka N = 100 wartości obserwacji (xi ) zmiennej losowej X pochodzącej z rozkładu BernoulP
liego B(n, p). Wiedząc, że n = 30 i znając sumę obserwacji N
i=1 xi = 2500 oblicz wartość estymatora p̂
parametru p za pomocą MNW.
Przypomnienie: dla X pochodzącego z rozkładu
Bernoulliego B(n, p) o prawdopodobieństwie sukcesu p
oraz liczbie prób n zachodzi: P (X = k) = nk pk (1 − p)n−k dla k ∈ {0, 1, . . . , n}.
3. Dana jest próbka n mierzonych wartości xi . Metodą największej wiarogodności oszacuj wartość parametru
λ populacji Poissona z której próbka została zaczerpnięta.
Przypomnienie: dla X pochodzącego z rozkładu Poissona zachodzi: P (X = k) = e−λ λk! 1N (k).
k
4. Rozważmy próbkę prostą z rozkładu wykładniczego o nieznanym parametrze λ > 0. Znajdź estymator
największej wiarygodności dla tego parametru.
Przypomnienie: funkcją gęstości rozkładu wykładniczego jest funkcja f (x) = λe−λx 1[0,∞) (x).
5. Metodą największej wiarogodności wyznacz estymator odchylenia standardowego σ dla próby losowej
X = (X1 , X2 , . . . , Xn ) niezależnych zmiennych losowych pochodzących z rozkładu normalnego N (0, σ).
6. Funkcja gęstości prawdopodobieństwa niezależnych zmiennych losowych pochodzących z tego samego rozkładu wyraża się wzorem
fθ (x) = θ1(−∞,0) (x) + (1 − θ)1(0,∞) (x), θ ∈ (0, 1).
W n = 100 próbach otrzymano 6 dodatnich wyników. Oblicz estymator θ̂ parametru θ wykorzystując
MNW.
7. (*) W losowaniu lotto stwierdzono następujące wygrane:
trafienie
6/6
5/6
4/6
3/6
liczba trafień
2
114
6566
103869
Korzystając z metody największej wiarogodności oszacuj liczbę grających.
(Weryfikacja: prawdziwa liczba grających 19.11.2013 to 4 633 135)
Teoria
W estymacji metodą największej wiarogodności obliczamy funkcję wiarogodności, która dla rozkładu
Q
dyskretnego jest iloczynem poszczególnych prawdopodobieństw: L(θ, x1 , x2 , . . . , xn ) = ni=1 P (Xi = xi ) dla
próby (X1 , X2 , . . . , Xn ) niezależnych zmiennych losowych o jednakowym rozkładzie, zaś dla rozkładu ciągłego
Q
jest iloczynem poszczególnych funkcji gęstości: L(θ, x1 , x2 , . . . , xn ) = ni=1 fθ (xi ) dla próby (X1 , X2 , . . . , Xn ) niezależnych zmiennych losowych o jednakowym rozkładzie. Estymatorem największej wiarogodności jest parametr
θ̂, który maksymalizuje wartość funkcji wiarogodności, tzn. dla każdej wartości θ mamy L(θ̂, x1 , x2 , . . . , xn ) ­
L(θ, x1 , x2 , . . . , xn ). Taki parametr może w ogólności nie istnieć.
Jeżeli L(θ, x1 , . . . , xn ) jest funkcją różniczkowalną, to estymatora największej wiarogodności poszukujemy
1 ,...,xn )
wśród punktów spełniających równanie ∂L(θ,x∂θ
= 0. Często wygodniej używać logarytmu naturalnego
funkcji L niż samej funkcji L, ponieważ funkcja logarytmiczna jest ściśle rosnąca, co powoduje, że ekstrema
funkcji L(θ, x1 , . . . , xn ) oraz logarytmu wiarogodności l(θ, x1 , . . . , xn ) = ln(L(θ, x1 , . . . , xn )) są osiągane w tym
samym punkcie.
W zadaniu pierwszym zadany jest rozkład ciągły, zatem funkcja wiarogodności wynosi
n
Y
n
Y
(xi −µ)2
n
1
√ e− 2
L(µ, x1 , . . . , xn ) =
fµ (xi ) =
= (2π)− 2 e−
2π
i=1
i=1
Pn
i=1
(xi −µ)2
2
Naturalnym wyborem będzie poszukiwanie minimum logarytmu naturalnego l funkcji wiarogodności L:
n
n
n
n
1X
1X
(xi − µ)2 = − ln(2π) −
(x2 − 2µxi + µ2 )
l(µ, x1 , . . . , xn ) = ln(L(µ, x1 , . . . , xn )) = − ln(2π) −
2
2 i=1
2
2 i=1 i
Po dalszym uproszczeniu otrzymujemy wyrażenie:
n
n
X
n
n
1X
x i − µ2
x2i + µ
l(µ, x1 , . . . , xn ) = − ln(2π) −
2
2 i=1
2
i=1
Naszym zadaniem jest próba odnalezienia takiego µ̂, by wartość l(µ̂, x1 , . . . , xn ) była największa. W tym
celu poszukajmy miejsc zerowych pochodnej cząstkowej z logarytmu funkcji wiarogodności względem nieznanego
parametru µ:
n
∂l(µ, x1 , . . . , xn ) X
xi − nµ.
=
∂µ
i=1
Powyższe wyrażenie przyjmuje wartość zero dla µ̂ = n1 ni=1 xi . Pozostaje sprawdzić, czy w tym punkcie funkcja
l ma maksimum. W tym celu można na przykład policzyć drugą pochodną funkcji l w punkcie µ = µ̂:
P
∂2l
(µ̂, x1 , . . . , xn ) = −n < 0.
∂µ2
Skoro druga pochodna w punkcie µ̂ jest ujemna, to w tym punkcie funkcja wiarogodności ma maksimum.
Ostatecznie udało się nam wyznaczyć estymator µ̂ średniej µ dla próby (x1 , . . . , xn ) pochodzącej z rozkładu
normalnego N (µ, 1) metodą największej wiarogodności i wynosi on
µ̂ =
n
1X
xi .
n i=1