Modele i wnioskowanie statystyczne (MWS), sprawozdanie z

Transkrypt

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z
Modele i wnioskowanie statystyczne (MWS),
sprawozdanie z laboratorium 2
Konrad Miziński, nr albumu 233703
10 maja 2015
Zadanie 1
Na podstawie intuicji zaproponowano prawdopodobieństwo p = 0.6 upadku pinezki
ostrzem do góry.
Jako rozkład a priori wybrano rozkład beta z parametrem α = 6 (przyjetym
˛
arbitralnie)
oraz parametrem β wyznaczonym wg wzoru:
p=
α
1−p
⇒β =α·
=4
α+β
p
oraz rozkład jednostajny - tzn. rozkład beta z parametrami:
α=1 i
β=1
Nastepnie
˛
dwukrotnie wykonano doświadczenie polegajace
˛ na rzucie pinezka˛ 20 razy.
Otrzymano nastepuj
˛
ace
˛ ciagi
˛
A1 = (0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1)
A2 = (1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0)
gdzie 1 oznacza upadek pinezki ostrzem do góry. Parametry α i β rozkładów a posteriori
wyznaczono wg wzorów:
αpost = α + |a ∈ A : a = 1|
βpost = β + |a ∈ A : a = 0|
gdzie |a ∈ A : a = 1| oznacza ilość wyrazów w ciagu
˛
A o wartości równej 1. Wyznaczono
także estymator pb oraz wariancje˛ s2 :
pb =
s2 =
αpost
αpost + βpost
αpost βpost
(αpost + βpost )2 (αpost + βpost + 1)
Wyniki przedstawiono w tablicy 1. Wykresy gestości
˛
prawdopodobieństwa p przedstawiono na rysunkach 1 i 2
1
Rozkład a prori
αprior
βprior
p
σ2
αpost
βpost
pb
s2
αpost
βpost
pb
s2
Rozkład z p = 0.6 Rozkład jednostajny
Rozkład a priori
6
1
4
1
0.6
0.5
0.0218
0.0833
Rozkład a posteriori po 20 rzutach
17
12
13
10
0.5667
0.5454
0.0079
0.0108
Rozkład a posteriori po 40 rzutach
28
23
22
19
0.56
0.5476
0.0048
0.0058
Tablica 1: Parametry rozkładów a priori i a posteriori prawdopodobieństwa p
Rysunek 1: Rozkłady gestości
˛
prawdopodobieństwa p, dla rozkładu a priori z p = 0.6
2
Rysunek 2: Rozkłady gestości
˛
prawdopodobieństwa p, z rozkładem normalnym jako
rozkładem a prori
Z wykresów można zauważyć, że rzeczywista wartość parametru p jest mniej wiecej
˛
zgodna z intuicyjna˛ wartościa˛ 0.6.
Zauważyć należy również, że wraz z licznościa˛ próby maleje wariancja rozkładu prawdopodobieństwa p. Oznacza to, że wraz ze zwiekszaniem
˛
liczby doświadczeń wzrasta
dokładność oszacowania parametru p.
Niezależnie od poczatkowych
˛
wartości parametrów rozkładów a priori otrzymujemy
podobne rozkłady a posteriori, co oznacza, że nie maja˛ one krytycznego wpływu na wynik
końcowy.
3
Zadanie 2
Parametry rozkładu gamma wyliczono za pomoca˛ wzorów:
µ= α
β
σ 2 = βα2
⇒
α=
β=
µ = 0.5, σ 2 = 1
⇒
α = 0.25, β = 0.5
µ2
σ2
µ
σ2
Otrzymano wyniki:
a)
2
⇒
b) µ = 10, σ = 20
α = 5, β = 0.5
Rozkłady a posteriori wyliczono wg wzoru:
fpost (λ, x) = R
L(λ, x) · fprior (λ, x)
L(λ, x) · fprior (λ, x)dλ
Θ
z funkcja˛ wiarygodności L właściwa˛ dla rozkładu wykładniczego:
L(λ, x) = λn · eλ
Pn
i=1
xi
co po zastosowaniu tożsamości:
n
X
xi = n · Xn
i=1
sprowadza sie˛ do:
L(λ, x) = λn · eλnXn
Otrzymane rozkłady a posteriori na tle rozkładów a priori przedstawiono na rysunku
3.
Widoczne poniżej rozkłady a posteriori można zaliczyć do grupy rozkładów Gamma.
4
a)
b)
Rysunek 3: Rozkłady gestości
˛
parametru λ
5
Zadanie 3
Wartość a priori parametru Θ obliczono dla x = 3:
Θprior =
x
3
=
100
100
Parametry αpost i βpost wyliczono wg wzorów:
αpost = αprior + x
βpost = βprior + 100 − x
b oraz jego wariancje˛ obliczono jako:
Estymator Θ
b=
Θ
s2 =
αpost
αpost + βpost
αpost βpost
(αpost + βpost )2 (αpost + βpost + 1)
Otrzymane wyniki przedstawiono w tablicy 2. Rozkłady gestości
˛
parametru Θ przedstawiono na rysunkach 4 i 5
a
b
Rozkład a priori
αprior 1
0.5
βprior 1
5
Θ
0.03
0.03
µ
0.5
0.0909
σ2
0.0833
0.0128
Rozkład a posteriori
αpost
4
3.5
βpost
98
102
b
Θ
0.0392
0.0332
s2
0.00037 0.00030
Tablica 2: Parametry rozkładów a priori i a posteriori parametru Θ
6
Rysunek 4: Rozkłady gestości
˛
parametru Θ, z rozkładem normalnym jako rozkładem a
prori
7
Rysunek 5: Rozkłady gestości
˛
parametru Θ, z rozkładem gamma(α=0.5, β=5) jako rozkładem a prori
W tym przypadku rozkład a priori ma wiekszy
˛
wpływ na wynik końcowy niż w przypadku zadania 1. Za lepszy na należy uznać rozkład gamma z parametrami α=0.5 i β=5.
Pozwala on na estymacje˛ parametru Θ z mniejszym błedem
˛
przy zachowaniu podobnej
wariancji.
8