Modele i wnioskowanie statystyczne (MWS), sprawozdanie z
Transkrypt
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 2 Konrad Miziński, nr albumu 233703 10 maja 2015 Zadanie 1 Na podstawie intuicji zaproponowano prawdopodobieństwo p = 0.6 upadku pinezki ostrzem do góry. Jako rozkład a priori wybrano rozkład beta z parametrem α = 6 (przyjetym ˛ arbitralnie) oraz parametrem β wyznaczonym wg wzoru: p= α 1−p ⇒β =α· =4 α+β p oraz rozkład jednostajny - tzn. rozkład beta z parametrami: α=1 i β=1 Nastepnie ˛ dwukrotnie wykonano doświadczenie polegajace ˛ na rzucie pinezka˛ 20 razy. Otrzymano nastepuj ˛ ace ˛ ciagi ˛ A1 = (0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1) A2 = (1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0) gdzie 1 oznacza upadek pinezki ostrzem do góry. Parametry α i β rozkładów a posteriori wyznaczono wg wzorów: αpost = α + |a ∈ A : a = 1| βpost = β + |a ∈ A : a = 0| gdzie |a ∈ A : a = 1| oznacza ilość wyrazów w ciagu ˛ A o wartości równej 1. Wyznaczono także estymator pb oraz wariancje˛ s2 : pb = s2 = αpost αpost + βpost αpost βpost (αpost + βpost )2 (αpost + βpost + 1) Wyniki przedstawiono w tablicy 1. Wykresy gestości ˛ prawdopodobieństwa p przedstawiono na rysunkach 1 i 2 1 Rozkład a prori αprior βprior p σ2 αpost βpost pb s2 αpost βpost pb s2 Rozkład z p = 0.6 Rozkład jednostajny Rozkład a priori 6 1 4 1 0.6 0.5 0.0218 0.0833 Rozkład a posteriori po 20 rzutach 17 12 13 10 0.5667 0.5454 0.0079 0.0108 Rozkład a posteriori po 40 rzutach 28 23 22 19 0.56 0.5476 0.0048 0.0058 Tablica 1: Parametry rozkładów a priori i a posteriori prawdopodobieństwa p Rysunek 1: Rozkłady gestości ˛ prawdopodobieństwa p, dla rozkładu a priori z p = 0.6 2 Rysunek 2: Rozkłady gestości ˛ prawdopodobieństwa p, z rozkładem normalnym jako rozkładem a prori Z wykresów można zauważyć, że rzeczywista wartość parametru p jest mniej wiecej ˛ zgodna z intuicyjna˛ wartościa˛ 0.6. Zauważyć należy również, że wraz z licznościa˛ próby maleje wariancja rozkładu prawdopodobieństwa p. Oznacza to, że wraz ze zwiekszaniem ˛ liczby doświadczeń wzrasta dokładność oszacowania parametru p. Niezależnie od poczatkowych ˛ wartości parametrów rozkładów a priori otrzymujemy podobne rozkłady a posteriori, co oznacza, że nie maja˛ one krytycznego wpływu na wynik końcowy. 3 Zadanie 2 Parametry rozkładu gamma wyliczono za pomoca˛ wzorów: µ= α β σ 2 = βα2 ⇒ α= β= µ = 0.5, σ 2 = 1 ⇒ α = 0.25, β = 0.5 µ2 σ2 µ σ2 Otrzymano wyniki: a) 2 ⇒ b) µ = 10, σ = 20 α = 5, β = 0.5 Rozkłady a posteriori wyliczono wg wzoru: fpost (λ, x) = R L(λ, x) · fprior (λ, x) L(λ, x) · fprior (λ, x)dλ Θ z funkcja˛ wiarygodności L właściwa˛ dla rozkładu wykładniczego: L(λ, x) = λn · eλ Pn i=1 xi co po zastosowaniu tożsamości: n X xi = n · Xn i=1 sprowadza sie˛ do: L(λ, x) = λn · eλnXn Otrzymane rozkłady a posteriori na tle rozkładów a priori przedstawiono na rysunku 3. Widoczne poniżej rozkłady a posteriori można zaliczyć do grupy rozkładów Gamma. 4 a) b) Rysunek 3: Rozkłady gestości ˛ parametru λ 5 Zadanie 3 Wartość a priori parametru Θ obliczono dla x = 3: Θprior = x 3 = 100 100 Parametry αpost i βpost wyliczono wg wzorów: αpost = αprior + x βpost = βprior + 100 − x b oraz jego wariancje˛ obliczono jako: Estymator Θ b= Θ s2 = αpost αpost + βpost αpost βpost (αpost + βpost )2 (αpost + βpost + 1) Otrzymane wyniki przedstawiono w tablicy 2. Rozkłady gestości ˛ parametru Θ przedstawiono na rysunkach 4 i 5 a b Rozkład a priori αprior 1 0.5 βprior 1 5 Θ 0.03 0.03 µ 0.5 0.0909 σ2 0.0833 0.0128 Rozkład a posteriori αpost 4 3.5 βpost 98 102 b Θ 0.0392 0.0332 s2 0.00037 0.00030 Tablica 2: Parametry rozkładów a priori i a posteriori parametru Θ 6 Rysunek 4: Rozkłady gestości ˛ parametru Θ, z rozkładem normalnym jako rozkładem a prori 7 Rysunek 5: Rozkłady gestości ˛ parametru Θ, z rozkładem gamma(α=0.5, β=5) jako rozkładem a prori W tym przypadku rozkład a priori ma wiekszy ˛ wpływ na wynik końcowy niż w przypadku zadania 1. Za lepszy na należy uznać rozkład gamma z parametrami α=0.5 i β=5. Pozwala on na estymacje˛ parametru Θ z mniejszym błedem ˛ przy zachowaniu podobnej wariancji. 8