1 Przedziały ufności
Transkrypt
1 Przedziały ufności
1 Przedziały ufności W tym rozdziale będziemy zajmować się przede wszystkim zadaniami związanymi z przedziałami ufności. Będą nas również interesować statystki pozycyjne oraz estymatory największej wiarygodności. 1. (Eg 48/10) Niech X1 , X2 , ..., Xn , n > 5 będą niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na przedziale (0, θ), gdzie θ > 0 jest nieznanym parametrem. Wyznaczamy przedział ufności dla parametru θ postaci [2X3,n , 2Xn−2,n ], gdzie Xk,n oznacza k-tą statystykę pozycyjną z próby X1 , X2 , ..., Xn . Dla jakiej najmniejszej liczebności próby losowej n zachodzi Pθ (θ ∈ [2X2,n , 2Xn−2,n ]) > 0, 9. Odp: D-> 11. Rozwiązanie. Należy pamiętać, że dla ustalonej wartości t zdarzenie Xk,n 6 t jest osiągnięciem co najmniej k sukcesów w doświadczeniu Bernoulliego z prawdopodobieństwem sukcesu F (t) = t/θ dla 0 < t < θ, gdzie F jest dystrybuantą rozkładu jednostajnego na (0, θ). Zatem z prawdopodobieństwem sukcesu F (t) = t/θ dla 0 < t < θ, gdzie F jest dystrybuantą rozkładu jednostajnego na (0, θ). Zatem θ Pθ (X2,n 6 6 Xn−2,n ) = P(2 6 S 6 n − 2), 2 gdzie S pochodzi z rozkładu B(n, 21 ). Obliczamy P(2 6 S 6 n−2) = 1−P(S 6 2)−P(S > n−2) = 1−2( n −n 2 +n2−n +2−n ) = 1−(n2 +n+2)2−n . 2 Dla n = 11 otrzymujemy po raz pierwszy wartość (n2 + n + 2)2−n mniejszą od 0, 1. 333333 2. (Eg 49/10) Niech X1 , X2 , ..., X10 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie o gęstości fθ (x) = θxθ−1 1x∈(0,1) , gdzie θ > 0 jest nieznanym parametrem. Wyznaczamy przedział ufności dla parametru θ postaci [cθ̂, dθ̂], gdzie θ̄ = θ̄(X1 , X2 ..., X10 ) jest estymatorem największej wiarogodności, a stałe c i d są dobrane tak, aby Pθ (θ < cθ̂) = Pθ (θ > dθ̂) = 0, 05. Wyznaczyć c i d. Odp: A-> c = 0, 54 i d = 1, 57. Rozwiązanie. Obliczamy wiarygodność L(θ, x) = θ10 10 Y xθ−1 1xi ∈(0,1) . i i=1 Zatem dla ustalonego x funkcja f (θ) = ln L(θ, x) osiąga maksimum dla θ spełniającego f 0 (θ) = 0, czyli 10 1 X 10 + ln xi = 0. θ i=1 Stąd 10 θ̄ = − P10 . i=1 ln xi 1 Pozostaje znaleźć c i d takie, że Pθ (θ < cθ̄) = Pθ (θ > dθ̄) = 0, 05. P10 Nietrudno sprawdzić, że − ln Xi ma rozkład wykładniczy z parametrem θ. Stąd − i=1 ln Xi ma rozkład Gamma(10, θ). Zatem θ/θ̄ ma rozkład Gamma(10, 10), który dalej jest tym samym co 1 20 1 1 2 20 Gamma( 2 , 2 ) czyli 20 χ (20). To oznacza, że 20c będzie dolnym a 20d górnym kwantylem dla 2 rozkładu χ (20) dla wartości 0, 05. Korzystając z tablica znajdujemy c ' 0, 54, d ' 1, 57. 3. (Eg 50/5) Niech X1 , ..., Xn , n > 1 będzie próbką z rozkładu jednostajnego o gęstości danej wzorem: fθ (x) = 1 1x∈(0,θ) , θ gdzie θ jest nieznanym parametrem. Zmienne losowe X1 , ..., Xn nie są w pełni obserwowalne. Obserwujemy zmienne losowe Yi = min(Xi , M ), gdzie M jest ustaloną liczbą dodatnią. Oblicz estymator największej wiarogodności θ̂ parametru θ jeśli wiadomo, że w próbce Y1 , ..., Yn , jest K obserwacji o wartościach mniejszych niż M i K ∈ {1, ..., n − 1} Odp: B-> M n/K. Rozwiązanie. Z danych zadania dostajemy, że θ > M . Szansa, że dokładnie K zmiennych będzie mniejszych niż M wynosi n M K θ − M n−K ) . ( ) ( θ θ K Warto zauważyć, że przy okazji jest to funkcja wiarygodności. Poszukujemy wartości θ dla której funkcja f (θ) = ln L(θ, x) przyjmuje maksimum czyli punktu θ takiego, że f 0 (θ) = 0. Zachodzi 1 1 −n + (n − K) = 0. θ θ−M Zatem θ̄ = M n/K. 4. (Eg 51/2) Załóżmy, że X1 , X2 , ..., Xn ,P n > 2 są niezależnymi zmiennymi losowymi o jednakowym n rozkładzie wykładniczym. Niech S = i=1 Xi . Oblicz p = P(X1 6 S/2, ..., Xn 6 S/2). Odp: D-> 1 − n 2n−1 . Rozwiązanie. Kluczowe to aby zauważyć, że zdarzeniem przeciwnym do X1 6 S/2, ..., Xn 6 S/2 Sn jest i=1 {Xi > S/2}. Zatem P(X1 6 S/2, ..., Xn 6 S/2) = 1 − nP(X1 > S/2). Rozkład X1 /S jest postaci Beta(1, n − 1). Stąd Z P(X1 6 S/2) = 1 (n − 1)(1 − y)n−2 dy = 1 2 1 2n−1 . Stąd p = 1 − n2−n+1 . 5. (Eg 52/9) Załóżmy, że X1 , X2 , ..., Xn , ... jest ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie wykładniczym o gęstości f (x) = 1 exp(−x/µ) dla x > 0. µ 2 Zmienna losowa N jest niezależna od X1 , X2 , ..., Xn , ... i ma rozkład geometryczny dany wzorem: P(N = n) = p(1 − p)n dla n = 0, 1, 2, ... PN Niech SN = i=1 (przy tym S0 = 0, zgodnie z konwencją). Oblicz E(N |SN = s), dla s > 0. Odp: D-> s(1 − p)/µ + 1. Rozwiązanie. Stosujemy ogólny wzór Bayesa. Najpierw wyznaczamy gęstość (N, S) względem µ ⊗ λ, gdzie µ jest miarą liczącą na Z, a λ miarą Lebesgue’a na R. Przypomnijmy, że Sn ma rozkład Gamma(n, µ1 ) fN,SN (n, s) = p(1 − p)n s sn−1 e− µ 1s>0 1N =0 . (n − 1)!µn Rozkład (N, SN ) ma też atom w (0, 0) który osiąga z prawdopodobieństwem p. Obliczamy gęstość warunkową dla s > 0 [(1 − p)s]n−1 (1−p)s fN,SN (n|s) = e µ 1n>0 . (n − 1)!µn−1 Zatem ∞ X n[(1 − p)s]n−1 − (1−p)s s(1 − p) µ e =1+ . n−1 (n − 1)!µ µ n=1 E(N |Sn = s) = 6. (Eg 53/6) Rozważmy zmienne losowe N, X, Y . Wiadomo, że rozkład warunkowy zmiennej losowej N , gdy X = x i Y = y jest rozkładem Poissona o wartości oczekiwanej x. Rozkład warunkowy zmiennej losowej X, gdy Y = y jest rozkładem Gamma(2, y), a rozkład zmiennej Y jest rozkładem Gamma(4, 3), gdzie rozkład Gamma(α, β) ma gęstość pα,β = β α α−1 −βx x e 1x>0 . Γ(α) Wtedy wariancja VarN jest równa Odp: B-> 7. Rozwiązanie. Obliczamy VarN = EN 2 − (EN )2 = EE(N 2 |X, Y ) − (EE(N, X, Y ))2 = E(X 2 + X) − (EX)2 = 6 2 2 = EE(X 2 + X|Y ) − (EE(X|Y ))2 = E 2 + − (E )2 . Y Y Y Dla zmiennej Z z rozkładu Gamma(α, β) jeśli α > 2, to EZ −2 = EZ −1 = β α−1 . Zatem EY −2 = 3 2, EY −1 = 3 3 β2 (α−1)(α−2) oraz jeśli α > 1, to = 1. Czyli VarN = 9 + 2 − 4 = 7. 7. (Eg 54/8) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie o gęstości pa,b = be−b(x−a) 1x>a gdzie a ∈ R i b > 0 są nieznanymi parametrami. Rozważmy estymator największej wiarygodności (Ta , Tb ) wektora parametrów (a, b). Wartości oczekiwane ETa i ETb są równe 1 n Odp: D-> ETa = a + nb , ETb = n−2 b. 3 Rozwiązanie. Obliczamy wiarygodność L((a, b), x) = bn exp(−b n X (xi − a))1min(xi )>a . i=1 Szukamy punktu (a, b) maksymalizującego wiarygodność. Oczywiście Ta = min(x1 , ..., xn ) natomiast b wyznaczamy korzystając z funkcji f (b) = ln L((Ta , b), x), rozwiązując równanie f 0 (b) = 0 czyli n n X n . = (xi − Ta ), zatem Tb = Pn b i=1 (xi − Ta ) i=1 Obliczamy Z ∞ n Z P(Xi − a > t) dt = ETa − a = ∞ e−nbx dx = 0 0 1 , nb Pn 1 czyli ETa = a + nb . Z powodu braku pamięci rozkładu wykładniczego rozkład i=1 (xi − Ta ) będzie rozkładem (n − 1) zmiennych niezależnych o rozkładzie wykładniczym z parametrem b czyli Gamma(n − 1, b). Obliczamy Z ∞ n−1 b n ETb = n xn−2 e−bx dx = b. (n − 2)! n−2 0 8. (Eg 55/6) Niech N oraz X1 , X2 , ... będą niezależnymi zmiennymi losowymi, przy czym N ma rozkład Poissona z wartością oczekiwaną λ = 1, zaś rozkład każdej ze zmiennych Xn podaje następująca tabelka: x 1 2 3 . P(Xn = x) 21 14 14 PN Niech S = i=1 Xi dla N > 0 i S = 0 dla N = 0. Oblicz warunkową wartość oczekiwaną E(N |S = 3). 27 . Odp: A-> 19 Rozwiązanie. Mamy klasyczny wzór Bayesa E(N |S = 3) = ∞ X nP(N = n|S = 3) = n=0 ∞ X P(S = 3|N = n)P(N = n) n P∞ . m=0 P(S = 3|N = m)P(N = m) n=0 Nadto ∞ X nP(S = 3|N = n)P(N = n) = P(X1 = 3)P(N = 1) + 2(P(X1 = 2, X2 = 1)+ n=0 + P(X1 = 1, X2 = 2))P(N = 2) + 2P(X1 = X2 = X3 = 1)P (N = 3) = 1 1 1 = e−1 ( + + ) 4 4 16 oraz ∞ X P(S = 3|N = m)P(N = m) = P(X1 = 3)P(N = 1)+ m=0 + (P(X1 = 2, X2 = 1) + P(X1 = 1, X2 = 2))P (N = 2) + P(X1 = X2 = X3 = 1) = 1 1 1 = e−1 ( + + ) 4 8 48 Stąd E(N |S = 3) = 27 19 . 4 9. (Eg 56/9) Niech X1 , X2 , ..., Xn będą zmiennymi losowymi o rozkładzie P areto(1, a1 ) a Y1 , Y2 , ..., Ym będą zmiennymi losowymi o rozkładzie P areto(1, a2 ), gdzie a1 , a2 > 0 są nieznanymi parametrami. Wszystkie zmienne są niezależne. Na poziomie ufności 1 − α budujemy przedział ufności [dT, cT ] dla parametru aa12 na podstawie estymatora największej wiarogodności T tegoż parametru w ten sposób, że a1 a1 α Pa1 ,a2 (cT < ) = Pa1 ,a2 (dT > ) = . a2 a2 2 Jeśli α = 0, 1 i m = 4 i n = 5, to przedział ufności ma długość Odp: E-> 3, 02T . Rozwiązanie. Jeśli m = 4 i n = 5, to funkcja wiarygodności ma postać L((a1 , a2 ), (x, y)) = α15 α24 5 Y (xi )−α1 −1 1xi >1 i=1 4 Y (yj )−α2 −1 1yj >1 . j=1 Zatem estymatorem EN W (α1 , α2 ) jest punkt minimum funkcji f (α1 , α2 ) = ln L((a1 , a2 ), (x, y)), ∂f ∂f = ∂α = 0. Obliczamy czyli rozwiązanie równania ∂α 1 2 5 4 X X 5 4 ln xi , ln yi . = = α1 α2 i=1 i=1 Stąd α̂1 = P5 5 , i=1 ln Xi α̂2 = P4 4 i=1 ln Yi . Zatem P4 α̂1 5 i=1 ln Yi T = = P5 . α̂2 4 i=1 ln Xi P5 P4 Oczywiście i=1 ln Xi ma rozkład Gamma(5, α1 ), a i=1 ln Yi rozkład Gamma(4, α2 ) nadto te P4 P5 1 2 zmienne są niezależne. Stąd 2α1 i=1 ln Xi ma rozkład Gamma( 10 i=1 ln Yi 2 , 2 ) = χ (10), a 2α2 ma rozkład Gamma( 82 , 12 ) = χ2 (8). Zatem aa12 T ma rozkład Fishera-Snedecora F (10, 8). Odczytujemy z tablic c = 3, 347, d = 0, 326. Stąd długość [dT, cT ] wynosi w przybliżeniu 3, 021T . 10. (Eg 57/7) Niech X1 , X2 , ..., X10 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie o nieznanej medianie m. Budujemy przedział ufności dla parametru m postaci [X3:10 , X7:10 ], gdzie Xk:10 oznacza k-tą statystykę pozycyjną z próby X1 , X2 , ..., X10 . Prawdopodobieństwo P(m ∈ [X3:10 , X7:10 ]) jest równe 114 Odp: A-> 128 . Rozwiązanie. Należy zauważyć, że dla ustalonego t szansa, że Xk:10 6 t jest równe prawdopodobieństwu uzyskania co najmniej k sukcesów w doświadczeniu Bernoulliego z prawdopodobieństwem F (t), gdzie F jest dystrybuantą wspólnego rozkładu zmiennych X1 , ..., X10 . Przyjmujemy, że rozkład jest ciągły (ściślej, że F (m) = 21 ), w przeciwnym razie zadanie nie daje się rozwiązać. Wówczas przyjmując, że zmienna S ma rozkład B(10, 12 ) zachodzi równość P(m ∈ [X3:10 , X7:10 ]) = P(3 6 S < 7) = 1 − 2(1 + 10 + 45) + 120 23 (14 + 15) 99 = 1 − = . 210 29 128 11. (Eg 58/2) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi z rozkładu Pareto o gęstości θλθ 1x>0 , fθ (x) = (λ + x)θ+1 gdzie θ, λ > 0 są nieznanymi parametrami. Rozważmy estymatory największej wiarygodności θ̄n , λ̄n parametrów θ i λ. Chcemy dobrać stałą t tak aby przy n dążącym do nieskończoności 5 √ prawdopodobieństwo zdarzenia |θ̄n − θ| n > t było równe 0, 1. Jeżeli θ = 3 i λ = 1, to stała t jest równa Odp: A -> 19, 7. Rozwiązanie. W tym zadaniu najprościej skorzystać z twierdzeń o asymptotycznej zbieżności. Twierdzenia te bazują na analizie wiarygodności L((θ, λ), x) = n X θλθ , ln L((θ, λ), x) = n(ln θ + θ ln λ) − (θ + 1) ln(λ + xi ). (λ + xi )θ+1 i=1 i=1 n Y Aby zachodziła asymptotyczna normalność po pierwsze musi być spełniony warunek zgodności. To znaczy, że (θ̄n , λ̄n ) → (θ, λ) przynajmniej według prawdopodobieństwa. Okazuje się, że przy różniczkowalnej funkcji wiarygodności wystarczy aby ∂ ln L = 0, czyli równanie ∂ ln L((θ, λ), x) ∂ ln L((θ, λ), x) = 0, =0 ∂θ ∂λ miało dokładnie jedno rozwiązanie dla dowolnego n. Sprawdzamy warunek n X ∂ ln L((θ, λ), x) 1 = n( + ln λ) − ln(λ + xi ) = 0, ∂θ θ i=1 n X θ 1 ∂ ln L((θ, λ), x) = n − (θ + 1) = 0. ∂λ λ λ + xi i=1 Zatem w rozwiązaniu tego równania parametr θ można wyrazić jako funkcję λ to znaczy Pn λ θ= n− i=1 λ+xi λ i=1 λ+xi Pn . Natomiast powstała po podstawieniu wyliczonego θ funkcja od λ czyli n( Pn n λ i=1 λ+xi − 1) + n n X ln i=1 λ λ + xi jest malejąca i zmienia się od +∞ dla λ = 0 do −n dla λ = ∞ zatem ma tylko jedno miejsce zerowe. Jeśli teraz skończone są również drugie pochodne funkcji ln L to rozkłady (λ̄n , θ̄n ) mają asymptotycznie rozkład normalny N ((λ, θ), Cn ), gdzie macierz kowariancji Cn = −(E∂ 2 ln L)−1 . Obliczamy zatem drugie pochodne " # Pn 1 n − nλ + i=1 λ+x 2 θ2 i Pn Pn −∂ ln L(θ, λ) = . 1 1 nθ − nλ + i=1 λ+x i=1 (λ+xi )2 λ2 − (θ + 1) i Pozostaje obliczyć odpowiednie parametry dla θ = 3 i λ = 1 n n = , θ2 9 n n X 1 3 n E− + = −n + n = − , λ i=1 λ + Xi 4 4 E gdzie korzystamy z faktu E(λ + Xi )k = Cn = n 9 − n4 3 3+k , − n4 E n X nθ 1 3 3n − (θ + 1) = 3n − 4n = , 2 λ2 (λ + X ) 5 5 i i=1 dla k > 0. Stąd wynika, że −1 3n 5 6 15 · 16 = n2 3n 5 n 4 n 4 n 9 . √ n W szczególności oznacza to, że (θ̄n −3) zbiega według rozkładu do Z z rozkładu N (0, 1). Obli12 czamy √ √ |θ̄n − 3| n t t lim P(|θ̄n − θ| n > t) = lim P( > ) = P(|Z| > ) = 0, 1. n→∞ n→∞ 12 12 12 t Z tablic dostajemy 12 ' 1, 64. Stąd t ' 19, 68. 12. (Eg 59/10) Niech X1 , X2 , ..., X10 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie Pareto o gęstości 2θ θ 1x>0 , fθ (x) = (2 + x)θ+1 gdzie θ > 0jest nieznanym parametrem. W oparciu o estymator największej wiarogodności T parametru θ zbudowano przedział ufności dla θ na poziomie ufności 0, 95 postaci [cT, dT ], gdzie liczby c i d dobrano tak, aby Pθ (θ < cT ) = Pθ (θ > dT ) = 0, 025. Liczby c i d są równe Odp: A-> c = 0, 48 i d = 1, 71. Rozwiązanie. Obliczamy estymator EN W (θ), wiarygodność ma postać 10 Y 2θ θ , (2 + xi )θ+1 i=1 L(θ, x) = stąd ln L(θ, x) = 10θ ln 2 + 10 ln θ − (θ + 1) 10 X ln(2 + xi ). i=1 Należy znaleźć rozwiązanie równania ∂ ln L(θ,x) ∂θ = 0, czyli 10 10 ln 2 + 10 X − ln(2 + xi ) = 0. θ i=1 To znaczy 10 θ = P10 i=1 (ln(2 + xi ) − ln 2) . Wyznaczmy rozkład ln(2 + Xi ) − ln 2. Dla t > 0 P(ln(2 + Xi ) − ln 2 > t) = P(Xi > 2et − 2) = 2θ (2et )−θ = e−θt , P10 czyli rozkładem ln(2+Xi )−ln 2 jest rozkład wykładniczy z parametrem θ. Stąd i=1 (ln(2+Xi )− 1 ln 2) ma rozkład Gamma(10, θ). Zatem 1/T ma rozkład 10−1 Gamma(10, θ) = 20−1 θ−1 Gamma( 20 2 , 2) −1 −1 2 2 czyli 20 θ χ (20). Niech Z będzie z rozkładu χ (20), zachodzi Pθ (θ < cT ) = P(Z < 20c) = 0, 025, Pθ (θ > dT ) = P(Z > 20d) = 0, 025. Z tablic rozkładu χ2 otrzymujemy 20c ' 9, 591, 20d ' 34, 170, czyli c ' 0, 48, d ' 1, 71. 13. (Eg 60/1) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi z rozkładu o gęstości fθ (x) = 1 − 1 −1 x θ 1x>1 , θ gdzie θ ∈ (0, 1) jest nieznanym parametrem. Rozważamy nieobciążony estymator parametru θ postaci Tn = aY , gdzie Y = min(ln X1 , ln X2 ..., ln Xn ) i a jest odpowiednio dobraną stałą (być może zależną od liczebności próby n). Dla θ = 31 i ε = 61 zachodzi 1 3 Odp: C-> Pθ (|Tn − θ| > ε) = 1 − e− 2 + e 2 . 7 Rozwiązanie. Jak nietrudno stwierdzić ln Xi ma rozkład wykładniczy Exp( θ1 ). Dalej rozkład Y n ). Stąd a = n, niech teraz Z będzie z rozkładu ma postać Exp( nθ ) i w końcu aY ma rozkład Exp( aθ Exp(1), zachodzi Pθ (|Tn − θ| > ε) = P(|θZ − θ| > ε) = P(|Z − 1| > 1 ). 2 Czyli 3 1 1 3 lim Pθ (|Tn − θ| > ε) = 1 − P(Z ∈ [ , ]) = 1 − e− 2 + e− 2 . n→∞ 2 2 14. (Eg 61/7) Zmienna losowa X ma rozkład o gęstości fθ (x) = θ 1x>1 , xθ+1 gdzie θ > 0 jest nieznanym parametrem. Nie obserwujemy zmiennej X ale zmienną Y równą X, gdy X jest większe od 2. Nie wiemy, ile było obserwacji zmiennej X nie większych niż 2 ani jakie były ich wartości. W wyniku tego eksperymentu otrzymujemy próbkę losową Y1 , Y2 , ..., Y8 Na podstawie próbki budujemy przedział ufności dla parametru θ postaci [c1 T, c2 T ], gdzie T jest estymatorem największej wiarogodności parametru θ, a stałe c1 i c2 dobrane są tak, by P(θ < c1 T ) = P(θ > c2 T ) = 0, 05 Wtedy długość przedziału ufności jest równa Odp: C-> 1, 146T . Rozwiązanie. Interesuje nas rozkład warunkowy X pod warunkiem, że X > 2 który ma gęstość gθ (x) = θ2θ 1x>2 . xθ+1 Dalej zadanie jest standardowe, wyznaczamy estymator EN W (θ) z równania ∂ ln L(x,θ) ∂θ = 0, czyli 8 8 ln 2 + 8 X ln xi = 0. − θ i=1 Stąd 8 T = P8 . − ln 2) P8 Dalej zauważamy, że ln Xi −ln 2 ma rozkład Exp(θ). Stąd i=1 (ln Xi −ln 2) ma rozkład Gamma(8, θ) 1 −1 −1 2 i wreszcie T −1 ma rozkład 16−1 θ−1 Gamma( 16 θ χ (16). To pozwala obliczyć stałe c1 2 , 2 ) = 16 2 i c2 z tablic rozkładu χ . Istotnie niech Z będzie z rozkładu χ2 (16), zachodzi i=1 (ln Xi P(θ < c1 T ) = P(Z < 16c1 ) = 0, 05, P(θ > c2 T ) = P(Z > 16c2 ). Zatem 16c1 ' 7, 962, 16c2 ' 26, 296, czyli c1 ' 0, 498, c2 = 1, 644. Długość przedziału ufności wynosi w przybliżeniu 1, 146T . 15. (Eg 62/7) Niech X1 , ..., X10 , ..., X30 będzie próbką losową z rozkładu normalnego N (µ, σ 2 ), z nieznanymi parametrami µ i σ 2 . Niech 10 X̄10 = 1 X Xi , 10 i=1 10 2 S 2 = S10 = 30 X̄30 = 1 X Xi , 30 i=1 1X (Xi − X̄10 )2 . 9 i=1 8 Skonstruowano przedział [X̄10 − aS, X̄10 + aS] taki, że P(X̄30 ∈ [X̄10 − aS, X̄10 + aS]) = 0, 95. Liczba a jest równa Odp: E-> 0, 584. Rozwiązanie. W tym zadaniu do rozkładu t-Studenta. Mamy P30istotne jest aby umiejętnie przejść 1 1 2 niezależność X̄10 , X̄20 = 20 i=11 Xi oraz S. Nadto X̄30 = 3 X̄10 + 3 X̄20 . Stąd P(X̄30 ∈ [X̄10 − aS, X̄10 + aS]) = P(|X̄20 − X̄10 | < 2 Teraz X̄20 − X̄10 ma rozkład N (0, 3σ 20 ). Natomiast Z= √ √20 (X̄20 3 − X̄10 ) S P10 i=1 (Xi 3 aS) 2 − X̄10 ma rozkład σ 2 χ2 (n − 1). Stąd , ma rozkład t-Studenta a 9 stopniami swobody. Zatem P(X̄30 ∈ [X̄10 − aS, X̄10 + aS]) = P(|Z| > Zatem √ √ 15a) = 0, 95. 15a = 2, 262, czyli a ' 0, 584 16. (Eg 63/9) Niech X1 , X2 , ..., Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie Laplace’a o gęstości fθ (x) = exp(−2|x − θ|) dla x ∈ R, gdzie θ jest nieznanym parametrem rzeczywistym. Rozważamy estymator θ̄ parametru θ równy medianie z próby X1 , X2 , ..., Xn θ̄ = X[0,5n]:n . W oparciu o ten estymator budujemy przedział ufności dla parametru θ postaci (θ̄ − a, θ̄ + a), gdzie a dobrane jest tak, aby dla każdego θ ∈ R lim Pθ (θ ∈ (θ̄ − a, θ̄ + a)) = 0, 95. n→∞ Wtedy a jest równe √ . Odp: C-> 0,98 n Rozwiązanie. Niech Fθ będzie dystrybuantą rozkładu fθ , czyli 1 − 12 exp(−2|t − θ|) t > θ Fθ (t) = 1 t 6 θ. 2 exp(−2|t − θ|) Przypomnijmy, że rozkład X[0,5n]:n można wyznaczyć korzystając ze zmiennej Borelowskiej Sn (t) z rozkładu B(n, Fθ (t)) to znaczy Pθ (X[0,5n]:n 6 t) = P(Sn (t) > [0, 5n]). Z warunków zadania Pθ (θ ∈ (θ̄ − a, θ̄ + a)) = Pθ (θ − a < θ̄ < θ + a) = = P(Sn (θ − a) > [0, 5n]) − P(Sn (θ + a) > [0, 5n]), 9 gdzie korzystamy z tego, że X[0,5n]:n ma rozkład ciągły. Będziemy tak dobierać ciąg a aby zachodziło CTG. Niech Z będzie z rozkładu N (0, 1), wówczas jeśli a = √cn wtedy na mocy CTG lim P(Sn (θ − a) > [0, 5n]) = P(Z > −2c), n→∞ gdzie korzystamy z równości [0, 5n] − Fθ (θ − a) lim p ) = −2c. nFθ (θ − a)(1 − Fθ (a − θ)) n→∞ Istotnie zauważmy, że lim p n→∞ Fθ (θ − a)(1 − Fθ (a − θ)) = 1 2 nadto na mocy przybliżenia e−x ' 1 − x dla małych x otrzymujemy lim n→∞ 2([0, 5n] − Fθ (θ − a)) √ = −2c n Analogicznie lim P(Sn (θ + a) > [0, 5n]) = P(Z > 2c). n→∞ Dobieramy zatem 2c tak aby P(Z ∈ (−2c, 2c)) = 0, 95. Zatem 2c = 1, 96, czyli c = 0, 98. 10