Statystyka matematyczna. Wykład III. Estymacja przedziałowa
Transkrypt
Statystyka matematyczna. Wykład III. Estymacja przedziałowa
Rozkłady zmiennych losowych Estymacja przedziałowa Statystyka matematyczna. Wykład III. Estymacja przedziałowa Edward Kozłowski e-mail:[email protected] Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Spis treści 1 Rozkłady zmiennych losowych Rozkład χ2 Rozkład t-Studenta Rozkład Fischera 2 Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Rozkład χ2 Definicja 1. Niech zmiwenne losowe Ui , i = 1, 2, ..., n mają rozkład normalny N (0; 1), wtedy zmienna losowa Xn = n X Ui2 i=1 ma rozkład χ2 o n stopniach swobody oraz oznaczamy jako Xn ∼ χ2 (n). Funkcja gęstości ( f (x, n) = √ n x 1 x 2 −1 e− 2 , 2n Γ( n 2) dla x > 0 dla x ¬ 0 0, gdzie gamma-funkcja Γ (·) jest dana wzorem Z∞ Γ (m) = sm−1 e−s ds. 0 Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Własności: Wartoś oczekiwana zmiennej losowej Xn o rozkładzie χ2 (n) i wariancja wynoszą EXn V ar (Xn ) = n = 2n Zmienna losowa jest asymptotycznie zbieżna (według rozkładu) Xn − n F √ −→ U dla n −→ ∞ 2n gdzie zmienna U ∼ N (0; 1). Zatem dla dośc dużego n mamy √ losowa Xn ∼ N n; 2n . Powyższą aproksymację możemy stosowac dla n 30. Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Zastosowanie: Niech X1 , ..., Xn oznacza n−elementowa próba której elementy są podporządkowane rozkładowi normalnemu N (µ, σ). Niech n S2 = 2 1X Xi − X̄ , n i=1 X̄ = 1X Xi . n i=1 n Zmienna losowa Yn = nS 2 σ2 ma rozkład χ2 (n − 1) i nie zależy od X̄!!! Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Rozkład t-Studenta Definicja 2. Niech U oraz Xn będą niezależnymi zmiennymi losowymi o rozkładach U ∼ N (0; 1) oraz Xn ∼ χ2 (n) odpowiednio. Zmienna losowa U Tn = q Xn n ma rozkład t-Stunenta o n stopniach swobody, oznaczamy jako Tn ∼ t (n). Funkcja gęstości jest dana wzorem − n+1 2 Γ n+1 t2 2 1+ f (t, n) = √ n n nπΓ 2 Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Własności: Dla n 2 wartoś oczekiwana i wariancja zmiennej losowej Tn o rozkładzie t (n) wynoszą ETn = 0 n n−2 Dla n = 1 rozkład t-Studenta jest rozkładem Cauchy’ego, gdzie funkcja gęstości wynosi 1 1 f (t) = π 1 + t2 Wartoś oczekiwana i wariancja w tym przypadku nie istnieją!! Za 1 t lim dt = +∞ a−→+∞ π 1 + t2 V ar (Tn ) = 0 Zmienna losowa Tn jest asymptotycznie zbieżna (według rozkładu) do rozkładu normalnego N (0; 1), tzn. F Tn −→ U dla n −→ ∞ gdzie zmienna losowaEdward U Kozłowski ∼ N (0; 1). Powyższą aproksymację Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Zastosowanie: Niech n−elementowa próba X1 , ..., Xn jest podporządkowana rozkładowi normalnemu N (µ, σ) oraz X̄ i S 2 oznaczają estymatory średniej i wariancji odpowiednio. Zmienna losowa postaci Tn = X̄ − µ √ n−1 S ma rozkład t-Studenta o n − 1 stopniach swobody (Tn ∼ t (n − 1)). Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Rozkład Fischera Definicja 3. Niech zmienne Xn oraz Xm mają rozkłady χ2 o n i m stopniach swobody odpowiednio( Xn ∼ χ2 (n), Xm ∼ χ2 (m)). Zmienna losowa Vn,m = Xn n Xm m ma rozkład Fischera o n i m stopniach swobody (oznaczamy jako Vn,m ∼ F (n, m)). Funkcja gęstości jest dana wzorem n n m Γ( n+m 2 ) x 2 −1 2 2 n+m , n m n m Γ Γ (2) ( 2 ) f (x, n, m) = (m+nx) 2 0, Edward Kozłowski Estymacja przedziałowa dla x > 0, dla x ¬ 0. Rozkłady zmiennych losowych Estymacja przedziałowa Własności: Wartość oczekiwana zmiennej losowej Vn,m EVn,m = m m−2 dla m > 2. Wariancja zmiennej losowej Vn,m V ar (Vn,m ) = 2m2 (m + n − 2) 2 n (m − 2) (m − 4) dla m > 4. Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Zastosowanie: Niech n−elementowa próba X1 , ..., Xn jest podporządkowana rozkładowi normalnemu N (µX , σ), natomiast m−elementowa próba Y1 , ..., Ym jest podporządkowana rozkładowi normalnemu N (µY , σ). Zmienne losowe X1 , ..., Xn , Y1 , ..., Ym są niezależne. Niech X̄ i Ȳ oznaczają estymatory średnich zmiennych losowych X i Y odpowiednio. Zmienna losowa 1 n−1 Vn,m = 1 m−1 n P i=1 n P Xi − X̄ 2 Yi − Ȳ 2 i=1 ma rozkład F (n − 1, m − 1). Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Estymacja przedziałowa Metoda przedziałowa polega na określeniu przedziałów ufności dla nieznanych parametrów rozkładu. Definicja 4. Dla ustalonego poziomu ufności 1 − α (poziomu istotności 0 < α < 1) przedziałem ufności parametru Θ nazywamy przedział (Θ1 , Θ2 ) gdzie końce tego przedziału Θ1 = Θ1 (X1 , ..., Xn ) i Θ2 = Θ2 (X1 , ..., Xn ) są funkcjami próby losowej oraz spełniają warunek P (Θ1 (X1 , ..., Xn ) < Θ < Θ2 (X1 , ..., Xn )) = 1 − α. Widzimy że końce przedziału ufności są zmiennymi losowymi. Nieznana wartość parametru Θ może należeć do przedziału (Θ1 , Θ2 ) lub tez nie! Dla różnych próbek losowych x1 , ..., xn znajdujemy różne przedziały ufności. Stosunek przedziałów ufności które zawierają nieznany parametr Θ do wszystkich przedziałów skonstruowanych w oparciu o próby x1 , ..., xn wynosi 1 − α. Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Przykład 1. Dla poziomu ufności 1 − α w oparciu o próbę losową X1 , ..., Xn znaleźć przedział ufności dla nieznanej wartości µ populacji, w której cecha X ma rozkład normalny N (µ, σ) oraz prametr σ jest znany. Z twierdzenia Lindeberga - Levy’ego zmienna losowa X̄ = X1 + X2 + ... + Xn n dąży do rozkładu N µ, √σn , natomiast statystyka U= X̄ − µ √ n σ ma rozkład normalny N (0, 1). Zadanie polega na wyznaczeniu kwantyli u1 i u2 tak aby spełniona była równość P (u1 < U < u2 ) = F (u2 ) − F (u1 ) = 1 − α. Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Przyjmuąc u2 = F −1 (1 − α2 ) oraz u1 = F −1 (α1 ), gdzie α = α1 + α2 , mamy F (u2 ) − F (u1 ) = 1 − α2 − α1 = 1 − α Rozwiązując nierówność u1 < otrzymujemy X̄ − µ √ n < u2 σ σ σ X̄ − u2 √ < µ < X̄ − u1 √ . n n Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Uwaga. Wybierając dowolne α1 , α2 tak aby była spełniona równość α = α1 + α2 otrzymujemy różne przedziały ufności. Jeżeli α1 = α2 = α2, to dla rozkładu normalnego N (0, 1) mamy F −1 1 − α2 = −F −1 α2 , stąd −u1 = u2 . Zatem przedział ufności jest postaci σ σ X̄ − u √ < µ < X̄ + u √ , n n α −1 1− 2 . gdzie u = F W przypadku, gdy α1 = α, to mamy P (u < U ) = 1 − α. Rozwiązując nierówność X̄ − µ √ n σ otrzymujemy lewostronny przedział ufności σ µ < X̄ − u √ , n u< gdzie u = F −1 (α). Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Uwaga cd. W przypadku, gdy α2 = α, to P (U < u) = 1 − α. Rozwiązując nierówność X̄ − µ √ n<u σ otrzymujemy prawostronny przedział ufności σ X̄ − u √ < µ, n gdzie u = F −1 (1 − α). Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Przedziały ufności dla nieznanej wartości przeciętnej * Cecha X ma rozkład normalny N (µ, σ), gdzie prametr µ jest nieznany, natomiast znane jest ochylenie standardowe σ. Dla poziomu ufności 1 − α w oparciu o próbę X1 , ..., Xn przedział ufności dla nieznanej wartości µ populacji wynosi (patrz przykład 1) gdzie u = F −1 σ σ X̄ − u √ < µ < X̄ + u √ , n n 1 − α2 . Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ * Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ są nieznane oraz n < 100. Statystyka X̄ − µ √ n−1 S ma rozklad t-Studenta o n − 1 stopniach swobody, gdzie Tn = n X̄ = S = 1X Xi n i=1 v u n u1 X 2 t Xi − X̄ n i=1 Z tablic rozkładu t-Studenta na poziomie ufności 1 − α odczytujemy kwantyle rzędu 1 − α2 oraz α2 . Ponieważ rozkład t-Studenta jest rozkładem symetrycznym, to α α t∗ = t−1 , n − 1 = −t−1 1 − , n − 1 , 2 2 gdzie t(x, n) oznacza dystrybuantę rozkladu t-Studenta o n stopniach swobody. Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Dla poziomu ufności 1 − α w oparciu o próbę X1 , ..., Xn przedział ufności dla nieznanej wartości µ populacji wyznaczamy z równości X̄ − µ √ P −t∗ < n − 1 < t∗ = 1 − α. S Ostatecznie otrzymujemy X̄ − S √ t∗ t∗ < µ < X̄ + S √ . n−1 n−1 Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ * Cecha X ma dowolny rozkład o nieznanych wartości średniej µ i odchyleniu standardowym σ (σ < ∞). Dla dużych populacji n 100 z twierdzenia Lindeberga - Levy’ego statystyka U= X̄ − µ √ n S1 ma rozkład asymptotycznie zbieżny do N (0, 1), gdzie n 2 P 1 Xi − X̄ jest nieobciążonym estymatorem odchylenia S12 = n−1 i=1 standardowego σ. Dla poziomu ufności 1 − α w oparciu o próbę X1 , ..., Xn przedział ufności dla nieznanej wartości µ populacji wynosi gdzie u = F −1 S1 S1 X̄ − u √ < µ < X̄ + u √ , n n 1 − α2 . Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Przedziały ufności dla nieznanej wariancji i odchylenia standardowego * Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ są nieznane. Dla próby o liczebności n ¬ 50 statystyka χ2 = nS 2 σ2 ma rozkład χ2 (chi-kwadrat) o n − 1 stopniach swobody. Z tablic rozkładu χ2 na poziomie ufności 1 − α odczytujemy kwantyle rzędu 1 − α2 oraz α2 i oznaczamy je jako χ2 α2 , n − 1 , χ2 1 − α2 , n − 1 . Dla poziomu istotności α w oparciu o próbę X1 , ..., Xn przedział ufności dla nieznanej wariancji w populacji wyznaczamy z równości nS 2 α α , n − 1 < 2 < χ2 1 − , n − 1 = 1 − α. P χ2 2 σ 2 Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ Ostatecznie, przedział ufności dla wariancji σ 2 wynosi χ2 nS 2 nS 2 < σ2 < , α α 1 − 2,n − 1 χ2 2 , n − 1 natomiast dla odchylenia standardowego σ √ √ S n S n q <σ< q . χ2 1 − α2 , n − 1 χ2 α2 , n − 1 Edward Kozłowski Estymacja przedziałowa Rozkłady zmiennych losowych Estymacja przedziałowa Przedziały ufności dla nieznanej wartości przeciętnej µ Przedziały ufności dla nieznanej wariancji σ 2 i odchylenia standardowego σ * Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ są nieznane. Dla próby o liczbności n 50 statystyka r p nS 2 S√ 2χ2 = 2 2 = 2n σ σ √ dąży do rozkładu normalnego N 2n − 3, 1 . Zatem dla poziomu istotności α w oparciu o próbę X1 , ..., Xn przedział ufności dla nieznanej wariancji w populacji wyznaczamy z równości √ S√ 2n − 2n − 3 < u = 1 − α, P −u < σ gdzie u jest kwantylem rzędu 1 − α2 dla rozkładu normalnego N (0, 1). Ostatecznie przedział ufności dla odchylenia standardowego σ wynosi √ √ S 2n S 2n √ <σ< √ . 2n − 3 + u 2n − 3 − u Edward Kozłowski Estymacja przedziałowa