n - E-SGH
Transkrypt
n - E-SGH
ESTYMACJA Estymacją nazywamy szacowanie wartości parametrów, ewentualnie postaci rozkładu w populacji generalnej, na podstawie obserwacji uzyskanych w próbie losowej. Typy estymacji: − estymacja parametryczna − estymacja nieparametryczna − estymacja punktowa − estymacja przedziałowa ESTYMACJA: rozkład zmiennej losowej X w populacji generalnej jest opisany za pomocą dystrybuanty F ( x;θ ) , gdzie θ jest parametrem rozkładu, od którego zależy ta dystrybuanta. Nieznaną wartość parametru θ szacujemy na podstawie n-elementowej próby losowej ( X 1 , X 2 ,..., X n ) . Estymatorem Tn parametru θ rozkładu populacji generalnej nazywamy statystykę z próby Tn = t ( X 1 , X 2 ,... X n ) , która służy do oszacowania wartości tego parametru. Oceną parametru θ nazywamy konkretną wartość liczbową tn = t ( x1 , x2 ,..., xn ) jaką przyjmuje estymator Tn parametru dla realizacji próby ( x1 , x2 ,...xn ) . Błędem szacunku (estymacji) parametru θ nazywamy estymatorem a wartością parametru, oznaczoną przez: różnicę pomiędzy d = Tn − θ a za miarę tego błędu przyjmujemy wyrażenie: ∆ = E (Tn − θ )2 Średnim (standardowym) błędem szacunku parametru θ jest wyrażenie D(Tn ) Względnym błędem szacunku parametru θ jest wyrażenie D(Tn ) θ WŁASNOŚCI ESTYMATORÓW 1. NIEOBCIĄŻONOŚĆ Estymator T n parametru θ jest nieobciążony, jeśli spełniona jest relacja: E (Tn ) = θ W przeciwnym przypadku estymator Tn jest obciążony. E (Tn ) − θ = b(Tn ) Obciążenie estymatora: Estymator T n parametru θ jest asymptotycznie nieobciążony, jeśli: 2. ZGODNOŚĆ Estymator Tn parametru θ jest zgodny, jeśli spełnia relację lim b(Tn ) = 0 n →∞ P{Tn − θ < ε } = 1 dla lim n→∞ dowolnego ε>0 3. EFEKTYWNOŚĆ Jeśli dany jest zbiór wszystkich nieobciążonych estymatorów Tn*, który ma w tym zbiorze najmniejszą wariancję, tzn. parametru θ, to estymator ( ) Tn1 , Tn2 ,..., TnN ( ) D 2 Tn* ≤ D 2 Tni , i=1,...,r, nazywamy najefektywniejszym estymatorem parametru θ i Efektywność estymatora Tn parametru θ: ( ) e Tni ( ) ( ) D 2 Tn* = 2 i D Tn Estymator Tn parametru θ jest asymptotycznie najefektywniejszy, jeśli: lim e(Tn ) = 1 n →∞ Twierdzenia: 1. Jeśli estymator Tn parametru θ jest zgodny, to jest asymptotycznie nieobciążony. Twierdzenie odwrotne nie jest prawdziwe. 2. Jeśli estymator Tn parametru θ jest nieobciążony (lub asymptotycznie nieobciążony) oraz jeśli jego wariancja spełnia relację lim D 2 (Tn ) = 0 , to Tn jest estymatorem n→∞ zgodnym. ESTYMACJA PUNKTOWA wartość parametru θjest równa wartości parametru w próbie: θ =θˆ ESTYMACJA PRZEDZIAŁOWA: wartość szacowanego parametru θ mieści się w przedziale ufności θ ;θ . Współczynnikiem ufności 1-α nazywamy z góry ustalone prawdopodobieństwo, z jakim ten przedział pokrywa nieznaną wartość parametru θ. ( ) PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ 1. z populacji o rozkładzie normalnym A) Jeśli X ~ N ( m, σ ) : σ σ P x − uα ≤ m ≤ x + uα = 1−α n n B) Jeśli X ~ N ( m, σ ) , σ – nieznane a) n ≤ 30 : S S ≤ m ≤ x + tα ,n −1 P x − tα ,n −1 = 1−α n n b) n > 30: S S ≤ m ≤ x + uα P x − uα = 1− α n n 2. z populacji o nieznanym rozkładzie z parametrami m i σ : (na mocy twierdzenia Linderberga-Levy’ego) dla n → ∞ : σ σ ≤ m ≤ x + uα P x − uα = 1− α n n DLA WARIANCJI 2 2 − ( n 1) S (n − 1) S <σ2 < 2 X ~ N ( m , σ ) , σ – nieznane: P 2 = 1−α χ χ α α ,n −1 1− , n −1 2 2 DLA FRAKCJI 2 X ~ rozkład dwumianowy z parametrami n i p, E(X) = np, D (X)=np(1-p) P pˆ − uα pˆ (1 − pˆ ) ≤ p ≤ pˆ + uα n pˆ (1 − pˆ ) = 1− α , n gdzie p̂ - frakcja w próbie, p – frakcja w populacji INNE POJĘCIA ZWIĄZANE Z ESTYMACJĄ PRZEDZIAŁOWĄ: Szerokość przedziału ufności: d = θ − θ Maksymalny błąd szacunku: d = (θ − θ ) / 2 Maksymalny błąd szacunku zależy od: − Wielkości próby n − Wielkości odchylenia standardowego − Przyjętego współczynnika ufności Minimalna liczebność próby Maksymalny błąd szacunku jest tym mniejszy im większa próba. Minimalna liczebność próby to taka liczebność, przy której maksymalny błąd szacunku nie przekracza ustalonej wartości d W przypadku średniej: W przypadku frakcji: uα uα uα2σ 2 ≤d ⇒ n≥ 2 d n σ uα2 ⋅ p ⋅ (1 − p ) p ⋅ (1 − p ) ≤d ⇒ n≥ n d2 UWAGA: Jeśli nie mamy żadnych informacji o rzędzie wielkości parametru p, to podstawiamy p=0.5. Przy takim p iloczyn p(1-p)=0.25 daje największą z możliwych wartości. Zatem jeśli prawdziwa wartość p≠0.5 to wyznaczona minimalna liczebność próby zapewni dokładność estymacji większą od założonej.