n - E-SGH

Transkrypt

n - E-SGH
ESTYMACJA
Estymacją nazywamy szacowanie wartości parametrów, ewentualnie postaci rozkładu
w populacji generalnej, na podstawie obserwacji uzyskanych w próbie losowej.
Typy estymacji:
− estymacja parametryczna
− estymacja nieparametryczna
− estymacja punktowa
− estymacja przedziałowa
ESTYMACJA: rozkład zmiennej losowej X w populacji generalnej jest opisany za
pomocą dystrybuanty F ( x;θ ) , gdzie θ jest parametrem rozkładu, od którego zależy ta
dystrybuanta. Nieznaną wartość parametru θ szacujemy na podstawie n-elementowej
próby losowej ( X 1 , X 2 ,..., X n ) .
Estymatorem Tn parametru θ rozkładu populacji generalnej nazywamy statystykę z
próby
Tn = t ( X 1 , X 2 ,... X n ) , która służy do oszacowania wartości tego
parametru.
Oceną parametru θ nazywamy konkretną wartość liczbową tn = t ( x1 , x2 ,..., xn ) jaką
przyjmuje estymator Tn parametru dla realizacji próby ( x1 , x2 ,...xn ) .
Błędem szacunku (estymacji) parametru θ nazywamy
estymatorem a wartością parametru, oznaczoną przez:
różnicę
pomiędzy
d = Tn − θ
a za miarę tego błędu przyjmujemy wyrażenie:
∆ = E (Tn − θ )2
Średnim (standardowym) błędem szacunku parametru θ jest wyrażenie D(Tn )
Względnym błędem szacunku parametru θ jest wyrażenie
D(Tn )
θ
WŁASNOŚCI ESTYMATORÓW
1. NIEOBCIĄŻONOŚĆ
Estymator T n parametru θ jest nieobciążony, jeśli spełniona jest relacja: E (Tn ) = θ
W przeciwnym przypadku estymator Tn jest obciążony.
E (Tn ) − θ = b(Tn )
Obciążenie estymatora:
Estymator T n parametru θ jest asymptotycznie nieobciążony, jeśli:
2. ZGODNOŚĆ
Estymator Tn parametru θ jest zgodny, jeśli spełnia relację
lim b(Tn ) = 0
n →∞
P{Tn − θ < ε } = 1 dla
lim
n→∞
dowolnego ε>0
3. EFEKTYWNOŚĆ
Jeśli dany jest zbiór wszystkich nieobciążonych estymatorów
Tn*, który ma w tym zbiorze najmniejszą wariancję, tzn.
parametru θ, to estymator
( )
Tn1 , Tn2 ,..., TnN
( )
D 2 Tn* ≤ D 2 Tni , i=1,...,r, nazywamy najefektywniejszym estymatorem parametru θ
i
Efektywność estymatora Tn parametru θ:
( )
e Tni
( )
( )
D 2 Tn*
= 2 i
D Tn
Estymator Tn parametru θ jest asymptotycznie najefektywniejszy, jeśli: lim e(Tn ) = 1
n →∞
Twierdzenia:
1. Jeśli estymator Tn parametru θ jest zgodny, to jest asymptotycznie nieobciążony.
Twierdzenie odwrotne nie jest prawdziwe.
2. Jeśli estymator Tn parametru θ jest nieobciążony (lub asymptotycznie nieobciążony)
oraz jeśli jego wariancja spełnia relację lim D 2 (Tn ) = 0 , to Tn jest estymatorem
n→∞
zgodnym.
ESTYMACJA PUNKTOWA wartość parametru θjest równa wartości parametru w
próbie: θ =θˆ
ESTYMACJA PRZEDZIAŁOWA: wartość szacowanego parametru θ mieści się w
przedziale ufności θ ;θ . Współczynnikiem ufności 1-α nazywamy z góry ustalone
prawdopodobieństwo, z jakim ten przedział pokrywa nieznaną wartość parametru θ.
(
)
PRZEDZIAŁY UFNOŚCI
DLA ŚREDNIEJ
1. z populacji o rozkładzie normalnym
A) Jeśli X ~ N ( m, σ ) :
σ
σ 

P  x − uα
≤ m ≤ x + uα
 = 1−α
n
n

B) Jeśli X ~ N ( m, σ ) , σ – nieznane
a) n ≤ 30 :
S
S 

≤ m ≤ x + tα ,n −1
P  x − tα ,n −1
 = 1−α
n
n

b) n > 30:
S
S 

≤ m ≤ x + uα
P  x − uα
 = 1− α
n
n

2. z populacji o nieznanym rozkładzie z parametrami m i σ : (na mocy twierdzenia
Linderberga-Levy’ego)
dla n → ∞ :
σ
σ 

≤ m ≤ x + uα
P  x − uα
 = 1− α
n
n

DLA WARIANCJI


2
2
−
(
n
1)
S
 (n − 1) S

<σ2 < 2
X ~ N ( m , σ ) , σ – nieznane: P  2
 = 1−α
χ
χ
α
 α ,n −1
1− , n −1 
2
 2

DLA FRAKCJI
2
X ~ rozkład dwumianowy z parametrami n i p, E(X) = np, D (X)=np(1-p)

P  pˆ − uα

pˆ (1 − pˆ )
≤ p ≤ pˆ + uα
n
pˆ (1 − pˆ ) 
 = 1− α ,
n

gdzie p̂ - frakcja w próbie, p – frakcja w populacji
INNE POJĘCIA ZWIĄZANE Z ESTYMACJĄ PRZEDZIAŁOWĄ:
Szerokość przedziału ufności: d = θ − θ
Maksymalny błąd szacunku: d = (θ − θ ) / 2
Maksymalny błąd szacunku zależy od:
− Wielkości próby n
− Wielkości odchylenia standardowego
− Przyjętego współczynnika ufności
Minimalna liczebność próby
Maksymalny błąd szacunku jest tym mniejszy im większa próba. Minimalna liczebność
próby to taka liczebność, przy której maksymalny błąd szacunku nie przekracza
ustalonej wartości d
W przypadku średniej:
W przypadku frakcji:
uα
uα
uα2σ 2
≤d ⇒ n≥ 2
d
n
σ
uα2 ⋅ p ⋅ (1 − p )
p ⋅ (1 − p )
≤d ⇒ n≥
n
d2
UWAGA: Jeśli nie mamy żadnych informacji o rzędzie wielkości parametru p, to
podstawiamy p=0.5. Przy takim p iloczyn p(1-p)=0.25 daje największą z możliwych
wartości. Zatem jeśli prawdziwa wartość p≠0.5 to wyznaczona minimalna liczebność
próby zapewni dokładność estymacji większą od założonej.