CJ

Transkrypt

CJ
O NIEPARAMETRYCZNYCH
ESTYMATORACH GĘSTOŚCI
Co może być próbkowym odpowiednikiem gęstości prawdopodobieństwa zmiennej losowej X o rozkładzie absolutnie ciągłym? Bezpośredniego odpowiednika nie ma,
ponieważ, jak wiemy, rozkład empiryczny jest rozkładem dyskretnym. Tym nie mniej, możemy zaproponować estymatory dla gęstości rozkładu.
1. Rysując na podstawie obserwacji wykres, zwany histogramem, możemy zaproponować prosty estymator
gęstości rozkładu, którym jest funkcja kawałkami stała.
Niech X1, . . . , Xn będzie próbką z rozkładu absolutnie ciągłego o dystrybuancie F i gęstości f. Załóżmy,
że rozkład ten jest skupiony w przedziale (a, b). Podzielmy ten przedział na k odcinków o końcach w punktach a = c0 < c1 < . . . < ck = b. Połóżmy
n
∑
1
fbn(x) =
1(cj−1,cj ](Xi) dla x ∈ (cj−1, cj ]
n(cj − cj−1) i=1
lub, jeśli odcinki maja jednakową długość h,
n
∑
1
fbn(x) =
1Ij (Xi) dla x ∈ Ij ,
nh i=1
gdzie Ij = (a + (j − 1)h, a + jh], j = 1, . . . , k.
1
Ostatni wzór można też zapisać następująco:
#{i : Xi ∈ Ij }
fbn(x) =
dla x ∈ Ij .
nh
∫ cj
b
Jak nietrudno sprawdzić, Fn(cj ) = a fbn(x)dx ∀j.
Podobnie jak dla dystrybuanty empirycznej, przy pewnych warunkach mamy zbieżność fbn do gęstości f. Na
przykład, jeśli n → ∞ oraz h = hn → 0, nhn → ∞,
to dla każdego punktu ciągłości x funkcji f zachodzi:
fbn(x) → f (x) według prawdopodobieństwa.
2. Częściej są uzywane tzw. jądrowe estymatory gęstości f. Niech K : R 7→ R+ będzie nieujemną funkcją
parzystą, maksimum której jest w punkcie 0 i która
całkuje się do jedności (nazwijmy ją jądrem). Estymatorem jądrowym gęstości f nazywamy funkcję postaci
(
)
n
∑
x − Xi
1
b
K
, x ∈ R.
fn(x) =
nh i=1
h
Jeśli jako jądro K wziąć funkcję K(x) = 1[−1/2,1/2)(x),
x ∈ R (jądro prostokątne), to widać pewną analogię z
poprzednim estymatorem, ponieważ
#{i : Xi ∈ (x − h/2, x + h/2]}
b
fn(x) =
, x ∈ R.
nh
2
Estymator jądrowy jest funkcją ciągłą, jeśli jądro jest
funkcją ciągłą. Oprócz tego, estymator jądrowy ma
podobną własność zbieżności do f jak wyżej (przy tych
samych warunkach).
Estymatory jądrowe różnią się postacią jądra K oraz
wartością h (szerokość pasma).
3