CJ
Transkrypt
CJ
O NIEPARAMETRYCZNYCH ESTYMATORACH GĘSTOŚCI Co może być próbkowym odpowiednikiem gęstości prawdopodobieństwa zmiennej losowej X o rozkładzie absolutnie ciągłym? Bezpośredniego odpowiednika nie ma, ponieważ, jak wiemy, rozkład empiryczny jest rozkładem dyskretnym. Tym nie mniej, możemy zaproponować estymatory dla gęstości rozkładu. 1. Rysując na podstawie obserwacji wykres, zwany histogramem, możemy zaproponować prosty estymator gęstości rozkładu, którym jest funkcja kawałkami stała. Niech X1, . . . , Xn będzie próbką z rozkładu absolutnie ciągłego o dystrybuancie F i gęstości f. Załóżmy, że rozkład ten jest skupiony w przedziale (a, b). Podzielmy ten przedział na k odcinków o końcach w punktach a = c0 < c1 < . . . < ck = b. Połóżmy n ∑ 1 fbn(x) = 1(cj−1,cj ](Xi) dla x ∈ (cj−1, cj ] n(cj − cj−1) i=1 lub, jeśli odcinki maja jednakową długość h, n ∑ 1 fbn(x) = 1Ij (Xi) dla x ∈ Ij , nh i=1 gdzie Ij = (a + (j − 1)h, a + jh], j = 1, . . . , k. 1 Ostatni wzór można też zapisać następująco: #{i : Xi ∈ Ij } fbn(x) = dla x ∈ Ij . nh ∫ cj b Jak nietrudno sprawdzić, Fn(cj ) = a fbn(x)dx ∀j. Podobnie jak dla dystrybuanty empirycznej, przy pewnych warunkach mamy zbieżność fbn do gęstości f. Na przykład, jeśli n → ∞ oraz h = hn → 0, nhn → ∞, to dla każdego punktu ciągłości x funkcji f zachodzi: fbn(x) → f (x) według prawdopodobieństwa. 2. Częściej są uzywane tzw. jądrowe estymatory gęstości f. Niech K : R 7→ R+ będzie nieujemną funkcją parzystą, maksimum której jest w punkcie 0 i która całkuje się do jedności (nazwijmy ją jądrem). Estymatorem jądrowym gęstości f nazywamy funkcję postaci ( ) n ∑ x − Xi 1 b K , x ∈ R. fn(x) = nh i=1 h Jeśli jako jądro K wziąć funkcję K(x) = 1[−1/2,1/2)(x), x ∈ R (jądro prostokątne), to widać pewną analogię z poprzednim estymatorem, ponieważ #{i : Xi ∈ (x − h/2, x + h/2]} b fn(x) = , x ∈ R. nh 2 Estymator jądrowy jest funkcją ciągłą, jeśli jądro jest funkcją ciągłą. Oprócz tego, estymator jądrowy ma podobną własność zbieżności do f jak wyżej (przy tych samych warunkach). Estymatory jądrowe różnią się postacią jądra K oraz wartością h (szerokość pasma). 3