Estymatory
Transkrypt
Estymatory
Estymatory Bartłomiej Wróbel, [email protected] WFAIS, TUZ 4 listopad 2009 1 Estymatory 2 Metoda jack-knife Estymatory Estymator to statystyka używana do szacowania wartości parametru rozkładu. Estymator nieobciążony: wartość oczekiwana rozkładu estymatora jest równa wartości szacowanego parametru: E (X̂ ) = X Estymator obciążony: istnieje różnica wartości oczekiwanej rozkładu estymatora i wartości szacowanego parametru: E (X̂ ) − X = b(X̂ ) b(X̂ ) – obciążenie estymatora Estymator średniej Średnia arytmetyczna jest wyrażona: x= n 1X xi n i=1 Jak wyznaczyć estymator średniej arytmetycznej? Estymator średniej Estymatorem wartości średniej x jest funkcja: n 1X xi n i=1 x̂ = E (x) = E = ! 1 = E n n X ! xi = i=1 1 1 [E (x1 ) + E (x2 ) + . . . + E (xn )] = (x1 + x2 + . . . + xn ) = n n = Estymator jest nieobciążony. n 1X xi = x n i=1 Estymator wariancji Wariancja to średnia arytmetyczna kwadratów odchyleń wartości cechy od wartości oczekiwanej. Var (x) = E [(x − x)2 ] Można to też zapisać: Var (x) = E (x 2 ) − (E [x])2 Estymator wariancji Dla nas interesujące: σ2 = n 1X (xi − x)2 , n i=1 Estymator: S2 = jest obciążony. n→∞ n 1X (xi − x)2 n i=1 Estymator wariancji Nieobciążony estymator wariancji: S2 = n 1 X (xi − x)2 n − 1 i=1 natomiast poniższy estymator S2 = n 1X (xi − x)2 n i=1 jest nieobciążony asymptotycznie. Skośność i kurtoza Skośność: R S= Kurtoza: R κ= (x − E (x))3 p(x)dx σ3 (x − E (x))4 p(x)dx − 3 σ4 Metoda jack-knife mając próbkę {x1 , x2 , . . . , xn } bierzemy pierwszy punkt ze zbioru i dla pozostałych liczymy skośność: (1) SN 1 = N −1 (xi − x)3 P (1) (σN )3 ; 1 qX (xi − x)2 N −1 zwracamy pierwszy element, bierzemy kolejny i wyznaczamy skośność jak wyżej. (1) σN = Metoda jack-knife Po przetworzeniu wszystkich punktów mamy zbiór (1) (2) (N) {SN , SN , . . . , SN } Wyznaczamy średnią: S= 1 X (i) S N i N i błąd średniej: v u u N − 1 X (i) err = t (SN − S)2 N i Analogicznie postępujemy dla kurtozy i innych estymatorów. Metoda jack-knife Problem: duża próbka, np. 106 . Metoda jest czasochłonna. Jak można przyspieszyć? Dzieląc na bloki. W praktyce wystarczy 10 − 20 bloków. TABLICA: jack-knife z blokami, dystrybuanta, normowanie histogramu