Prawdopodobienstwo i statystyka

Transkrypt

Prawdopodobienstwo i statystyka
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Prawdopodobieństwo i statystyka
Wykład VIII:
Przestrzenie statystyczne. Estymatory
1 grudnia 2014
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Wprowadzenie
Przykład: pomiar z błędem
Współczynnik korelacji r (X , Z ) = 0, 986
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Wprowadzenie
Przykład: pomiar z błędem
Współczynnik korelacji r (X , Y ) = −0, 013
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Wprowadzenie
Przykład: pomiar z błędem
Jak wyliczaliśmy współczynnik korelacji w obu
przykładach?
W obu przykładach dane maja postać chmury punktów
(wektorów dwuwymiarowych).
Na podstawie danych, za pomocą odpowiedniego wzoru,
wyliczamy liczbę, która stanowi pewną charakterystykę zbioru
danych.
Nasuwają się następujące naturalne pytania:
Skąd wiemy, że to, co policzyliśmy, odpowiada naszym
oczekiwaniom?
Jaka jest jakość uzyskanego wyniku?
A raczej: Jak mierzyć jakość naszego wyniku?
Jak znajdować „odpowiednie wzory”?
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Wprowadzenie
Przykład: pomiar z błędem
Przykład
n-krotny pomiar jednym przyrządem
Xk = m + εk , gdzie m - „rzeczywista wartość pomiaru”, a εk błąd k-tego pomiaru. Co przyjąć za wynik pomiaru?
X̄n =
X1 + X2 + . . . + Xn
.
n
Dlaczego?
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Wprowadzenie
Przykład: pomiar z błędem
Pomiar z błędem
X̄n = m + (ε1 + ε2 + . . . + εn )/n, przy czym prawo wielkich
liczb stwierdza, że
ε1 + ε2 + . . . + εn
→ E ε1 ,
n
gdzie E ε1 = 0 dla przyrządu poprawnie skalibrowanego („brak
błędu systematycznego”).
Powyżej korzystamy z modelu „błędu pomiaru” w postaci
ciągu niezależnych zmiennych losowych o jednakowym
rozkładzie, z wartością oczekiwaną zero.
Inne spojrzenie:
E X̄n = m,
jeśli brak jest błędu systematycznego (obciążenia).
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Przestrzeń statystyczna i statystyka
Próba prosta z populacji
Definicja estymatora
Przestrzeń statystyczna i statystyka
Definicja przestrzeni statystycznej
Przestrzenią statystyczną (lub „modelem statystycznym”)
nazywamy trójkę (X , B, {Pθ }θ∈Θ ), gdzie
dla każdego θ ∈ Θ trójka (X , B, Pθ ) jest przestrzenią
probabilistyczną.
Zbiór X nazywamy „przestrzenią próbek” lub zbiorem „prób
losowych”.
Definicja statystyki
Statystyką nazywamy funkcję Y : (X , B) → R1 (lub Rd ), która
dla każdego θ ∈ Θ jest zmienną losową na (X , B, Pθ ).
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Przestrzeń statystyczna i statystyka
Próba prosta z populacji
Definicja estymatora
Próba prosta z populacji
Przykład: losowanie ze zwracaniem
Jesteśmy zainteresowani rozkładem danej cechy U w populacji Ω.
Losujemy (ze zwracaniem) N „osobników” i badamy wartości
cechy. Jak określić odpowiednią przestrzeń statystyczną
(X , B, {Pθ }θ∈Θ )?
Niech X0 = {U(ω) : ω ∈ Ω} ⊂ Rd . Kładziemy:
X = (X0 )N ;
B =? (jak wynika z kontekstu);
Θ = P(X0 ) (zbiór wszystkich rozkładów prawdopodobieństwa
na X0 );
Pθ = θ| × θ ×{z. . . × θ} .
N razy
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Przestrzeń statystyczna i statystyka
Próba prosta z populacji
Definicja estymatora
Próba prosta z populacji
Definicja modelu dla próby prostej
Jeżeli:
X = (X0 )N dla pewnego X0 ⊂ Rd ,
B =? (jak wynika z kontekstu),
Θ ⊂ P(X0 ) (podzbiór(!) zbioru wszystkich rozkładów
prawdopodobieństwa na X0 ),
Pθ = θ| × θ ×{z. . . × θ},
N razy
to przestrzeń statystyczną (X , B, {Pθ }θ∈Θ ) nazywamy modelem
dla próby prostej (długości N), a wektor losowy współrzędnych
(X1 , X2 , . . . , XN )T : (X , B, Pθ ) → X nazywamy próbą prostą z
rozkładu (lub populacji) θ.
Uwaga: X1 , X2 , . . . , XN są niezależne i mają jednakowy rozkład θ!
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Przestrzeń statystyczna i statystyka
Próba prosta z populacji
Definicja estymatora
Estymatory
Definicja estymatora parametru
Niech (X , B, {Pθ }θ∈Θ ) będzie przestrzenią statystyczną.
Parametrem nazywamy odwzorowanie g : {Pθ }θ∈Θ → R1 .
Estymatorem parametru g nazwiemy odwzorowanie ĝ : X → R1 .
(Można mówić także o parametrach i estymatorach wektorowych).
Oczywiście to tylko ogólny schemat. Pojęcie „estymator” staje sie
interesujące dopiero po uzupełnieniu o dodatkowe własności.
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Estymatory nieobciążone
Przykłady estymatorów nieobciążonych
Estymatory nieobciążone
Definicja estymatora nieobciążonego
Niech (X , B, {Pθ }θ∈Θ ) będzie modelem dla próby prostej długości
N. Niech g : {Pθ }θ∈Θ → R1 będzie parametrem. Funkcja
ĝ : X → R1 jest nieobciążonym estymatorem parametru g jeśli
dla każdego θ ∈ Θ istnieje Eθ ĝ (X1 , X2 , . . . , XN ) i
Eθ ĝ (X1 , X2 , . . . , XN ) = g (Pθ ).
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Estymatory nieobciążone
Przykłady estymatorów nieobciążonych
Przykłady estymatorów nieobciążonych
Estymator wartości oczekiwanej
Θ = {θ ∈ P(R1 ) : E |Y | < +∞, jeśli Y ∼ θ},
g (θ) = EY , jeśli Y ∼ θ.
ĝ (X1 , X2 , . . . , XN ) = X̄N =
Prawdopodobieństwo i statystyka
X1 + X2 + . . . + XN
.
N
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Estymatory nieobciążone
Przykłady estymatorów nieobciążonych
Przykłady estymatorów nieobciążonych - cd.
Nieobciążony estymator wariancji
Θ = {θ ∈ P(R1 ) : EY 2 < +∞, jeśli Y ∼ θ},
g (θ) = Var (Y ) = EY 2 − (EY )2 , jeśli Y ∼ θ.
ĝ (X1 , X2 , . . . , XN ) = S̄N2 =
(X1 − X̄N )2 + (X2 − X̄N )2 + . . . + (XN − X̄N )2
=
.
N −1
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Estymatory nieobciążone
Przykłady estymatorów nieobciążonych
Przykłady estymatorów nieobciążonych - cd.
Nieobciążony estymator wariancji przy znanej wartości oczekiwanej
Θ = {θ ∈ P(R1 ) : EY 2 < +∞, EY = µ, jeśli Y ∼ θ},
g (θ) = Var (Y ) = EY 2 − µ2 , jeśli Y ∼ θ.
ĝ (X1 , X2 , . . . , XN ) =
(X1 − µ)2 + (X2 − µ)2 + . . . + (XN − µ)2
.
N
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Estymatory nieobciążone
Przykłady estymatorów nieobciążonych
Przykłady estymatorów nieobciążonych - cd.
Estymator prawdopodobieństwa sukcesu w schemacie Bernoullego
Θ = {rozkład dwupunktowy, P(Y = 1) = θ = 1 − P(Y = 0)},
g (θ) = θ.
ĝ (X1 , X2 , . . . , XN ) =
Prawdopodobieństwo i statystyka
X1 + X2 + . . . + XN
.
N
Wykład VIII: Przestrzenie statystyczne. Estymatory
Wprowadzenie
Formalizm teorii estymacji
Estymatory nieobciążone
Estymatory nieobciążone
Przykłady estymatorów nieobciążonych
Przykłady estymatorów nieobciążonych - cd.
Estymatory dla P(X = 0) z rozkładu Poissona
Θ = {rozkład Poissona z parametrem θ ∈ R+ },
g (θ) = e −θ (= Pθ (Y = 0)).
ĝ1 (X1 , X2 , . . . , XN ) =
1I {X1 =0} + 1I {X2 =0} + . . . + 1I {XN =0}
.
N
1
ĝ2 (X1 , X2 , . . . , XN ) = 1 −
N
Prawdopodobieństwo i statystyka
X1 +X2 +...+XN
.
Wykład VIII: Przestrzenie statystyczne. Estymatory