Prawdopodobienstwo i statystyka
Transkrypt
Prawdopodobienstwo i statystyka
Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory 1 grudnia 2014 Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji r (X , Z ) = 0, 986 Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji r (X , Y ) = −0, 013 Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Wprowadzenie Przykład: pomiar z błędem Jak wyliczaliśmy współczynnik korelacji w obu przykładach? W obu przykładach dane maja postać chmury punktów (wektorów dwuwymiarowych). Na podstawie danych, za pomocą odpowiedniego wzoru, wyliczamy liczbę, która stanowi pewną charakterystykę zbioru danych. Nasuwają się następujące naturalne pytania: Skąd wiemy, że to, co policzyliśmy, odpowiada naszym oczekiwaniom? Jaka jest jakość uzyskanego wyniku? A raczej: Jak mierzyć jakość naszego wyniku? Jak znajdować „odpowiednie wzory”? Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Wprowadzenie Przykład: pomiar z błędem Przykład n-krotny pomiar jednym przyrządem Xk = m + εk , gdzie m - „rzeczywista wartość pomiaru”, a εk błąd k-tego pomiaru. Co przyjąć za wynik pomiaru? X̄n = X1 + X2 + . . . + Xn . n Dlaczego? Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Wprowadzenie Przykład: pomiar z błędem Pomiar z błędem X̄n = m + (ε1 + ε2 + . . . + εn )/n, przy czym prawo wielkich liczb stwierdza, że ε1 + ε2 + . . . + εn → E ε1 , n gdzie E ε1 = 0 dla przyrządu poprawnie skalibrowanego („brak błędu systematycznego”). Powyżej korzystamy z modelu „błędu pomiaru” w postaci ciągu niezależnych zmiennych losowych o jednakowym rozkładzie, z wartością oczekiwaną zero. Inne spojrzenie: E X̄n = m, jeśli brak jest błędu systematycznego (obciążenia). Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Przestrzeń statystyczna i statystyka Definicja przestrzeni statystycznej Przestrzenią statystyczną (lub „modelem statystycznym”) nazywamy trójkę (X , B, {Pθ }θ∈Θ ), gdzie dla każdego θ ∈ Θ trójka (X , B, Pθ ) jest przestrzenią probabilistyczną. Zbiór X nazywamy „przestrzenią próbek” lub zbiorem „prób losowych”. Definicja statystyki Statystyką nazywamy funkcję Y : (X , B) → R1 (lub Rd ), która dla każdego θ ∈ Θ jest zmienną losową na (X , B, Pθ ). Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Próba prosta z populacji Przykład: losowanie ze zwracaniem Jesteśmy zainteresowani rozkładem danej cechy U w populacji Ω. Losujemy (ze zwracaniem) N „osobników” i badamy wartości cechy. Jak określić odpowiednią przestrzeń statystyczną (X , B, {Pθ }θ∈Θ )? Niech X0 = {U(ω) : ω ∈ Ω} ⊂ Rd . Kładziemy: X = (X0 )N ; B =? (jak wynika z kontekstu); Θ = P(X0 ) (zbiór wszystkich rozkładów prawdopodobieństwa na X0 ); Pθ = θ| × θ ×{z. . . × θ} . N razy Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Próba prosta z populacji Definicja modelu dla próby prostej Jeżeli: X = (X0 )N dla pewnego X0 ⊂ Rd , B =? (jak wynika z kontekstu), Θ ⊂ P(X0 ) (podzbiór(!) zbioru wszystkich rozkładów prawdopodobieństwa na X0 ), Pθ = θ| × θ ×{z. . . × θ}, N razy to przestrzeń statystyczną (X , B, {Pθ }θ∈Θ ) nazywamy modelem dla próby prostej (długości N), a wektor losowy współrzędnych (X1 , X2 , . . . , XN )T : (X , B, Pθ ) → X nazywamy próbą prostą z rozkładu (lub populacji) θ. Uwaga: X1 , X2 , . . . , XN są niezależne i mają jednakowy rozkład θ! Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Estymatory Definicja estymatora parametru Niech (X , B, {Pθ }θ∈Θ ) będzie przestrzenią statystyczną. Parametrem nazywamy odwzorowanie g : {Pθ }θ∈Θ → R1 . Estymatorem parametru g nazwiemy odwzorowanie ĝ : X → R1 . (Można mówić także o parametrach i estymatorach wektorowych). Oczywiście to tylko ogólny schemat. Pojęcie „estymator” staje sie interesujące dopiero po uzupełnieniu o dodatkowe własności. Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Estymatory nieobciążone Przykłady estymatorów nieobciążonych Estymatory nieobciążone Definicja estymatora nieobciążonego Niech (X , B, {Pθ }θ∈Θ ) będzie modelem dla próby prostej długości N. Niech g : {Pθ }θ∈Θ → R1 będzie parametrem. Funkcja ĝ : X → R1 jest nieobciążonym estymatorem parametru g jeśli dla każdego θ ∈ Θ istnieje Eθ ĝ (X1 , X2 , . . . , XN ) i Eθ ĝ (X1 , X2 , . . . , XN ) = g (Pθ ). Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Estymatory nieobciążone Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych Estymator wartości oczekiwanej Θ = {θ ∈ P(R1 ) : E |Y | < +∞, jeśli Y ∼ θ}, g (θ) = EY , jeśli Y ∼ θ. ĝ (X1 , X2 , . . . , XN ) = X̄N = Prawdopodobieństwo i statystyka X1 + X2 + . . . + XN . N Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Estymatory nieobciążone Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Nieobciążony estymator wariancji Θ = {θ ∈ P(R1 ) : EY 2 < +∞, jeśli Y ∼ θ}, g (θ) = Var (Y ) = EY 2 − (EY )2 , jeśli Y ∼ θ. ĝ (X1 , X2 , . . . , XN ) = S̄N2 = (X1 − X̄N )2 + (X2 − X̄N )2 + . . . + (XN − X̄N )2 = . N −1 Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Estymatory nieobciążone Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Nieobciążony estymator wariancji przy znanej wartości oczekiwanej Θ = {θ ∈ P(R1 ) : EY 2 < +∞, EY = µ, jeśli Y ∼ θ}, g (θ) = Var (Y ) = EY 2 − µ2 , jeśli Y ∼ θ. ĝ (X1 , X2 , . . . , XN ) = (X1 − µ)2 + (X2 − µ)2 + . . . + (XN − µ)2 . N Prawdopodobieństwo i statystyka Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Estymatory nieobciążone Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Estymator prawdopodobieństwa sukcesu w schemacie Bernoullego Θ = {rozkład dwupunktowy, P(Y = 1) = θ = 1 − P(Y = 0)}, g (θ) = θ. ĝ (X1 , X2 , . . . , XN ) = Prawdopodobieństwo i statystyka X1 + X2 + . . . + XN . N Wykład VIII: Przestrzenie statystyczne. Estymatory Wprowadzenie Formalizm teorii estymacji Estymatory nieobciążone Estymatory nieobciążone Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Estymatory dla P(X = 0) z rozkładu Poissona Θ = {rozkład Poissona z parametrem θ ∈ R+ }, g (θ) = e −θ (= Pθ (Y = 0)). ĝ1 (X1 , X2 , . . . , XN ) = 1I {X1 =0} + 1I {X2 =0} + . . . + 1I {XN =0} . N 1 ĝ2 (X1 , X2 , . . . , XN ) = 1 − N Prawdopodobieństwo i statystyka X1 +X2 +...+XN . Wykład VIII: Przestrzenie statystyczne. Estymatory