Od średniej w modelu gaussowskim do kwantyli w podstawowym

Transkrypt

Od średniej w modelu gaussowskim do kwantyli w podstawowym
Od średniej w modelu gaussowskim
do kwantyli w podstawowym modelu nieparametrycznym
IMPAN 1.X.2009
Rozszerzona wersja wykładu:
O ŚREDNIEJ STATYSTYCZNEJ
Ryszard Zieliński
XII Międzynarodowe Warsztaty dla Młodych Matematyków
Rachunek Prawdopodobieństwa i Statystyka
Kraków, 20–26 IX 2009 r.
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
WYNIKI OBSERWACJI
X1 , X2 , . . . , Xn
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
WYNIKI OBSERWACJI
X1 , X2 , . . . , Xn
Model statystyczny:
Xi = µ + εi ,
i = 1, 2, . . . , n
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
WYNIKI OBSERWACJI
X1 , X2 , . . . , Xn
Model statystyczny:
Xi = µ + εi ,
0.4
0.3
0.2
0.1
i = 1, 2, . . . , n
..........
........ .............
.....
.....
.....
.....
.....
.....
.
.
.
.....
.....
.....
....
.
.
.....
.
...
.....
.
.
.
..
.....
.
.
.
.
.....
...
.
.
.
.....
.
...
.
.....
.
.
.
.....
...
.
.
.
.
.....
....
.
......
.
.
.
.......
...
.
.
.
.
.
.
........
....
.
.
.
.
............
.
.
.
.
.
..
.................
......................
-1
0
1
•
2
µ
3
4
5
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
UŚREDNIENIE
X =
n
1X
Xj
n j=1
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
UŚREDNIENIE
X =
0.4
0.3
0.2
0.1
n
1X
Xj
n j=1
............................
.....
......
.....
.....
.....
.....
.....
.....
.
.
.
.....
...
.
.
.
.....
...
.
.....
.
.
...
.....
.
.
.
.....
..
.
.
.
.
.....
...
.
.
.....
.
.
...
.....
.
.
.
.
.....
...
.
.
.
......
.
....
.
......
.
.
.
.
.......
....
.
.
.
.
.
..........
.
.
......
.
.
.....................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.........
-1
0
1
µ
X
• •
2
3
4
5
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
UZASADNIENIE
średnia X minimalizuje względem µ funkcję
Pn
j=1 (Xi
− µ)2
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
astronomia, metrologia, geodezja, ...
ROZKŁAD NORMALNY N(µ, σ 2 )
n 1
1
ϕ(x) = √ exp −
2
σ 2π
x −µ
σ
2 o
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Funkcja charakterystyczna rozkładu normalnego N(µ, σ):
1
φX (t) = exp{iµt − σ 2 t 2 }
2
Funkcja charakterystyczna średniej X =
Pn
j=1 Xj /n:
!
1 σ2 2
φX (t) = exp{iµt −
t }
2 n
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Funkcja charakterystyczna rozkładu normalnego N(µ, σ):
1
φX (t) = exp{iµt − σ 2 t 2 }
2
Funkcja charakterystyczna średniej X =
Pn
j=1 Xj /n:
!
1 σ2 2
φX (t) = exp{iµt −
t }
2 n
Inne rozkłady?
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Rozkłady o trochę tłuściejszych ogonach:
......
0.4................
.. .. ....
. . ........
... ...
.. ...
.0.3
... ...
... ...
... ...
... ...
.. ..
... ...
... 0.2
...
... ...
.. ..
... ...
... ...
.. ..
... ...
.... ...
.. ...... 0.1
........
.
.
.
.
.
.
.
........
.
.
.
....
...............
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...................................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..
........................... ..........
.....
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
TŁUSTE OGONY
- rozmiar finansowej odpowiedzialności ubezpieczyciela
w związku z wypadkami losowymi jego klientów przy ubezpieczeniu
OC, AC oraz od wypadków przy pracy
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
TŁUSTE OGONY
- rozmiar finansowej odpowiedzialności ubezpieczyciela
w związku z wypadkami losowymi jego klientów przy ubezpieczeniu
OC, AC oraz od wypadków przy pracy
- wielkość plików przesyłanych w internecie
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
TŁUSTE OGONY
- rozmiar finansowej odpowiedzialności ubezpieczyciela
w związku z wypadkami losowymi jego klientów przy ubezpieczeniu
OC, AC oraz od wypadków przy pracy
- wielkość plików przesyłanych w internecie
- pojemność złóż ropy naftowej
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
TŁUSTE OGONY
- rozmiar finansowej odpowiedzialności ubezpieczyciela
w związku z wypadkami losowymi jego klientów przy ubezpieczeniu
OC, AC oraz od wypadków przy pracy
- wielkość plików przesyłanych w internecie
- pojemność złóż ropy naftowej
- rozmiary osiedli ludzkich
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
TŁUSTE OGONY
- rozmiar finansowej odpowiedzialności ubezpieczyciela
w związku z wypadkami losowymi jego klientów przy ubezpieczeniu
OC, AC oraz od wypadków przy pracy
- wielkość plików przesyłanych w internecie
- pojemność złóż ropy naftowej
- rozmiary osiedli ludzkich
- tzw. zwroty w operacjach giełdowych
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
ROZKŁAD CAUCHY’EGO (Lorenza, Breita-Wignera) Ca(µ, λ)
g (y ) =
λ
1
,
2
π λ + (y − µ)2
G (y ) =
y −µ
1 1
+ arctg
2 π
λ
Funkcja charakterystyczna:
φY (t) = exp{iµt − |λt|}
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
ROZKŁAD CAUCHY’EGO (Lorenza, Breita-Wignera) Ca(µ, λ)
g (y ) =
λ
1
,
2
π λ + (y − µ)2
G (y ) =
y −µ
1 1
+ arctg
2 π
λ
Funkcja charakterystyczna:
φY (t) = exp{iµt − |λt|}
Funkcja charakterystyczna średniej Y =
Pn
j=1 Yj /n:
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
ROZKŁAD CAUCHY’EGO (Lorenza, Breita-Wignera) Ca(µ, λ)
g (y ) =
λ
1
,
2
π λ + (y − µ)2
G (y ) =
y −µ
1 1
+ arctg
2 π
λ
Funkcja charakterystyczna:
φY (t) = exp{iµt − |λt|}
Funkcja charakterystyczna średniej Y =
Pn
j=1 Yj /n:
φY (t) = exp{iµt − |λt|}
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
ROZKŁAD CAUCHY’EGO
ROZKŁAD ŚREDNIEJ ARYTMETYCZNEJ Z PRÓBY
JEST TAKI SAM JAK
ROZKŁAD POJEDYNCZEJ OBSERWACJI
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Ogólniej:
SYMETRYCZNE ROZKŁADY α-STABILNE
exp{iµt − |λt|α }
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Ogólniej:
SYMETRYCZNE ROZKŁADY α-STABILNE
exp{iµt − |λt|α }
t
t
exp{iµ − |λ |α }
n
n
α = 2 – rozkład normalny;
n
= exp{iµt − |n1/α−1 λt|α }
α = 1 – rozkład Cauchy’ego
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
1.0
0.8
...........
... .....
...
...
...
..
.
...
...
...
..
.
...
..
...
.
..
...
.
..
..
.
........................................ .....
.
....... ..
...
.
.
.
.
.
.
........
.... ...
.
.
.......
.
.
..
.........
...... ...
... .......
...... ....
... .......
......
.
.
.
.
.
.
... ........
.
.
.
.
....
.
.
........
.
.....
.
.
.
.
.
.
.
.
...
......
.....
...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.......... .....................................
.........
...
............................
— rozkÃlad pojedynczej obserwacji
0.6
0.4
0.2
-1
— rozkÃlad średniej
0
1
2
3
4
5
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
MEDIANA
Mediana M minimalizuje względem µ funkcję
Pn
j=1 |Xi
− µ|
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
MEDIANA
Próba:
X1 , X2 , . . . , Xn
Statystyki pozycyjne:
X1:n , X2:n , . . . , Xn:n
X1:n ¬ X2:n ¬ . . . ¬ Xn:n
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
MEDIANA
Wyniki obserwacji:
X1 , X2 , . . . , X2n+1
Mediana z próby:
Xn+1:2n+1
n
(2n + 1)! F (x)[1 − F (x)] f (x)
2
(n!)
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
1.6
...
.. ....
... ....
. ..
1.2
... ...
.... .....
1.0
.. ... n = 25
.. ....
.
. .
0.8
.. ............
...... ........
0.6
..
.
.................................... n = 5
.
........
0.4
......
.........
........
.
.
.
... ..........
.
.
.
.
.
0.2
.
.
.
.
... ..................n. = 1
............. ...
.
.
.
.
.
.
.
.
.
...... .........................................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.............. ...............
................ ................
............................................
............................................
-1
0
1
2
3
4
5
µ=2
1.4
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby X1 , X2 , . . . , Xn
 1

n
n

X
+
X
:n
+1:n ,
2
2
Mn =


X
[ n+1
]:n ,
2
2
jeżeli n jest parzyste,
jeżeli n jest nieparzyste
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Efektywność mediany w rozkładzie N(0, 1)
e(n) =
Var (X n )
Var (Mn )
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Efektywność mediany w rozkładzie N(0, 1)
e(n) =
n
1
2
3
4
5
6
7
8
9
10
Var (X n )
Var (Mn )
e(n)
1.000
1.000
0.743
0.838
0.697
0.776
0.679
0.743
0.669
0.723
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Efektywność mediany w rozkładzie U(0, 1)
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Efektywność mediany w rozkładzie U(0, 1)
n
1
2
3
4
5
6
7
8
9
10
e(n)
1.000
1.000
0.556
0.625
0.467
0.519
0.429
0.469
0.407
0.440
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Szacowanie µ w rozkładzie normalnym:
σ
X̄ ± 2 √
n
lub X̄ ± 2 S
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Szacowanie µ w rozkładzie normalnym:
σ
X̄ ± 2 √
n
lub X̄ ± 2 S
Szacowanie µ w symetrycznym rozkładzie α-stabilnym (ogólniej?):
Mediana z próby ±
???
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby parzystej jest najczęściej definiowana jako średnia
arytmetyczna dwóch środkowych obserwacji
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby parzystej jest najczęściej definiowana jako średnia
arytmetyczna dwóch środkowych obserwacji
Ogólniej: liniowy estymator kwantyla rzędu q (L-statystyka)
c1 X1:n + c2 X2:n + . . . + cn Xn:n
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby parzystej jest najczęściej definiowana jako średnia
arytmetyczna dwóch środkowych obserwacji
Ogólniej: liniowy estymator kwantyla rzędu q (L-statystyka)
c1 X1:n + c2 X2:n + . . . + cn Xn:n
Efektywne konstrukcje w modelach z parametrem położenia
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby parzystej jest najczęściej definiowana jako średnia
arytmetyczna dwóch środkowych obserwacji
Ogólniej: liniowy estymator kwantyla rzędu q (L-statystyka)
c1 X1:n + c2 X2:n + . . . + cn Xn:n
Efektywne konstrukcje w modelach z parametrem położenia
Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby parzystej jest najczęściej definiowana jako średnia
arytmetyczna dwóch środkowych obserwacji
Ogólniej: liniowy estymator kwantyla rzędu q (L-statystyka)
c1 X1:n + c2 X2:n + . . . + cn Xn:n
Efektywne konstrukcje w modelach z parametrem położenia
Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
Estymacja kwantyla ?
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby parzystej jest najczęściej definiowana jako średnia
arytmetyczna dwóch środkowych obserwacji
Ogólniej: liniowy estymator kwantyla rzędu q (L-statystyka)
c1 X1:n + c2 X2:n + . . . + cn Xn:n
Efektywne konstrukcje w modelach z parametrem położenia
Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
Estymacja kwantyla ?
ε ∼ F , F znane
Niesymetryczne F,
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Mediana z próby parzystej jest najczęściej definiowana jako średnia
arytmetyczna dwóch środkowych obserwacji
Ogólniej: liniowy estymator kwantyla rzędu q (L-statystyka)
c1 X1:n + c2 X2:n + . . . + cn Xn:n
Efektywne konstrukcje w modelach z parametrem położenia
Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
Estymacja kwantyla ?
ε ∼ F , F znane
Niesymetryczne F, V@R
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Liniowy estymator nieobciążony o minimalnej wariancji:
C =M

−1
T
R R M
−1
R
−1
F −1 (q)
1
!

EF X1:n 1


. . . ,
R =  ...
EF Xn:n 1
Mi,j = CovF (Xi:n , Xj:n )
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Liniowy estymator nieobciążony o minimalnej wariancji:
C =M

−1
T
R R M
−1
R
−1
F −1 (q)
1
!

EF X1:n 1


. . . ,
R =  ...
EF Xn:n 1
Mi,j = CovF (Xi:n , Xj:n )
Minimalna wariancja:
!T
VarL (q, n) =
F −1 (q)
1
T
R M
−1
R
−1
F −1 (q)
1
!
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Liniowy estymator nieobciążony o minimalnej wariancji:
C =M

−1
T
R R M
−1
R
F −1 (q)
1
−1
!

EF X1:n 1


. . . ,
R =  ...
EF Xn:n 1
Mi,j = CovF (Xi:n , Xj:n )
Minimalna wariancja:
!T
VarL (q, n) =
F −1 (q)
1
T
R M
−1
R
VarL (q, n + 1) < VarL (q, n)
−1
F −1 (q)
1
!
???
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Przykład:
Estymacja kwantyla rzędu q rozkładu normalnego:
(VarUMVU(q, 5),VarL (q, 5)) =

0.2000,
0.2599,

0.4164,

=
0.9131,

1.4583,
2.0225,



0.2000
0.5
 0.75 
0.2607



 0.9 
0.4190



 dla q = 

 0.99 
0.9215



 0.999 
1.4732
2.0440
0.9999
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Przykład:
Estymacja mediany rozkładu Cauchy’ego:
c3 X3:n + c4 X4:n + . . . + cn−2 Xn−2:n
Liniowy estymator nieobciążony o minimalnej wariancji:
C = M −1 R R T M −1 R

−1
!
0
1

EF X3:n
1


. . .
R =  ...
EF Xn−2:n 1
Mi,j = CovF (Xi:n , Xj:n )
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
BŁĄD OSZACOWANIA:
Szacowanie µ w rozkładzie normalnym:
σ
X̄ ± 2 √
n
lub X̄ ± 2 S
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
BŁĄD OSZACOWANIA:
Szacowanie µ w rozkładzie normalnym:
σ
X̄ ± 2 √
n
lub X̄ ± 2 S
Szacowanie µ w symetrycznym rozkładzie α-stabilnym (ogólniej?):
Mediana z próby ±
???
Szacowanie µ w modelu z parametrem położenia
L − statystyka ±
???
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
”Duży model nieparametryczny”:
rodzina F wszystkich rozkładów o ciągłych i ściśle rosnących
dystrybuantach na prostej
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
”Duży model nieparametryczny”:
rodzina F wszystkich rozkładów o ciągłych i ściśle rosnących
dystrybuantach na prostej
Mediana z próby pochodzącej z rozkładu F jako estymator
mediany m(F ) tego rozkładu
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
”Duży model nieparametryczny”:
rodzina F wszystkich rozkładów o ciągłych i ściśle rosnących
dystrybuantach na prostej
Mediana z próby pochodzącej z rozkładu F jako estymator
mediany m(F ) tego rozkładu
Twierdzenie. Dla każdego C > 0 istnieje taki rozkład F ∈ F, że
MedF
X n2 :n + X n2 +1:n
2
!
− m(F ) > C
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
”Duży model nieparametryczny”:
rodzina F wszystkich rozkładów o ciągłych i ściśle rosnących
dystrybuantach na prostej
Mediana z próby pochodzącej z rozkładu F jako estymator
mediany m(F ) tego rozkładu
Twierdzenie. Dla każdego C > 0 istnieje taki rozkład F ∈ F, że
MedF
X n2 :n + X n2 +1:n
2
!
− m(F ) > C
TWIERDZENIE JEST PRAWDZIWE DLA WSZYSTKICH
NIETRYWIALNYCH L-STATYSTYK !
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Duży model nieparametryczny F
Rodzina wszystkich rozkładów o ciągłych i ściśle rosnących dystrybuantach
Jeżeli X ma rozkład F z rodziny F i jeżeli g : R 1 → R 1 jest
przekształceniem monotonicznym, to zmienna losowa g (X ) też ma
rozkład z rodziny F
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Duży model nieparametryczny F
Rodzina wszystkich rozkładów o ciągłych i ściśle rosnących dystrybuantach
Jeżeli X ma rozkład F z rodziny F i jeżeli g : R 1 → R 1 jest
przekształceniem monotonicznym, to zmienna losowa g (X ) też ma
rozkład z rodziny F
Jeżeli X ma rozkład F ∈ F z medianą m(F ) i jeżeli g : R 1 → R 1
jest przekształceniem monotonicznym, to zmienna losowa g (X ) ma
rozkład z medianą g (m(F )).
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Duży model nieparametryczny F
Rodzina wszystkich rozkładów o ciągłych i ściśle rosnących dystrybuantach
Jeżeli X ma rozkład F z rodziny F i jeżeli g : R 1 → R 1 jest
przekształceniem monotonicznym, to zmienna losowa g (X ) też ma
rozkład z rodziny F
Jeżeli X ma rozkład F ∈ F z medianą m(F ) i jeżeli g : R 1 → R 1
jest przekształceniem monotonicznym, to zmienna losowa g (X ) ma
rozkład z medianą g (m(F )).
Jeżeli X ma rozkład F ∈ F z kwantylem xq (F ) rzędu q i jeżeli
g : R 1 → R 1 jest przekształceniem monotonicznym, to zmienna
losowa g (X ) rozkład z kwantylem rzędu q równym g (xq (F )).
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Postulat pod adresem estymatora mediany (kwantyla):
Jeżeli T jest nieobciążonym estymatorem mediany (kwantyla
rzędu q) zmiennej losowej X , to g (T ) jest nieobciążonym
estymatorem mediany (kwantyla rzędu q) zmiennej losowej g (X )
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Postulat pod adresem estymatora mediany (kwantyla):
Jeżeli T jest nieobciążonym estymatorem mediany (kwantyla
rzędu q) zmiennej losowej X , to g (T ) jest nieobciążonym
estymatorem mediany (kwantyla rzędu q) zmiennej losowej g (X )
Nieobciążony ?
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Estymacja kwantyla xq (F ) rzędu q rozkładu F .
Konstrukcja medianowo nieobciążonego estymatora
o maksymalnej koncentracji:
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
P {T ≤ x}
1
0.5
0
..
...
..
..
...
..
..
...
..
..
..
.......................................................................
..
..
..
..
..
..
...
...
..
..
..
..
xq
.................................................................................................................................................................................................................................................................................................................
..
.....
....
.......
...
.......
...
.......
..
.
.
..
...
......
...
...
...
.....
....
...
..
....
...
...
...
....
....
.. .....
... .
... ...
..... ..
....
.....
.
. ....
.
.
.. ...
.. ...
... ....
..
..
...
...
..
..
.
.
.
.
.
..
...
...
..
..
...
..
.
.
.
.
.....
...
...
...
..
.....
...
.
.
.
.
.
.
.
.
.
.........................................
x
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Definiujemy
πk (q) = PF {Xk:n ¬ xq (F )} =
Wybieramy k takie, że πk (q) ­
Obliczamy λ∗k =
1
2
n
X
n
j=k
j
!
q j (1 − q)n−j
> πk+1 (q)
1
2
− πk+1 (q)
πk (q) − πk+1 (q)
Medianowo nieobciążony estymator o maksymalnej koncentracji
ma postać
T ∗ = XJ ∗ :n ,
P{J ∗ = k} = λ∗k ,
P{J ∗ = k +1} = 1−λ∗k
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
Estymacja mediany (q = 1/2)
πk
1
2
=
1
2n
n
X
n
j
j=k
πm+1
1
2
=

1

 ,

 1 − 1 2m , n = 2m
2m
2
Estymator =
n = 2m + 1,
2
2
m

Xm+1 ,

1(0,0.5] (R)Xm + 1(0.5,1) (R)Xm+1 ,
n = 2m + 1
n = 2m
R ∼ U(0, 1)
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
BŁĄD OSZACOWANIA
Szacowanie µ w rozkładzie normalnym:
σ
X̄ ± 2 √
n
lub X̄ ± 2 S
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
BŁĄD OSZACOWANIA
Szacowanie µ w rozkładzie normalnym:
σ
X̄ ± 2 √
n
lub X̄ ± 2 S
Szacowanie µ w symetrycznym rozkładzie α-stabilnym (ogólniej?):
Mediana z próby ±
???
Szacowanie µ w modelu z parametrem położenia:
L − statystyka ±
???
Szacowanie kwantyla w podstawowym modelu nieparametrycznym:
Nieobciążony estymator o maksymalnej koncentracji±
???
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
• Modele statystyczne z parametrami położenia i skali, skala
nieznana
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
• Modele statystyczne z parametrami położenia i skali, skala
nieznana
• Model nieparametryczny: rodzina wszystkich rozkładów, które
mają pierwszy (dwa pierwsze) momenty
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
• Modele statystyczne z parametrami położenia i skali, skala
nieznana
• Model nieparametryczny: rodzina wszystkich rozkładów, które
mają pierwszy (dwa pierwsze) momenty
• Podstawowy model nieparametryczny: rodzina wszystkich
rozkładów o ciągłych i ściśle rosnących (lokalnie) dystrybuantach
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
• Modele statystyczne z parametrami położenia i skali, skala
nieznana
• Model nieparametryczny: rodzina wszystkich rozkładów, które
mają pierwszy (dwa pierwsze) momenty
• Podstawowy model nieparametryczny: rodzina wszystkich
rozkładów o ciągłych i ściśle rosnących (lokalnie) dystrybuantach
Estymatory medianowo nieobciążone o maksymalnej koncentracji
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
• Modele statystyczne z parametrami położenia i skali, skala
nieznana
• Model nieparametryczny: rodzina wszystkich rozkładów, które
mają pierwszy (dwa pierwsze) momenty
• Podstawowy model nieparametryczny: rodzina wszystkich
rozkładów o ciągłych i ściśle rosnących (lokalnie) dystrybuantach
Estymatory medianowo nieobciążone o maksymalnej koncentracji
Teoria ENMW, MSE, MAD, ...
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
• Modele statystyczne z parametrami położenia i skali, skala
nieznana
• Model nieparametryczny: rodzina wszystkich rozkładów, które
mają pierwszy (dwa pierwsze) momenty
• Podstawowy model nieparametryczny: rodzina wszystkich
rozkładów o ciągłych i ściśle rosnących (lokalnie) dystrybuantach
Estymatory medianowo nieobciążone o maksymalnej koncentracji
Teoria ENMW, MSE, MAD, ...
BŁĄD OSZACOWANIA
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków
PODSUMOWANIE
• Rozkład normalny
• Symetryczne rozkłady α-stabilne (rozkłady symetryczne)
• Modele statystyczne z parametrem położenia:
X = µ + ε,
µ nieznane,
ε ∼ F , F znane
• Modele statystyczne z parametrami położenia i skali, skala
nieznana
• Model nieparametryczny: rodzina wszystkich rozkładów, które
mają pierwszy (dwa pierwsze) momenty
• Podstawowy model nieparametryczny: rodzina wszystkich
rozkładów o ciągłych i ściśle rosnących (lokalnie) dystrybuantach
Estymatory medianowo nieobciążone o maksymalnej koncentracji
Teoria ENMW, MSE, MAD, ...
BŁĄD OSZACOWANIA
;)
Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków”Rachunek
O ŚREDNIEJ STATYSTYCZNEJ
Prawdopodobieństwa i Statystyka”Kraków