Funkcje i charakterystyki zmiennych losowych

Transkrypt

Funkcje i charakterystyki zmiennych losowych
Metody probabilistyczne i statystyka
Wykład
Funkcje i charakterystyki
zmiennych losowych
Dr Joanna Banaś
Zakład Badań Systemowych
Instytut Sztucznej Inteligencji i Metod Matematycznych
Wydział Informatyki Politechniki Szczecińskiej
2
Metody probabilistyczne i statystyka
Wykład 2
5. Funkcje zmiennych losowych
Funkcja g : → jest odwzorowaniem borelowskim, jeśli
∀ B∈B ( ) {x ∈ : g ( x) ∈ B} ∈ B ()
(5.1)
X :Ω → (5.2) Uwagi
a)
Warunkowi (5.1) równoważny jest warunek
Y
∀ y∈ {x ∈ : g ( x) < y} ∈ B ()
b)
g
Każda funkcja ciągła jest odwzorowaniem borelowskim
(5.3) Twierdzenie
X − zmienna losowa, określona na przestrzeni probabilistycznej (Ω, Z , P),
g − dowolna funkcja borelowska
Funkcja Y : Ω → , określona wzorem Y = g ( X ), tzn. Y (ω) = g ( X (ω) )
dla ω∈Ω, jest zmienną losową.
Y = g ( X ) − funkcja zmiennej losowej X
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Funkcje zmiennych losowych typu
skokowego
(5.4) Twierdzenie
Jeśli X jest zmienną losową typu skokowego o zbiorze atomów
S X = {x1 , x 2 ,...} i rozkładzie P( X = xi ) = pi , i = 1,2,..., to Y = g ( X )
jest również typu skokowego o zbiorze atomów SY = {g ( x1 ), g ( x2 ),...}
i rozkładzie
P (Y = g ( xi )) = ∑ {k :g ( x ) = g ( x )} p k , i = 1, 2,...
k
i
(5.5) Przykład
X jest zmienną losową typu skokowego o zbiorze atomów S X = {−1,0,1}
i rozkładzie xi −1 0 1
1
1
1
pi
4
2
4
Wyznaczyć rozkład zmiennej
a)
b)
Y = 2X +1
Y = 2X 2 +1
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Funkcje zmiennych losowych typu
ciągłego
(5.6) Twierdzenie
Jeśli X jest zmienną losową typu ciągłego o gęstości fX
i Y = aX + b ( a ≠ 0) , to zmienna losowa Y
także jest typu ciągłego i jej gęstość określona jest wzorem
1
 y −b 
fY ( y) =
fX 

|a|  a 
(5.5) Przykład
X ma rozkład jednostajny na przedziale 〈0,1〉, tzn. funkcja gęstości
określona jest wzorem
1 dla x ∈ 〈 0,1〉
f X ( x) = 
0 dla x ∉ 〈 0,1〉 f ( x)
Wyznaczyć rozkład zmiennej
0
1
b) Y = g ( X ), gdzie g ( x ) = 
2
 3
a) Y = 2 X + 1
dla
x<0
dla 0 ≤ x < 12
dla 12 ≤ x < 1
dla
x ≥1
1
0
1
2
Rys.5.1. Gęstość zmiennej losowej X
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
6. Charakterystyki liczbowe zmiennej
losowej
Wartość oczekiwana (przeciętna) zmiennej losowej X,
określonej na przestrzeni probabilistycznej (Ω, Z , P), to
wielkość
(6.1)
, o ile całka istnieje
EX ∫ X (ω)dP
Ω
(6.2) Własności (wartości oczekiwanej)
a)
b)
Ec = c, c ∈ EX < ∞, EY < ∞, a, b ∈ ⇒
i E ( aX + bY ) = aEX + bEY
c)
X ≥ 0 i EX = 0
⇒
E ( aX + bY ) < ∞
P ( X = 0) = 1 (X = 0 prawie wszędzie)
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Wartość oczekiwana funkcji zmiennej
losowej typu skokowego
(6.3) Twierdzenie
Niech X będzie zmienną losową typu skokowego
o rozkładzie P( X = xi ) = pi dla i = 1, 2,...
Jeśli g jest funkcją borelowską na taką,
że ∑ i | g ( xi ) | pi < ∞ , to Eg ( X ) istnieje oraz
Eg ( X ) = ∑ i g ( xi ) pi
(6.4) Wnioski
a)
b)
g ( x) = x ⇒ EX = ∑ i xi pi
g ( x) = x 2 ⇒ EX = ∑ i xi2 pi
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Wartość oczekiwana funkcji zmiennej
losowej typu ciągłego
(6.5) Twierdzenie
Niech X będzie zmienną losową typu ciągłego o gęstości f.
Jeśli g jest funkcją borelowską na taką, że
∫
∞
| g ( x) | ⋅ f ( x)dx < ∞ ,
to Eg ( X ) istnieje oraz
−∞
∞
Eg ( X ) = ∫ g ( x) ⋅ f ( x)dx
−∞
(6.6) Wnioski
∞
a)
g ( x) = x ⇒ EX = ∫ x ⋅ f ( x )dx
b)
g ( x) = x 2 ⇒ EX = ∫ x 2 ⋅ f ( x)dx
−∞
∞
−∞
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Wariancja
Wariancja zmiennej losowej X to liczba
D 2 X E ( X − EX ) 2
(6.7)
(6.8) Wnioski
a)
X − zmienna losowa typu skokowego o rozkładzie
P( X = xi ) = pi dla i = 1, 2,...
⇒
D 2 X = ∑ i ( xi − EX ) 2 pi
b)
X − zmienna losowa typu ciągłego o gęstości f
⇒
∞
D X = ∫ ( x − EX ) 2 ⋅ f ( x)dx
2
−∞
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Własności wariancji
(6.9) Własności
a)
D 2 X = EX 2 − ( EX ) 2
b)
D2X ≥ 0
c)
D 2 X = 0 ⇔ P( X = EX ) = 1
d)
D 2 (aX ) = a 2 D 2 X , a ∈ e)
D 2 ( X + b) = D 2 X , b ∈ (6.10) Przykład
Obliczyć wartość oczekiwaną i wariancję zmiennej losowej X
a)
b)
o rozkładzie
xi
pi
o funkcji gęstości
0 1
1
4
3
4
 x − 1 dla x ∈ 〈1, 2)

f ( x) = 3 − x dla x ∈ (2,3〉
 0
dla x ∉ 〈1,3〉

Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Inne charakterystyki zmiennej losowej
Odchylenie standardowe zmiennej losowej X to
liczba
σ D2X
(6.11)
Wartości oczekiwane
mk EX k , E | X | k , µ k E ( X − EX ) k
to odpowiednio:
a)
b)
c)
k-ty moment zwykły
k-ty moment absolutny
k-ty moment centralny
zmiennej losowej X ( EX = m, D 2 X = µ 2 )
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Inne charakterystyki zmiennej losowej
Kwantyl rzędu p − każda liczba x p , p ∈ (0,1) taka, że
F ( x p ) ≤ p ≤ lim+ F ( x)
tzn.
∑
i
F (x p ) = p
xi < x p
pi ≤ p ≤ ∑ x ≤ x pi
i
p
x→ x p
dla zmiennej typu skokowego
dla zmiennej typu ciągłego
1
Mediana − kwantyl rzędu 2
Odchylenie przeciętne od wartości oczekiwanej
d = E | X − EX |
Współczynnik zmienności
σ
ν= , m≠0
m
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Inne charakterystyki zmiennej losowej
Współczynnik skośności (asymetrii)
µ 3 E ( X − EX ) 3
γ= 3 =
σ
σ3
a)
f ( x)
b)
f ( x)
γ>0
0
γ<0
x
0
x
Rys.6.1. Asymetria prawostronna (a) i lewostronna (b)
Dominanta (moda)
typ skokowy − wartość xk ∉{min xi ,max xi } , dla której pk jest maksimum
absolutnym,
typ ciągły − odcięta maksimum absolutnego funkcji gęstości, o ile jest punktem
ciągłości
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Inne charakterystyki zmiennej losowej
Współczynnik skupienia (kurtoza)
µ 4 E ( X − EX ) 4
κ= 4 =
σ
σ4
f ( x)
1
EX 1 = EX 2 = 0
2
2
f1 D X 1 = D X 2
κ1 < κ 2
1
2
f2
−1
−
1
2
0
1
2
1
x
Rys.6.2. Porównanie skupienia dwóch rozkładów
Współczynnik spłaszczenia (eksces)
γ2 = κ − 3
Rozkład normalny
κ=3
γ2 = 0
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
7. Wybrane zmienne typu skokowego
(7.1) Rozkład jednopunktowy
xi
pi
P ( X = a ) = 1, dla ustalonego a ∈ lub
Dystrybuanta
0 dla x ≤ a
F ( x) = 
1 dla x > a
Parametry
EX = a ⋅1 = a
EX 2 = a 2 ⋅1 = a 2
D2 X = a2 − a2 = 0
a
1
F ( x)
1
0
a
x
Rys.7.1. Wykres dystrybuanty
zmiennej losowej X
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Rozkład 0-1
(7.2) Rozkład 0−1 z parametrem p∈(0,1)
xi
pi
P ( X = 1) = p, P ( X = 1) = q, q = 1 − p lub
0
q
1
p
Dystrybuanta
 0 dla x ≤ 0

F ( x) = q dla 0 < x ≤ 1
1 dla x > 1

Parametry
F ( x)
1
p
q
q
EX = 0 ⋅ q + 1 ⋅ p = p
2
2
2
EX = 0 ⋅ q + 1 ⋅ p = p
D 2 X = p − p 2 = p (1 − p ) = p ⋅ q
0
1
x
Rys.7.2. Wykres dystrybuanty
zmiennej losowej X
Realizacja
sukces
1
zmienna losowa X n =  gdy w n-tym doświadczeniu wystąpi
porażka
0
ma rozkład 0−1 dla każdego n = 1,2,…
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Rozkład dwumianowy
(7.3) Rozkład dwumianowy z parametrami n = 1,2,…, p∈(0,1)
P ( X = k ) = n p k q n − k , k = 0,1, 2,..., n, q = 1 − p
k
()
Rozkład jest dobrze określony
n
∑ k =0 kn p k q n−k = ( p + q) n = 1
Parametry
()
EX = n ⋅ p
D2 X = n ⋅ p ⋅ q
Własności
(n+1)p − liczba całkowita ⇒ najbardziej prawdopodobnymi wartościami zmiennej są liczby
(n+1)p−1 oraz (n+1)p
(n+1)p − liczba niecałkowita ⇒ najbardziej prawdopodobną wartością zmiennej jest liczba
[(n+1)p] ([x] − całość z x)
Realizacja
liczba możliwych sukcesów w schemacie Bernoulli’ego
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Rozkład geometryczny
(7.4) Rozkład geometryczny z parametrem p∈(0,1)
P ( X = k ) = q k −1 p, k = 1, 2,..., q = 1 − p
Rozkład jest dobrze określony
n
n
1
1
k −1
k −1
q
p
=
p
⋅
q
=
p
⋅
=
p
⋅
=1
∑ k =1
∑ k =1
1− q
p
Parametry
1
p
q
2
D X= 2
p
EX =
Realizacja
liczba doświadczeń do momentu pierwszego sukcesu
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 2
Rozkład Poissona
(7.5) Rozkład Poissona z parametrem λ > 0
λ k −λ
P( X = k ) =
e , k = 0,1, 2,...
k!
Rozkład jest dobrze określony
k (M)
∞ λ
λ k −λ
−λ
∑ k =0 k ! e = e ∑ k =0 k ! = e −λ ⋅ e λ = e 0 = 1
z rozwinięcia funkcji w szereg Maclaurina mamy
(k )
∞
∞
f
(0) k
1
(M)
f ( x ) = ∑ k =0
x i stąd e x = ∑ k =0 x k
k!
k!
Parametry
EX = λ
D2 X = λ
∞
Opracowała Joanna Banaś
Przybliżenie rozkładem Poissona
Twierdzenie
Ciąg rozkładów dwumianowych jest zbieżny do rozkładu
Poissona z parametrem λ
Uwaga
Jeśli n ≥ 50, p ≤ 0.1 i n ⋅ p ≤ 10 , to do celów praktycznych
można przybliżać
n p k q n−k ≈ λ k e −λ , λ = n ⋅ p
k
k!
Realizacja
()
ze względu na wcześniejszą uwagę liczba możliwych sukcesów
w schemacie Bernoulli’ego, przy dużej liczbie doświadczeń i małym
prawdopodobieństwie sukcesu (kontrola jakości)
Metody probabilistyczne i statystyka
Wykład
1
Dziękuję za uwagę
Opracowała Joanna Banaś