Metody probabilistyczne informatyki

Transkrypt

Metody probabilistyczne informatyki
Metody probabilistyczne informatyki
Zmienna losowa: jej rozkład i dystrybuanta
Katedra Algorytmiki
Uniwersytet Jagielloński
22 październik 2015
Metody probabilistyczne informatyki
Piotr Micek
spacer losowy z dwiema barierami: rozwiązanie
A – skończymy na liczbie n
B – w pierwszym kroku dodaliśmy 1
Pk – miara przestrzeni przy założeniu, że startujemy z k
Pk (A) = Pk (A|B)P(B) + Pk (A|B 0 )P(B 0 )
1
= (Pk+1 (A) + Pk−1 (A))
2
Metody probabilistyczne informatyki
Piotr Micek
spacer losowy z dwiema barierami: rozwiązanie
A – skończymy na liczbie n
B – w pierwszym kroku dodaliśmy 1
Pk – miara przestrzeni przy założeniu, że startujemy z k
Pk (A) = Pk (A|B)P(B) + Pk (A|B 0 )P(B 0 )
1
= (Pk+1 (A) + Pk−1 (A))
2
W skrócie: dla pk = Pk (A) zachodzi
pk+1 − pk = pk − pk−1 , dla 0 < k < n
p0 = 0,
pn = 1.
Metody probabilistyczne informatyki
Piotr Micek
spacer losowy z dwiema barierami: rozwiązanie
A – skończymy na liczbie n
B – w pierwszym kroku dodaliśmy 1
Pk – miara przestrzeni przy założeniu, że startujemy z k
Pk (A) = Pk (A|B)P(B) + Pk (A|B 0 )P(B 0 )
1
= (Pk+1 (A) + Pk−1 (A))
2
W skrócie: dla pk = Pk (A) zachodzi
pk+1 − pk = pk − pk−1 , dla 0 < k < n
p0 = 0,
pn = 1.
Zatem (pk ) to ciąg arytmetyczny: pk = kp1 . Z warunków
brzegowych otrzymujemy:
pk =
Metody probabilistyczne informatyki
k
n
Piotr Micek
spacer losowy z jedną barierą
Startujemy doświadczenie z liczbą 0. Dopóki aktualna liczba jest
mniejsza od n dodajemy do niej 1 lub −1 z równym
prawdopodobieństwem.
Jakie jest prawdopodobieństwo, że dotrzemy do n?
Metody probabilistyczne informatyki
Piotr Micek
spacer losowy z jedną barierą
Startujemy doświadczenie z liczbą 0. Dopóki aktualna liczba jest
mniejsza od n dodajemy do niej 1 lub −1 z równym
prawdopodobieństwem.
Jakie jest prawdopodobieństwo, że dotrzemy do n?
A – dotrzemy do n
wróćmy do dwóch barier:
A1,n+1 – startując z 1 dotrzemy do n + 1 nieprzechodząc przez 0
Ak,n+k – startując z k dotrzemy do n + k nieprzechodząc przez 0
Metody probabilistyczne informatyki
Piotr Micek
spacer losowy z jedną barierą
Startujemy doświadczenie z liczbą 0. Dopóki aktualna liczba jest
mniejsza od n dodajemy do niej 1 lub −1 z równym
prawdopodobieństwem.
Jakie jest prawdopodobieństwo, że dotrzemy do n?
A – dotrzemy do n
wróćmy do dwóch barier:
A1,n+1 – startując z 1 dotrzemy do n + 1 nieprzechodząc przez 0
Ak,n+k – startując z k dotrzemy do n + k nieprzechodząc przez 0
A1,n+1 ⊆ A2,n+2 ⊆ . . .
A=
[
Ak,n+k
k
Metody probabilistyczne informatyki
Piotr Micek
spacer losowy z jedną barierą
Startujemy doświadczenie z liczbą 0. Dopóki aktualna liczba jest
mniejsza od n dodajemy do niej 1 lub −1 z równym
prawdopodobieństwem.
Jakie jest prawdopodobieństwo, że dotrzemy do n?
A – dotrzemy do n
wróćmy do dwóch barier:
A1,n+1 – startując z 1 dotrzemy do n + 1 nieprzechodząc przez 0
Ak,n+k – startując z k dotrzemy do n + k nieprzechodząc przez 0
A1,n+1 ⊆ A2,n+2 ⊆ . . .
A=
[
Ak,n+k
k
Z ciągłości prawdopodobieństwa:
[
P(A) = P(
k
Ak,n+k ) = lim P(Ak,n+k ) = lim
k→∞
Metody probabilistyczne informatyki
k→∞
k
= 1.
n+k
Piotr Micek
zmienna losowa
Zmienną losową, określoną na przestrzeni probabilistycznej
(Ω, F, P), nazywamy dowolną funkcję X : Ω → Rn taką, że
X −1 (B) ∈ F dla każdego B ∈ B(Rn ).
Metody probabilistyczne informatyki
Piotr Micek
zmienna losowa
Zmienną losową, określoną na przestrzeni probabilistycznej
(Ω, F, P), nazywamy dowolną funkcję X : Ω → Rn taką, że
X −1 (B) ∈ F dla każdego B ∈ B(Rn ).
Inaczej mówiąc, X jest zmienną losową jeśli jest odwzorowaniem
mierzalnym (Ω, F) w (Rn , B(Rn )).
Metody probabilistyczne informatyki
Piotr Micek
zmienna losowa
Zmienną losową, określoną na przestrzeni probabilistycznej
(Ω, F, P), nazywamy dowolną funkcję X : Ω → Rn taką, że
X −1 (B) ∈ F dla każdego B ∈ B(Rn ).
Inaczej mówiąc, X jest zmienną losową jeśli jest odwzorowaniem
mierzalnym (Ω, F) w (Rn , B(Rn )).
Funkcja f : Rn → Rm jest borelowska, jeśli przeciwobrazy zbiorów
borelowskich w Rm są zbiorami borelowskimi w Rn .
Niech X : Ω → Rn będzie zmienną losową, a f : Rn → Rm funkcją
borelowską. Wtedy f (X ) jest zmienna losową o wartościach w Rm .
Metody probabilistyczne informatyki
Piotr Micek
zmienna losowa
Zmienną losową, określoną na przestrzeni probabilistycznej
(Ω, F, P), nazywamy dowolną funkcję X : Ω → Rn taką, że
X −1 (B) ∈ F dla każdego B ∈ B(Rn ).
Inaczej mówiąc, X jest zmienną losową jeśli jest odwzorowaniem
mierzalnym (Ω, F) w (Rn , B(Rn )).
Funkcja f : Rn → Rm jest borelowska, jeśli przeciwobrazy zbiorów
borelowskich w Rm są zbiorami borelowskimi w Rn .
Niech X : Ω → Rn będzie zmienną losową, a f : Rn → Rm funkcją
borelowską. Wtedy f (X ) jest zmienna losową o wartościach w Rm .
Jeśli F = 2Ω to każda funkcja wychodząca z Ω jest zmienną losową.
Metody probabilistyczne informatyki
Piotr Micek
rozkład zmiennej losowej
Rozkładem prawdopodobieństwa na Rn nazywamy dowolna miarę
probabilistyczną na B(Rn ).
Rozkładem prawdopodobieństwa zmiennej losowej X o wartościach
w Rn nazywamy rozkład prawdopodobieństwa PX zadany przez
PX (B) = P(X −1 (B)) = P(X ∈ B) = P({ω : X (ω) ∈ B}).
Metody probabilistyczne informatyki
Piotr Micek
rozkład zmiennej losowej
Rozkładem prawdopodobieństwa na Rn nazywamy dowolna miarę
probabilistyczną na B(Rn ).
Rozkładem prawdopodobieństwa zmiennej losowej X o wartościach
w Rn nazywamy rozkład prawdopodobieństwa PX zadany przez
PX (B) = P(X −1 (B)) = P(X ∈ B) = P({ω : X (ω) ∈ B}).
Atomem rozkładu PX nazywamy każdą liczbę rzeczywistą x, dla
której PX ({x}) > 0. Atomów jest co najwyżej przeliczalnie wiele.
Metody probabilistyczne informatyki
Piotr Micek
rozkład zmiennej losowej
Rozkładem prawdopodobieństwa na Rn nazywamy dowolna miarę
probabilistyczną na B(Rn ).
Rozkładem prawdopodobieństwa zmiennej losowej X o wartościach
w Rn nazywamy rozkład prawdopodobieństwa PX zadany przez
PX (B) = P(X −1 (B)) = P(X ∈ B) = P({ω : X (ω) ∈ B}).
Atomem rozkładu PX nazywamy każdą liczbę rzeczywistą x, dla
której PX ({x}) > 0. Atomów jest co najwyżej przeliczalnie wiele.
W przypadku skończonym lub przeliczalnym, tzn. gdy
X (Ω) = {x1 , x2 , . . .}, ciąg pi = PX ({xi }) = P({ω : X (ω) = xi })
wyznacza jednoznacznie miarę PX wzorem
X
PX (B) =
pi .
xi ∈B
Metody probabilistyczne informatyki
Piotr Micek
dystrybuanta zmiennej losowej
Dystrybuantą zmiennej losowej X nazywamy funkcję
FX : R → [0, 1] zadaną przez
FX (x) = PX ((−∞, x]) = P({ω : X (ω) ¬ x}).
Metody probabilistyczne informatyki
Piotr Micek
dystrybuanta zmiennej losowej
Dystrybuantą zmiennej losowej X nazywamy funkcję
FX : R → [0, 1] zadaną przez
FX (x) = PX ((−∞, x]) = P({ω : X (ω) ¬ x}).
Oczywiście w przypadku dyskretnym, funkcja FX wyznacza
bezpośrednio rozkład PX poprzez
P({xi }) = FX (xi ) − FX (xi−1 ).
Metody probabilistyczne informatyki
Piotr Micek
przykłady dyskretne
Podaj rozkład i dystrybuantę następujących zmiennych losowych:
rzut kostką: X (wypadło i oczek) = i
n rzutów monetą: X ((a1 , . . . , an )) = a1 + . . . + an , czyli X to
liczba orłów
Metody probabilistyczne informatyki
Piotr Micek
własności dystrybuanty
Własności
Dytrybuanta dowolnej zmiennej losowej jest
niemalejąca
prawostronnie ciągła
jej granice w +∞ i −∞ są równe odpowiednio 1 i 0.
Uwaga: Dowolna funkcja o powyższych własnościach jest
dystrybuantą pewnej zmiennej losowej. Z dystrybuanty FX można
odtworzyć jednoznacznie miarę PX na całej rodzinie zbiorów
borelowskich (tzw. miara Lebesguea-Stieltjesa).
Własność (zadanie)
Dla dowolnej zmiennej losowej X zbiór atomów jej rozkładu PX to
dokładnie zbiór punktów skokowych dystrybuanty FX .
Metody probabilistyczne informatyki
Piotr Micek
ciągłe zmienne losowe
Zmienna losowa X jest ciągła, jeśli jej dystrybuantę można wyrazić
Zx
F (x) =
f (u) du
x ∈R
−∞
Dystrybuanta F zmiennej losowej o rozkładzie absolutnie ciągłym
posiada prawie wszędzie pochodną f = F 0 całkowalną w sensie
Lebesguea i spełniającą dla wszystkich a < b warunek
Zb
f (x) dx = F (b) − F (a).
a
Metody probabilistyczne informatyki
Piotr Micek
ciągłe zmienne losowe
Zmienna losowa X jest ciągła, jeśli jej dystrybuantę można wyrazić
Zx
F (x) =
f (u) du
x ∈R
−∞
Dystrybuanta F zmiennej losowej o rozkładzie absolutnie ciągłym
posiada prawie wszędzie pochodną f = F 0 całkowalną w sensie
Lebesguea i spełniającą dla wszystkich a < b warunek
Zb
f (x) dx = F (b) − F (a).
a
Funkcję f nazywamy gęstością (rozkładu) zmiennej losowej X .
Metody probabilistyczne informatyki
Piotr Micek
ciągłe zmienne losowe
Zmienna losowa X jest ciągła, jeśli jej dystrybuantę można wyrazić
Zx
F (x) =
f (u) du
x ∈R
−∞
Dystrybuanta F zmiennej losowej o rozkładzie absolutnie ciągłym
posiada prawie wszędzie pochodną f = F 0 całkowalną w sensie
Lebesguea i spełniającą dla wszystkich a < b warunek
Zb
f (x) dx = F (b) − F (a).
a
Funkcję f nazywamy gęstością (rozkładu) zmiennej losowej X .
Dystrybuanta i gęstość dają dwa sposoby obliczania
prawdopodobieństw . . .
P(1 < X < 2) = FX (2) − FX (1) =
Z2
f (x) dx.
1
Metody probabilistyczne informatyki
Piotr Micek
gęstość ciągłych zmiennych
Jeszcze raz własności:
f ­ 0,
R∞
f (x) dx = 1.
−∞
Metody probabilistyczne informatyki
Piotr Micek
gęstość ciągłych zmiennych
Jeszcze raz własności:
f ­ 0,
R∞
f (x) dx = 1.
−∞
Każda całkowalna funkcja spełniająca te dwa warunki jest gęstością
pewnego rozkładu absolutnie ciągłego.
Metody probabilistyczne informatyki
Piotr Micek
gęstość ciągłych zmiennych
Jeszcze raz własności:
f ­ 0,
R∞
f (x) dx = 1.
−∞
Każda całkowalna funkcja spełniająca te dwa warunki jest gęstością
pewnego rozkładu absolutnie ciągłego.
Gęstość jest tym dla rozkładu ciągłego, czym ciąg (p1 , p2 , . . .) dla
rozkładu dyskretnego. Pokazuje, jak masa prawdopodobieństwa
(= 1) rozkłada się w zbiorze R. Użycie w tym celu (w przypadku
ciągłym) prawdopodobieństw PX (x) nie ma sensu, bo najczęściej są
one wszystkie równe zero.
Metody probabilistyczne informatyki
Piotr Micek
przykład ciągły
wybór punktu
p z kwadratu jednostkowego:
X (x, y ) = x 2 + y 2 , czyli odległość od środka układu
współrzędnych
rzut patykiem na płaską powierzchnię . . .
Ω = [0, 2π] – czyli kąt pomiędzy patykiem (ustalonym
końcem), a kierunkiem północnym. Przyjmujemy, że miara
zdarzenia (α, β), to jest tego, że patyk upadł pod kątem z
powyższego przedziału jest równa:
P((α, β)) =
β−α
.
2π
Niech X (ω) = ω. Wtedy
FX (x) =



0,
x
 2π

1
Metody probabilistyczne informatyki
x ¬0
0 ¬ x < 2π
x ­ 2π
Piotr Micek