1 Rozklady dyskretne

Transkrypt

1 Rozklady dyskretne
Rachunek p-stwa
2010-2011
1
Rozklady dyskretne
1. Przeksztalcenia zmiennych losowych
2. Rozklad dwumianowy
3. Rozklad Poissona
4. Inne rozklady dyskretne
1
Przeksztalcenia zmiennych losowych
Zmienna losowa X na przestrzeni probabilistycznej Ω, P
Dla kazdego x ∈ Ω : P (x) = px
Ponadto okreslamy funkcje f : Ω → R,
Obraz: f (Ω)
Definicja: Y = f (X) jest zmienna losowa
X
PY (y) =
px
x∈Ω:f (x)=y
2
Przyklady przekszalcen
1) Symetryczna kostka, f (x) = x2 , Y = X 2 :
ΩY := {1, 4, 9, 16, 25, 36}
P (1) = P (4) = P (9) = P (16) = P (25) = P (36) = 1/6
2) Symetryczna kostka, g(x) = (x − 3.5)2 , Z = (X − 3.5)2 :
ΩZ := {2.52 , 1.52 , 0.52 } = {6.25, 2.25, 0.25}
P (6.25) = p1 + p6 = 1/3
P (2.25) = p2 + p5 = 1/3
P (0.25) = p3 + p4 = 1/3
Cwiczenie:
Ω = {−1, 0, 1},
P (X = −1) = P (X = 1) = 1/4, P (X = 0) = 1/2
Wyznacz rozklad Y = X 2 i Z = X 3
3
Wartosc oczekiwana funkcji zmiennej losowej
Przyklad: Symetryczna kostka – kontynuacja:
1)
E(f (X)) = E(Y ) = 1 · 1/6 + 4 · 1/6 + · · · + 36 · 1/6
1 + 4 + 9 + 16 + 25 + 36
= 91/6 = 15.1667
=
6
2)
E(g(X)) = E(Z) = 6.25/3 + 2.25/3 + 0.25/3 = 2.9167
Ogolnie:
E(f (X)) =
P
f (x)P (x)
P
yPY (y)
x∈Ω
Uwaga:
P
x∈Ω,f (x)=y
f (x)P (x) =
y∈f (Ω)
4
Transformacje liniowe
Dla dowolnych a, b ∈ R:
E(aX + b) = aE(X) + b
Dowod:
E(aX + b)
=
X
(ax + b)P (x)
x∈Ω
=
a
X
xP (x) + b
x∈Ω
=
X
x∈Ω
aE(X) + b
W szczegolnosci: E(X − µ) = E(X − E(X)) = 0
5
P (x)
Momenty
k-ty moment zmiennej losowej: mk := E(X k )
zk =
k-ty moment centralny:
E((X − µ)k )
m1 . . . srednia (wartosc oczekiwana)
z2 = m2 − m21 . . . wariancja
Skosnosc: ν(X) :=
z3
σ3
= E(X∗3 )
gdzie
• ν(X) = 0
...
sugeruje symetrie
• ν(X) < 0
...
lewostronnie skosny
• ν(X) > 0
...
prawostronnie skosny
Kurtoza:
z4
σ4
= E(X∗4 )
6
X∗ := (X − µ)/σ
Cwiczenie: Skosnosc
Zmienna losowa X ma nastepujacy rozklad:
P (1) = 0.05, P (2) = 0.1, P (3) = 0.3, P (4) = 0.5, P (5) = 0.05
Narysuj rozklad, dystrybuante i oblicz skosnosc.
Wyznacz skosnosc lekko zmodyfikowanego rozkladu
P (1) = 0.05, P (2) = 0.3, P (3) = 0.3, P (4) = 0.3, P (5) = 0.05
7
1.1
Rozklad dwumianowy (binom)
Proby Bernoulliego: Dwa mozliwe wyniki (0 lub 1)
P (X = 0) = p,
P (X = 1) = q
Np. symetryczna moneta:
gdzie
q =1−p
p = 1/2
Przyklad: Rzucamy dwa razy niesymetryczna moneta.
P (reszka) = p = 0.7
Wyznacz rozklad liczby reszek Z
Przestrzen probkowa ΩZ = {0, 1, 2}
8
Wyniki obu rzutow sa niezalezne!
P (Z = 0) = P (X1 = 0, X2 = 0) = P (X1 = 0)P (X2 = 0) = 0.32 = 0.09
P (Z = 1) = P (X1 = 0, X2 = 1) + P (X1 = 1, X2 = 0) =
= 2 · P (X1 = 0)P (X2 = 1) = 2 · 0.3 · 0.7 = 0.42
P (Z = 2) = P (X1 = 1, X2 = 1) = P (X1 = 1)P (X2 = 1) = 0.72 = 0.49
9
Rozklad dwumianowy
n niezaleznych prob Bernoulliego, P (X = 1) = p
Y : Liczba sukcesow (prob o wyniku 1) ma rozklad dwumianowy:
n k n−k
P (Y = k) = k p q
Dowod: Niezaleznosc ⇒ Prawdopodobienstwo dowolnego
ciagu z k sukcesami i n − k porazkami dane jest wzorem
pk (1 − p)n−k
Liczba takich ciagow: liczba podzbiorow k elementowych w zbiorze
n elementowym (kombinacje)
Notacja: Y ∼ B(n, p)
Cwiczenie: Rzucamy niezaleznie piecioma symetrycznymi
kostkami
Wyznacz rozklad liczby reszek
10
Przyklad rozkladu dwumianowego
Egzamin ktory srednio oblewa 20% studentow
Rozklad liczby sukcesow wsrod 10 studentow ?
10
P (X = 7) =
· 0.87 · 0.23 = 0.2013
7
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
11
6
7
8
9
10
Przyklady rozkladu dwumianowego: n = 10
p = 0.1
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
p = 0.3
0
1
2
3
4
5
6
7
8
9
0
10
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
0
1
2
3
4
5
6
7
8
9
0
10
12
p = 0.2
0
1
2
3
4
5
6
7
8
9
10
p = 0.5
0
1
2
3
4
5
6
7
8
9
10
Zastosowanie: Losowanie ze zwracaniem
populacja skladajaca sie z N obiektow
• M sposrod N obiektow posiada pewna wlasnosc E
• Losujemy n obiektow ze zwracaniem
Liczba X wylosowanych obiektow ktore posiadaja wlasnosc E ma
rozklad dwumianowy:
X ∼ B(n, M/N )
Cwiczenie: Urna z 3 czarnymi i 9 bialymi kulami; losujemy 5 kul ze
zwracaniem, X . . . liczba wylosowanych czarnych kul
• Rozklad p-stwa X?
• Wartosc oczekiwana X?
13
Wartosc oczekiwana i wariancje rozkladu
dwumianowego
X ∼ B(n, p)
X ∼ B(n, p)
⇒
⇒
14
E(X) = np
Var (X) = npq
1.2
Rozklad Poissona (pois, mean)
Ω = N0 = {0, 1, 2, · · · }
Definicja:
P (X = k) =
Notacja:
λk −λ
k! e
,
λ>0
X ∼ P(λ)
Przyklad:
λ=2
P (X ≤ 1)
=
P (X > 4)
=
=
20 −2 21 −2
e + e = (1 + 2)e−2 = 0.4060
0!
1!
4 8 16 −2
1 − P (X ≤ 4) = 1 − (1 + 2 + + + )e
2 6 24
1 − 0.9473 = 0.0527
15
Przyklady rozkladu Poissona
λ=1
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
λ=3
0
1
2
3
4
5
6
7
8
9
10
11
λ = 1.5
0
12
0
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
0
1
2
3
4
5
6
7
8
9
10
11
0
12
16
1
2
3
4
5
6
7
8
9
10
11
12
λ=5
0
1
2
3
4
5
6
7
8
9
10
11
12
Zastosowania
Modelowanie rzadkich zdarzen
Przyklady
• Liczba klientow pojawiajacych sie w pewnym przedziale czasu
• Rozpad radioaktywny
• Liczba bledow na slajdach
• Liczba ludzi ktorzy maja ponad 100 lat (na 1 000 000)
• liczba falszywych alarmow w ciagu dnia
• itd.
17
Srednia i wariancja
X ∼ P(λ)
⇒
E(X) = λ
Dowod:
∞
∞
∞
k
X
X
X
λ
λj
λk −λ
−λ
−λ
E(X) =
= λe
k e =e
k!
(k − 1)!
j!
j=0
k=1
k=0
X ∼ P(λ)
⇒
Var (X) = λ
Dowod:
E(X 2 ) =
∞
X
k=0
∞
∞
k
k
X
X
kλ
(j + 1)λj
λ
−λ
−λ
−λ
2
e =e
= λe
= λ(λ+1)
k
k!
(k − 1)!
j!
j=0
k=1
E(X 2 ) − E(X)2 = λ(λ + 1) − λ2 = λ
18
Przyblizenie rozkladu dwumianowego
X ∼ B(n, p), gdzie n jest duze a p male (np. n > 10 i p < 0.05)
⇒ X ∼ P(np)
tzn. X ma w przyblizeniu rozklad Poissona z parametrem λ = np
Motywacja: Let λ := np
P (X = k)
=
n!
pk q n−k
k! (n − k)!
=
n(n − 1) · · · (n − k + 1) λk (1 − λ/n)n
· k ·
k!
n (1 − λ/n)k
Dla duzych n i umiarkowanych wartosci λ (tzn. malych p) zachodzi
n(n − 1) · · · (n − k + 1)
≈1
nk
i dalej P (X = k) ≈
λk
k!
(1−λ/n)k ≈ 1
e−λ
19
(1−λ/n)n ≈ e−λ
Przyklad
Porownanie dystrybuanty rozkladu Poissona (λ = 0.5) z
dystrybuanta rozkladu dwumianowego (n = 10, p = 0.05)
Dwumianowy:
1
P (X ≤ 3) = 0.9510 + 10 · 0.05 · 0.959
0.95
0.9
+ 45 · 0.052 · 0.958 + 120 · 0.053 · 0.957
0.85
0.8
= 0.99897150206211
0.75
0.7
Przyblizenie rozkladem Poissona:
0.65
0.6
0.55
0
1
2
3
4
5
6
Niebieski: P ∼ B(10, 0.05)
Zielony: P ∼ P(0.5)
P (X ≤ 3) ≈
2
3
0.5
0.5
≈ 1 + 0.5 +
+
e−0.5
2
6
= 0.99824837744371
20
1.3
Inne rozklady dyskretne
Omowimy
• Geometryczny
• Hipergeometryczny
Oprocz tego
• Ujemny dwumianowy
• Uogolniony Poissona
• itd.
Patrz np. Wikipedia
21
Rozklad geometryczny (geom)
Niezalezne proby Bernoulliego - p-stwo sukcesu = p
X . . . liczba prob do pierwszego sukcesu
P (X = k) = q k−1 p
k − 1 porazek o p-stwach q = 1 − p
Cwiczenie: Urna z N bialymi i M czarnymi kulami
Losowanie ze zwracaniem
a) P-stwo, ze bedzie potrzeba dokladnie k prob do wyrzucenia
czarnej kuli
b) P-stwo, ze bedzie potrzeba co najwyzej k prob do wyrzucenia
czarnej kuli
22
Srednia i wariancja
Zauwazmy ze
∞
P
1
1−q
j
q =
j=0
Rozniczkujemy:
∞
P
kq
k−1
. Zatem
E(X) =
=
kq
d
dq
k−1
k=1
Rozniczkujemy drugi raz:
∞
P
∞
P
qk =
k=0
E(X 2 ) =
k=1
Zatem
k 2 q k−1 p = pq
∞
X
=
p
p
=1
1
(1−q)2
p
1
p=
=
(1 − q)2
p
k(k − 1)q
k−2
=
k=1
∞
X
p
1−q
q k−1 p =
k=1
k=1
∞
X
∞
P
k(k − 1)q k−2 + p
k=1
d2
dq 2
∞
X
∞
P
qk =
k=0
kq k−1 =
k=1
Var (X) = E(X 2 ) − E(X)2 =
23
2
p2
−
1
p
−
1
p2
=
1−p
p2
2
(1−q)3
2pq 1
+
3
p
p
Rozklad hipergeometryczny (hyper, M, N-M, n)
Rozklad dwumianowy: Losowanie ze zwracaniem
Cwiczenie: Urna, 3 czarne kule, 5 bialych kul,
Losujemy 4 kule ze zwracaniem i bez zwracanie
W obu przypadkach wyznacz rozklad liczby wylosowanych
czarnych kul!
0.45
0.45
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
0
1
2
3
0
4
ze zwracaniem
0
1
2
3
bez zwracania
24
4
Rozklad hipergeometryczny
N obiektow sposrod ktorych M ma wlasnosc E. Losujemy n
obiektow bez zwracania, X liczba wylosowanych obiektow ktore
posiadaja wlasnosc E.
−M
(Mk )(Nn−k
)
P (X = k) =
(Nn )
Uzywamy definicji
a
b
= 0,
gdy a < b
Oczywiscie P (X = k) = 0 gdy M < k
i P (X = k) = 0 if N − M < n − k
Zatem:
Ω = {k : max(0, n − N + M ) ≤ k ≤ min(n, M )}
25
Srednia i wariacja
Bez dowodu
E(X) =
nM
N ,
M
N
Var (X) =
nM
N (1
−
M N −n
N ) N −1 ,
Zdefiniujmy
p :=
E(X) = np
tak samo jak w rozkladzie dwumianowym
i porownajmy z rozkladem dwumianowym
−n
Var (X) = np(1 − p) N
asymptotycznie tak samo jak w
N −1
rozkladzie dwumianowym
poniewaz
limN →∞
N −n
N −1
=1
Jezeli N i M sa bardzo duze w porownaniu do n, to mamy w
przyblizeniu X ∼ B(n, M
(bez dowodu)
N)
26
Przyklad rozkladu hipergeometrycznego
Kontrola jakosci: Mamy 30 paczek z jajkami,
10 paczek zawiera co najmniej jedno zbite jajko,
Wybieramy losowo 6 paczek
• Wyznacz p-stwo, ze w dokladnie dwoch wybranych paczkach
beda zbite jajka.
N = 30, M = 10, n = 6
20
4
10
2
P (X = 2) =
30
6
= 0.3672
• Wartosc oczekiwana i wariancja liczby paczek ze zbitymi
jajkami w naszej probie
E(X) = 6 ·
10
30
= 2;
Var (X) = 6 ·
27
1
3
·
2
3
·
24
29
= 1.1034
Cwiczenie: Przyblizenie rozkladem dwumianowym
Loteria z 1000 losow, 200 losow wygrywa
Kupujesz 5 losow
1. Wyznacz p-stwo, ze co najmniej jeden z twoich losow wygra
Wynik: 0.6731
2. To samo z wykorzystaniem rozkladu dwumianowego
Wynik: 0.6723
28
Podsumowanie rozkladow dyskretnych
• Jednostajny: Ω = {x1 , . . . , xn } ,
• Dwumianowy: X ∼ B(n, p),
E(X) = np,
E(X) = p−1 ,
pk q n−k
λk
k!
e−λ
Ω = {0, 1, 2 . . . }
P (X = k) = p q k−1
Var (X) = q p−2
• Hipergeometryczny:
E(X) = np,
Ω = {0, . . . , n}
P (X = k) =
Var (X) = λ
• Geometryczny:
n
k
P (X = k) =
Var (X) = npq
• Poissona: X ∼ P(λ),
E(X) = λ,
P (X = xk ) = 1/n
P (X = k) =
Ω = {1, 2 . . . }
M
k
−n
Var (X) = np(1 − p) N
N −1 ,
29
N −M
n−k
p=
/
N
n
M
N