1 Rozklady dyskretne
Transkrypt
1 Rozklady dyskretne
Rachunek p-stwa 2010-2011 1 Rozklady dyskretne 1. Przeksztalcenia zmiennych losowych 2. Rozklad dwumianowy 3. Rozklad Poissona 4. Inne rozklady dyskretne 1 Przeksztalcenia zmiennych losowych Zmienna losowa X na przestrzeni probabilistycznej Ω, P Dla kazdego x ∈ Ω : P (x) = px Ponadto okreslamy funkcje f : Ω → R, Obraz: f (Ω) Definicja: Y = f (X) jest zmienna losowa X PY (y) = px x∈Ω:f (x)=y 2 Przyklady przekszalcen 1) Symetryczna kostka, f (x) = x2 , Y = X 2 : ΩY := {1, 4, 9, 16, 25, 36} P (1) = P (4) = P (9) = P (16) = P (25) = P (36) = 1/6 2) Symetryczna kostka, g(x) = (x − 3.5)2 , Z = (X − 3.5)2 : ΩZ := {2.52 , 1.52 , 0.52 } = {6.25, 2.25, 0.25} P (6.25) = p1 + p6 = 1/3 P (2.25) = p2 + p5 = 1/3 P (0.25) = p3 + p4 = 1/3 Cwiczenie: Ω = {−1, 0, 1}, P (X = −1) = P (X = 1) = 1/4, P (X = 0) = 1/2 Wyznacz rozklad Y = X 2 i Z = X 3 3 Wartosc oczekiwana funkcji zmiennej losowej Przyklad: Symetryczna kostka – kontynuacja: 1) E(f (X)) = E(Y ) = 1 · 1/6 + 4 · 1/6 + · · · + 36 · 1/6 1 + 4 + 9 + 16 + 25 + 36 = 91/6 = 15.1667 = 6 2) E(g(X)) = E(Z) = 6.25/3 + 2.25/3 + 0.25/3 = 2.9167 Ogolnie: E(f (X)) = P f (x)P (x) P yPY (y) x∈Ω Uwaga: P x∈Ω,f (x)=y f (x)P (x) = y∈f (Ω) 4 Transformacje liniowe Dla dowolnych a, b ∈ R: E(aX + b) = aE(X) + b Dowod: E(aX + b) = X (ax + b)P (x) x∈Ω = a X xP (x) + b x∈Ω = X x∈Ω aE(X) + b W szczegolnosci: E(X − µ) = E(X − E(X)) = 0 5 P (x) Momenty k-ty moment zmiennej losowej: mk := E(X k ) zk = k-ty moment centralny: E((X − µ)k ) m1 . . . srednia (wartosc oczekiwana) z2 = m2 − m21 . . . wariancja Skosnosc: ν(X) := z3 σ3 = E(X∗3 ) gdzie • ν(X) = 0 ... sugeruje symetrie • ν(X) < 0 ... lewostronnie skosny • ν(X) > 0 ... prawostronnie skosny Kurtoza: z4 σ4 = E(X∗4 ) 6 X∗ := (X − µ)/σ Cwiczenie: Skosnosc Zmienna losowa X ma nastepujacy rozklad: P (1) = 0.05, P (2) = 0.1, P (3) = 0.3, P (4) = 0.5, P (5) = 0.05 Narysuj rozklad, dystrybuante i oblicz skosnosc. Wyznacz skosnosc lekko zmodyfikowanego rozkladu P (1) = 0.05, P (2) = 0.3, P (3) = 0.3, P (4) = 0.3, P (5) = 0.05 7 1.1 Rozklad dwumianowy (binom) Proby Bernoulliego: Dwa mozliwe wyniki (0 lub 1) P (X = 0) = p, P (X = 1) = q Np. symetryczna moneta: gdzie q =1−p p = 1/2 Przyklad: Rzucamy dwa razy niesymetryczna moneta. P (reszka) = p = 0.7 Wyznacz rozklad liczby reszek Z Przestrzen probkowa ΩZ = {0, 1, 2} 8 Wyniki obu rzutow sa niezalezne! P (Z = 0) = P (X1 = 0, X2 = 0) = P (X1 = 0)P (X2 = 0) = 0.32 = 0.09 P (Z = 1) = P (X1 = 0, X2 = 1) + P (X1 = 1, X2 = 0) = = 2 · P (X1 = 0)P (X2 = 1) = 2 · 0.3 · 0.7 = 0.42 P (Z = 2) = P (X1 = 1, X2 = 1) = P (X1 = 1)P (X2 = 1) = 0.72 = 0.49 9 Rozklad dwumianowy n niezaleznych prob Bernoulliego, P (X = 1) = p Y : Liczba sukcesow (prob o wyniku 1) ma rozklad dwumianowy: n k n−k P (Y = k) = k p q Dowod: Niezaleznosc ⇒ Prawdopodobienstwo dowolnego ciagu z k sukcesami i n − k porazkami dane jest wzorem pk (1 − p)n−k Liczba takich ciagow: liczba podzbiorow k elementowych w zbiorze n elementowym (kombinacje) Notacja: Y ∼ B(n, p) Cwiczenie: Rzucamy niezaleznie piecioma symetrycznymi kostkami Wyznacz rozklad liczby reszek 10 Przyklad rozkladu dwumianowego Egzamin ktory srednio oblewa 20% studentow Rozklad liczby sukcesow wsrod 10 studentow ? 10 P (X = 7) = · 0.87 · 0.23 = 0.2013 7 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 11 6 7 8 9 10 Przyklady rozkladu dwumianowego: n = 10 p = 0.1 0.4 0.4 0.35 0.35 0.3 0.3 0.25 0.25 0.2 0.2 0.15 0.15 0.1 0.1 0.05 0.05 0 p = 0.3 0 1 2 3 4 5 6 7 8 9 0 10 0.4 0.4 0.35 0.35 0.3 0.3 0.25 0.25 0.2 0.2 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 0 10 12 p = 0.2 0 1 2 3 4 5 6 7 8 9 10 p = 0.5 0 1 2 3 4 5 6 7 8 9 10 Zastosowanie: Losowanie ze zwracaniem populacja skladajaca sie z N obiektow • M sposrod N obiektow posiada pewna wlasnosc E • Losujemy n obiektow ze zwracaniem Liczba X wylosowanych obiektow ktore posiadaja wlasnosc E ma rozklad dwumianowy: X ∼ B(n, M/N ) Cwiczenie: Urna z 3 czarnymi i 9 bialymi kulami; losujemy 5 kul ze zwracaniem, X . . . liczba wylosowanych czarnych kul • Rozklad p-stwa X? • Wartosc oczekiwana X? 13 Wartosc oczekiwana i wariancje rozkladu dwumianowego X ∼ B(n, p) X ∼ B(n, p) ⇒ ⇒ 14 E(X) = np Var (X) = npq 1.2 Rozklad Poissona (pois, mean) Ω = N0 = {0, 1, 2, · · · } Definicja: P (X = k) = Notacja: λk −λ k! e , λ>0 X ∼ P(λ) Przyklad: λ=2 P (X ≤ 1) = P (X > 4) = = 20 −2 21 −2 e + e = (1 + 2)e−2 = 0.4060 0! 1! 4 8 16 −2 1 − P (X ≤ 4) = 1 − (1 + 2 + + + )e 2 6 24 1 − 0.9473 = 0.0527 15 Przyklady rozkladu Poissona λ=1 0.4 0.4 0.35 0.35 0.3 0.3 0.25 0.25 0.2 0.2 0.15 0.15 0.1 0.1 0.05 0.05 0 λ=3 0 1 2 3 4 5 6 7 8 9 10 11 λ = 1.5 0 12 0 0.4 0.4 0.35 0.35 0.3 0.3 0.25 0.25 0.2 0.2 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 0 12 16 1 2 3 4 5 6 7 8 9 10 11 12 λ=5 0 1 2 3 4 5 6 7 8 9 10 11 12 Zastosowania Modelowanie rzadkich zdarzen Przyklady • Liczba klientow pojawiajacych sie w pewnym przedziale czasu • Rozpad radioaktywny • Liczba bledow na slajdach • Liczba ludzi ktorzy maja ponad 100 lat (na 1 000 000) • liczba falszywych alarmow w ciagu dnia • itd. 17 Srednia i wariancja X ∼ P(λ) ⇒ E(X) = λ Dowod: ∞ ∞ ∞ k X X X λ λj λk −λ −λ −λ E(X) = = λe k e =e k! (k − 1)! j! j=0 k=1 k=0 X ∼ P(λ) ⇒ Var (X) = λ Dowod: E(X 2 ) = ∞ X k=0 ∞ ∞ k k X X kλ (j + 1)λj λ −λ −λ −λ 2 e =e = λe = λ(λ+1) k k! (k − 1)! j! j=0 k=1 E(X 2 ) − E(X)2 = λ(λ + 1) − λ2 = λ 18 Przyblizenie rozkladu dwumianowego X ∼ B(n, p), gdzie n jest duze a p male (np. n > 10 i p < 0.05) ⇒ X ∼ P(np) tzn. X ma w przyblizeniu rozklad Poissona z parametrem λ = np Motywacja: Let λ := np P (X = k) = n! pk q n−k k! (n − k)! = n(n − 1) · · · (n − k + 1) λk (1 − λ/n)n · k · k! n (1 − λ/n)k Dla duzych n i umiarkowanych wartosci λ (tzn. malych p) zachodzi n(n − 1) · · · (n − k + 1) ≈1 nk i dalej P (X = k) ≈ λk k! (1−λ/n)k ≈ 1 e−λ 19 (1−λ/n)n ≈ e−λ Przyklad Porownanie dystrybuanty rozkladu Poissona (λ = 0.5) z dystrybuanta rozkladu dwumianowego (n = 10, p = 0.05) Dwumianowy: 1 P (X ≤ 3) = 0.9510 + 10 · 0.05 · 0.959 0.95 0.9 + 45 · 0.052 · 0.958 + 120 · 0.053 · 0.957 0.85 0.8 = 0.99897150206211 0.75 0.7 Przyblizenie rozkladem Poissona: 0.65 0.6 0.55 0 1 2 3 4 5 6 Niebieski: P ∼ B(10, 0.05) Zielony: P ∼ P(0.5) P (X ≤ 3) ≈ 2 3 0.5 0.5 ≈ 1 + 0.5 + + e−0.5 2 6 = 0.99824837744371 20 1.3 Inne rozklady dyskretne Omowimy • Geometryczny • Hipergeometryczny Oprocz tego • Ujemny dwumianowy • Uogolniony Poissona • itd. Patrz np. Wikipedia 21 Rozklad geometryczny (geom) Niezalezne proby Bernoulliego - p-stwo sukcesu = p X . . . liczba prob do pierwszego sukcesu P (X = k) = q k−1 p k − 1 porazek o p-stwach q = 1 − p Cwiczenie: Urna z N bialymi i M czarnymi kulami Losowanie ze zwracaniem a) P-stwo, ze bedzie potrzeba dokladnie k prob do wyrzucenia czarnej kuli b) P-stwo, ze bedzie potrzeba co najwyzej k prob do wyrzucenia czarnej kuli 22 Srednia i wariancja Zauwazmy ze ∞ P 1 1−q j q = j=0 Rozniczkujemy: ∞ P kq k−1 . Zatem E(X) = = kq d dq k−1 k=1 Rozniczkujemy drugi raz: ∞ P ∞ P qk = k=0 E(X 2 ) = k=1 Zatem k 2 q k−1 p = pq ∞ X = p p =1 1 (1−q)2 p 1 p= = (1 − q)2 p k(k − 1)q k−2 = k=1 ∞ X p 1−q q k−1 p = k=1 k=1 ∞ X ∞ P k(k − 1)q k−2 + p k=1 d2 dq 2 ∞ X ∞ P qk = k=0 kq k−1 = k=1 Var (X) = E(X 2 ) − E(X)2 = 23 2 p2 − 1 p − 1 p2 = 1−p p2 2 (1−q)3 2pq 1 + 3 p p Rozklad hipergeometryczny (hyper, M, N-M, n) Rozklad dwumianowy: Losowanie ze zwracaniem Cwiczenie: Urna, 3 czarne kule, 5 bialych kul, Losujemy 4 kule ze zwracaniem i bez zwracanie W obu przypadkach wyznacz rozklad liczby wylosowanych czarnych kul! 0.45 0.45 0.4 0.4 0.35 0.35 0.3 0.3 0.25 0.25 0.2 0.2 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 0 4 ze zwracaniem 0 1 2 3 bez zwracania 24 4 Rozklad hipergeometryczny N obiektow sposrod ktorych M ma wlasnosc E. Losujemy n obiektow bez zwracania, X liczba wylosowanych obiektow ktore posiadaja wlasnosc E. −M (Mk )(Nn−k ) P (X = k) = (Nn ) Uzywamy definicji a b = 0, gdy a < b Oczywiscie P (X = k) = 0 gdy M < k i P (X = k) = 0 if N − M < n − k Zatem: Ω = {k : max(0, n − N + M ) ≤ k ≤ min(n, M )} 25 Srednia i wariacja Bez dowodu E(X) = nM N , M N Var (X) = nM N (1 − M N −n N ) N −1 , Zdefiniujmy p := E(X) = np tak samo jak w rozkladzie dwumianowym i porownajmy z rozkladem dwumianowym −n Var (X) = np(1 − p) N asymptotycznie tak samo jak w N −1 rozkladzie dwumianowym poniewaz limN →∞ N −n N −1 =1 Jezeli N i M sa bardzo duze w porownaniu do n, to mamy w przyblizeniu X ∼ B(n, M (bez dowodu) N) 26 Przyklad rozkladu hipergeometrycznego Kontrola jakosci: Mamy 30 paczek z jajkami, 10 paczek zawiera co najmniej jedno zbite jajko, Wybieramy losowo 6 paczek • Wyznacz p-stwo, ze w dokladnie dwoch wybranych paczkach beda zbite jajka. N = 30, M = 10, n = 6 20 4 10 2 P (X = 2) = 30 6 = 0.3672 • Wartosc oczekiwana i wariancja liczby paczek ze zbitymi jajkami w naszej probie E(X) = 6 · 10 30 = 2; Var (X) = 6 · 27 1 3 · 2 3 · 24 29 = 1.1034 Cwiczenie: Przyblizenie rozkladem dwumianowym Loteria z 1000 losow, 200 losow wygrywa Kupujesz 5 losow 1. Wyznacz p-stwo, ze co najmniej jeden z twoich losow wygra Wynik: 0.6731 2. To samo z wykorzystaniem rozkladu dwumianowego Wynik: 0.6723 28 Podsumowanie rozkladow dyskretnych • Jednostajny: Ω = {x1 , . . . , xn } , • Dwumianowy: X ∼ B(n, p), E(X) = np, E(X) = p−1 , pk q n−k λk k! e−λ Ω = {0, 1, 2 . . . } P (X = k) = p q k−1 Var (X) = q p−2 • Hipergeometryczny: E(X) = np, Ω = {0, . . . , n} P (X = k) = Var (X) = λ • Geometryczny: n k P (X = k) = Var (X) = npq • Poissona: X ∼ P(λ), E(X) = λ, P (X = xk ) = 1/n P (X = k) = Ω = {1, 2 . . . } M k −n Var (X) = np(1 − p) N N −1 , 29 N −M n−k p= / N n M N