Wykład 2 Prawdopodobieństwo warunkowe Dwukrotny rzut
Transkrypt
Wykład 2 Prawdopodobieństwo warunkowe Dwukrotny rzut
Wykład 2 Prawdopodobieństwo warunkowe Dwukrotny rzut symetryczną monetą • Ω = {OO, OR, RO, RR}. • Zdarzenia: A=wypadną dwa orły, B=w pierwszym rzucie orzeł. • P (A) = 41 , P (B) = 21 . • Jeżeli już wykonaliśmy pierwszy rzut i wiemy, że wypadł orzeł, to ... • Musimy zmienić zbiór zdarzeń elementarnych. Nowa Ω = {OO, OR}. • P (A pod warunkiem zdarzenia B) = 1 2 Jak to obliczyliśmy? • Gdy wiemy, że zdarzyło się B, to Ω −→ Ω1 = B = {OO, OR}. • Prawdopodobieństwa obu zdarzeń są jednakowe, więc P (OO) = 12 . • Inaczej: P (A | B) = P (A ∩ B) 1/4 1 = = . P (B) 1/2 2 • Taki sam wzór można stosować ogólnie, jeśli tylko P (B) > 0. Definicja prawdopodobieństwa warunkowego Niech P (B) > 0. Prawdopodobieństwem warunkowym zdarzenia A pod warunkiem B nazywamy liczbę P (A | B) = P (A ∩ B) . P (B) Zadanie • Zakładamy, że wszystkie układy dwójki dzieci: cc, cd, dc, dd są jednakowo prawdopodobne. • Spośród rodzin z dwójką dzieci losujemy jedną rodzinę. Obliczyć prawdopodobieństwo, że wylosujemy rodzinę z dwoma chłopcami, jeżeli wiemy, że • a) starsze dziecko jest chłopcem, • b) w tej rodzinie jest co najmniej jeden chłopiec, • ż) jedno z dzieci ma na drugie imię Maria? Rozwiązanie • Spróbujmy odgadnąć odpowiedzi! • Ω = {cc, cd, dc, dd} • a) z założenia starsze dziecko jest chłopcem, więc B = {cc, cd} • P (A | B) = P ({cc} | {cc, cd}) = P ({cc} ∩ {cc, cd}) P ({cc}) 1/4 1 = = = . P ({cc, cd}) P ({cc, cd}) 1/2 2 • b) Tutaj B = {cc, cd, dc}, więc 1 • P ({cc} | {cc, cd, dc}) = P ({cc} ∩ {cc, cd, dc}) P ({cc}) 1 = = . P (B) P ({cc, cd, dc}) 3 • To chyba mało intuicyjna odpowiedź? Ostrzeżenie: intuicja może mylić! • Gdy P (A) > 0 i P (B) > 0, to zachodzi równoważność: • P (A | B) > P (A) ⇔ P (B | A) > P (B). • Dowód: każda ze stron jest równoważna nierówności P (A ∩ B) > P (A) · P (B). • Zatem: zajście A zwiększa szanse B ⇔ zajście B zwiększa szanse A. • Czyżby zdarzenia A i B „przyciągały się” wzajemnie? Wzór na prawdopodobieństwo iloczynu Danych jest n zdarzeń: A1 , A2 , ..., An . Jeżeli P (A1 ∩ A2 ∩ ... ∩ An−1 ) > 0, to P (A1 ∩ A2 ∩ ... ∩ An ) = P (A1 ) · P (A2 | A1 ) · P (A3 | A1 ∩ A2 ) · P (A4 | A1 ∩ A2 ∩ A3 ) · ... · P (An | A1 ∩ ... ∩ An−1 ). Dowód • Skoro P (A1 ∩ A2 ∩ ... ∩ An−1 ) > 0, to wszystkie prawdopodobieństwa warunkowe są dobrze określone. • Prawa strona wzoru = P (A1 ) · P (A2 ∩ A1 ) P (A3 ∩ A2 ∩ A1 ) P (An ∩ An−1 ∩ ... ∩ A1 ) · · ... · = P (A1 ) P (A1 ∩ A2 ) P (An−1 ∩ ... ∩ A1 ) • = P (An ∩ An−1 ∩ ... ∩ A1 ) = Lewa strona wzoru. Metoda drzew • Wzór na prawdopodobieństwo iloczynu to teoretyczna podstawa „metody drzew”. • Prawdopodobieństwo przypisywane każdej gałęzi to iloczyn prawdopodobieństw kolejnych kawałków tej gałęzi. Czy to sprawiedliwy egzamin? Na egzamin, do którego ma przystąpić 10 studentów, wykładowca przygotował (i ogłosił publicznie) 10 zagadnień. Egzamin polega na wylosowaniu jednego zestawu spośród tych dziesięciu i odpowiedzi. Zestawy już wylosowane odrzuca się. Jacek zdążył przygotować tylko 5 spośród tych zagadnień. Jakie jest prawdopodobieństwo, że Jacek zda ten egzamin, jeśli będzie zdawał jako: • a) pierwszy? • b) drugi? • c) trzeci? 2 • d) dziesiąty? Rozwiązanie • a) Gdy Jacek wejdzie pierwszy, to oczywiscie P (zda) = 5 1 = . 10 2 • b) Gdy wejdzie drugi, to musimy uwzględnić, jaki zestaw wylosowała pierwsza osoba. • Jeśli taki, który był „dobry” dla Jacka, to szanse Jacka spadły z • Jeśli taki, który był „zły” dla Jacka, to szanse Jacka wzrosły z 1 4 do . 2 9 1 5 do . 2 9 • Rysujemy drzewo i obliczamy:... Odpowiedź • a) 1 1 1 1 , b) , c) , d) . 2 2 2 2 • Ten sposób egzaminowania jest sprawiedliwy! • Czy ostatnia osoba też dostaje swój zestaw losowo? Rozbicie zbioru Ω Rozbiciem zbioru Ω nazywamy taką rodzinę zdarzeń B1 , B2 , ..., Bn , która spełnia dwa warunki: • B1 ∪ B2 ∪ ... ∪ Bn = Ω, • Bi ∩ Bj = ∅, gdy i 6= j. Wzór na prawdopodobieństwo całkowite Niech B1 , B2 , ..., Bn będzie rozbiciem zbioru Ω na zbiory o dodatnim prawdopodobieństwie. Wówczas dla dowolnego zdarzenia A zachodzi równość: P (A) = P (A |B1 ) · P (B1 ) + P (A |B2 ) · P (B2 ) + ... + P (A |Bn ) · P (Bn ). Dowód Na mocy założeń o B1 , B2 , ..., Bn mamy P (A) = P (A ∩ Ω) = P A∩ n [ !! Bi i=1 = n X P (A ∩ Bi ) = i=1 n X =P n [ (A ∩ Bi ) i=1 P (A | Bi ) · P (Bi ). i=1 Zadanie Mamy dwie urny: • w U1 jest 1 kula biała i 3 czarne, • w U2 jest 5 kul białych i 2 czarne. • Za pomocą monety losujemy urnę i wyciągamy z niej jedną kulę. • Oblicz prawdopodobieństwo, że będzie to kula biała. 3 ! = Rozwiązanie • Obliczamy prawdopodobieństwa warunkowe: • P (B | U1 ) = 14 , • P (B | U2 ) = 57 , • P (B) = P (B | U1 ) · P (U1 ) + P (B | U2 ) · P (U2 ) = 1 4 · 1 2 + 5 7 · 1 2 = 1 8 + 5 14 . Prawdopodobieństwo przyczyny • Przypuśćmy, że znamy skutek (np. wypadek drogowy), a chcemy ustalić „przyczynę”. • To może być nadmierna prędkość. • albo nietrzeźwość kierowcy, • albo awaria samochodu (hamulce itp). Zadanie o daltonistach • Na 10 000 kobiet 25, a na 100 mężczyzn 5 to daltoniści. • Z grupy o jednakowej liczbie kobiet i mężczyzn wybrano losowo jedną osobę. • Okazało się, że ta osoba nie rozróżnia kolorów. • Oblicz prawdopodobieństwo, że to jest mężczyzna. Rozwiązanie Wprowadzamy oznaczenia: • K - wylosowanie kobiety, M - wylosowanie mężczyzny, K ∪ M = Ω, K ∩ M = ∅. • D - wylosowana osoba nie rozróżnia kolorów Rozwiązanie Z danych zadania: • P (D | K) = 25 10 000 , P (D | M ) = 5 100 , • P (K) = P (M ) = 12 . Zastosujmy definicję prawdopodobieństwa warunkowego i wzór na prawdopodobieństwo całkowite: P (M | D) = P (M ∩ D) P (D | M ) · P (M ) = = P (D) P (D | M ) · P (M ) + P (D | K) · P (K) 5 100 · 5 1 100 · 2 1 25 2 + 10 000 · 1 2 = 500 . 525 Wzór Bayesa na „prawdopodobieństwo przyczyny” • Niech B1 , B2 , ..., Bn będzie rozbiciem Ω na zbiory o dodatnim prawdopodobieństwie. • Niech A będzie zdarzeniem o dodatnim prawdopodobieństwie. Wówczas dla każdego k = 1, ..., n 4 • P (Bk | A) = P (A | Bk ) · P (Bk ) . P (A | B1 ) · P (B1 ) + P (A | B2 ) · P (B2 ) + ... + P (A | Bn ) · P (Bn ) Dowód • Dokładnie tak, jak dla dwóch zdarzeń w zadaniu o daltonistach liczymy: • Lewa strona = P (Bk | A)= • P (Bk ∩ A) P (A | Bk ) · P (Bk ) = = ... = Prawa strona. P (A) P (A) Czy ten test jest dobry? Pewien gen obecny jest u jednej osoby na 1000. Opracowano test do badania jego obecności. Test jednak czasami myli się: • wykrywa rzeczywistą obecność genu w 98 przypadkach na 100, • a w przypadku braku genu stwierdza jego obecność w 3 przypadkach na 100. • Wylosowano jedną osobę i test stwierdził u niej obecność tego genu. • Oblicz prawdopodobieństwo, że tak jest naprawdę, tzn. wylosowana osoba ma ten gen. • Jakiej rady można udzielić wynalazcy tego testu? Rozwiązanie • Niech + oznacza, ze wylosowana osoba ma ten gen, a −, że go nie ma. • Jest to typowa sytuacja podpadająca pod wzór Bayesa: Ω = + ∪ − oraz + ∩ − = ∅. • Niech W oznacza, że test „wykrył” gen. Z danych zadania • P (+) = 1 1000 , • P (W | +) = 999 1000 . P (−) = 98 100 , P (W | −) = 3 100 . • Musimy obliczyć: P (+ | W ) =? Stosujemy wzór Bayesa Dokładnie tak, jak w zadaniu o daltonistach: P (+ | W ) = = P (+ ∩ W ) P (W | +) · P (+) = = P (W ) P (W | +) · P (+) + P (W | −) · P (−) 98 100 · 98 100 1 1000 1 · 1000 3 + 100 · = 999 1000 98 ≈ 0, 03. 98 + 3 · 999 Jak poprawić test? • Nie zmienimy 1 1000 oraz 999 1000 . • Poprawienie wykrywalności z • Trzeba zmniejszyć liczbę 3 100 98 100 nawet do 100 100 na przykład na przypadków niewiele poprawia. 3 1000 . 5 Wtedy mielibyśmy 98 98+3·99,9 ≈ 0, 246.