Wykład 2 Prawdopodobieństwo warunkowe Dwukrotny rzut

Transkrypt

Wykład 2 Prawdopodobieństwo warunkowe Dwukrotny rzut
Wykład 2
Prawdopodobieństwo warunkowe
Dwukrotny rzut symetryczną monetą
• Ω = {OO, OR, RO, RR}.
• Zdarzenia: A=wypadną dwa orły, B=w pierwszym rzucie orzeł.
• P (A) = 41 ,
P (B) = 21 .
• Jeżeli już wykonaliśmy pierwszy rzut i wiemy, że wypadł orzeł, to ...
• Musimy zmienić zbiór zdarzeń elementarnych. Nowa Ω = {OO, OR}.
• P (A pod warunkiem zdarzenia B) =
1
2
Jak to obliczyliśmy?
• Gdy wiemy, że zdarzyło się B, to Ω −→ Ω1 = B = {OO, OR}.
• Prawdopodobieństwa obu zdarzeń są jednakowe, więc P (OO) = 12 .
• Inaczej:
P (A | B) =
P (A ∩ B)
1/4
1
=
= .
P (B)
1/2
2
• Taki sam wzór można stosować ogólnie, jeśli tylko P (B) > 0.
Definicja prawdopodobieństwa warunkowego
Niech P (B) > 0. Prawdopodobieństwem warunkowym zdarzenia A pod warunkiem B nazywamy liczbę
P (A | B) =
P (A ∩ B)
.
P (B)
Zadanie
• Zakładamy, że wszystkie układy dwójki dzieci: cc, cd, dc, dd są jednakowo prawdopodobne.
• Spośród rodzin z dwójką dzieci losujemy jedną rodzinę. Obliczyć prawdopodobieństwo, że wylosujemy
rodzinę z dwoma chłopcami, jeżeli wiemy, że
• a) starsze dziecko jest chłopcem,
• b) w tej rodzinie jest co najmniej jeden chłopiec,
• ż) jedno z dzieci ma na drugie imię Maria?
Rozwiązanie
• Spróbujmy odgadnąć odpowiedzi!
• Ω = {cc, cd, dc, dd}
• a) z założenia starsze dziecko jest chłopcem, więc B = {cc, cd}
•
P (A | B) = P ({cc} | {cc, cd}) =
P ({cc} ∩ {cc, cd})
P ({cc})
1/4
1
=
=
= .
P ({cc, cd})
P ({cc, cd})
1/2
2
• b) Tutaj B = {cc, cd, dc}, więc
1
•
P ({cc} | {cc, cd, dc}) =
P ({cc} ∩ {cc, cd, dc})
P ({cc})
1
=
= .
P (B)
P ({cc, cd, dc})
3
• To chyba mało intuicyjna odpowiedź?
Ostrzeżenie: intuicja może mylić!
• Gdy P (A) > 0 i P (B) > 0, to zachodzi równoważność:
•
P (A | B) > P (A)
⇔
P (B | A) > P (B).
• Dowód: każda ze stron jest równoważna nierówności P (A ∩ B) > P (A) · P (B).
• Zatem:
zajście A zwiększa szanse B ⇔ zajście B zwiększa szanse A.
• Czyżby zdarzenia A i B „przyciągały się” wzajemnie?
Wzór na prawdopodobieństwo iloczynu
Danych jest n zdarzeń: A1 , A2 , ..., An . Jeżeli P (A1 ∩ A2 ∩ ... ∩ An−1 ) > 0, to
P (A1 ∩ A2 ∩ ... ∩ An ) =
P (A1 ) · P (A2 | A1 ) · P (A3 | A1 ∩ A2 ) · P (A4 | A1 ∩ A2 ∩ A3 ) · ... · P (An | A1 ∩ ... ∩ An−1 ).
Dowód
• Skoro P (A1 ∩ A2 ∩ ... ∩ An−1 ) > 0, to wszystkie prawdopodobieństwa warunkowe są dobrze określone.
• Prawa strona wzoru =
P (A1 ) ·
P (A2 ∩ A1 ) P (A3 ∩ A2 ∩ A1 )
P (An ∩ An−1 ∩ ... ∩ A1 )
·
· ... ·
=
P (A1 )
P (A1 ∩ A2 )
P (An−1 ∩ ... ∩ A1 )
• = P (An ∩ An−1 ∩ ... ∩ A1 ) = Lewa strona wzoru.
Metoda drzew
• Wzór na prawdopodobieństwo iloczynu to teoretyczna podstawa „metody drzew”.
• Prawdopodobieństwo przypisywane każdej gałęzi to iloczyn prawdopodobieństw kolejnych kawałków
tej gałęzi.
Czy to sprawiedliwy egzamin?
Na egzamin, do którego ma przystąpić 10 studentów, wykładowca przygotował (i ogłosił publicznie) 10
zagadnień. Egzamin polega na wylosowaniu jednego zestawu spośród tych dziesięciu i odpowiedzi. Zestawy
już wylosowane odrzuca się. Jacek zdążył przygotować tylko 5 spośród tych zagadnień. Jakie jest prawdopodobieństwo, że Jacek zda ten egzamin, jeśli będzie zdawał jako:
• a) pierwszy?
• b) drugi?
• c) trzeci?
2
• d) dziesiąty?
Rozwiązanie
• a) Gdy Jacek wejdzie pierwszy, to oczywiscie P (zda) =
5
1
= .
10
2
• b) Gdy wejdzie drugi, to musimy uwzględnić, jaki zestaw wylosowała pierwsza osoba.
• Jeśli taki, który był „dobry” dla Jacka, to szanse Jacka spadły z
• Jeśli taki, który był „zły” dla Jacka, to szanse Jacka wzrosły z
1
4
do .
2
9
1
5
do .
2
9
• Rysujemy drzewo i obliczamy:...
Odpowiedź
• a)
1
1
1
1
, b) , c) , d) .
2
2
2
2
• Ten sposób egzaminowania jest sprawiedliwy!
• Czy ostatnia osoba też dostaje swój zestaw losowo?
Rozbicie zbioru Ω
Rozbiciem zbioru Ω nazywamy taką rodzinę zdarzeń B1 , B2 , ..., Bn , która spełnia dwa warunki:
• B1 ∪ B2 ∪ ... ∪ Bn = Ω,
• Bi ∩ Bj = ∅, gdy i 6= j.
Wzór na prawdopodobieństwo całkowite
Niech B1 , B2 , ..., Bn będzie rozbiciem zbioru Ω na zbiory o dodatnim prawdopodobieństwie.
Wówczas dla dowolnego zdarzenia A zachodzi równość:
P (A) = P (A |B1 ) · P (B1 ) + P (A |B2 ) · P (B2 ) + ... + P (A |Bn ) · P (Bn ).
Dowód
Na mocy założeń o B1 , B2 , ..., Bn mamy
P (A) = P (A ∩ Ω) = P
A∩
n
[
!!
Bi
i=1
=
n
X
P (A ∩ Bi ) =
i=1
n
X
=P
n
[
(A ∩ Bi )
i=1
P (A | Bi ) · P (Bi ).
i=1
Zadanie
Mamy dwie urny:
• w U1 jest 1 kula biała i 3 czarne,
• w U2 jest 5 kul białych i 2 czarne.
• Za pomocą monety losujemy urnę i wyciągamy z niej jedną kulę.
• Oblicz prawdopodobieństwo, że będzie to kula biała.
3
!
=
Rozwiązanie
• Obliczamy prawdopodobieństwa warunkowe:
• P (B | U1 ) = 14 ,
• P (B | U2 ) = 57 ,
• P (B) = P (B | U1 ) · P (U1 ) + P (B | U2 ) · P (U2 ) =
1
4
·
1
2
+
5
7
·
1
2
=
1
8
+
5
14 .
Prawdopodobieństwo przyczyny
• Przypuśćmy, że znamy skutek (np. wypadek drogowy), a chcemy ustalić „przyczynę”.
• To może być nadmierna prędkość.
• albo nietrzeźwość kierowcy,
• albo awaria samochodu (hamulce itp).
Zadanie o daltonistach
• Na 10 000 kobiet 25, a na 100 mężczyzn 5 to daltoniści.
• Z grupy o jednakowej liczbie kobiet i mężczyzn wybrano losowo jedną osobę.
• Okazało się, że ta osoba nie rozróżnia kolorów.
• Oblicz prawdopodobieństwo, że to jest mężczyzna.
Rozwiązanie
Wprowadzamy oznaczenia:
• K - wylosowanie kobiety, M - wylosowanie mężczyzny, K ∪ M = Ω, K ∩ M = ∅.
• D - wylosowana osoba nie rozróżnia kolorów
Rozwiązanie
Z danych zadania:
• P (D | K) =
25
10 000 ,
P (D | M ) =
5
100 ,
• P (K) = P (M ) = 12 .
Zastosujmy definicję prawdopodobieństwa warunkowego i wzór na prawdopodobieństwo całkowite:
P (M | D) =
P (M ∩ D)
P (D | M ) · P (M )
=
=
P (D)
P (D | M ) · P (M ) + P (D | K) · P (K)
5
100
·
5
1
100 · 2
1
25
2 + 10 000
·
1
2
=
500
.
525
Wzór Bayesa na „prawdopodobieństwo przyczyny”
• Niech B1 , B2 , ..., Bn będzie rozbiciem Ω na zbiory o dodatnim prawdopodobieństwie.
• Niech A będzie zdarzeniem o dodatnim prawdopodobieństwie. Wówczas dla każdego k = 1, ..., n
4
•
P (Bk | A) =
P (A | Bk ) · P (Bk )
.
P (A | B1 ) · P (B1 ) + P (A | B2 ) · P (B2 ) + ... + P (A | Bn ) · P (Bn )
Dowód
• Dokładnie tak, jak dla dwóch zdarzeń w zadaniu o daltonistach liczymy:
• Lewa strona = P (Bk | A)=
•
P (Bk ∩ A)
P (A | Bk ) · P (Bk )
=
= ... = Prawa strona.
P (A)
P (A)
Czy ten test jest dobry?
Pewien gen obecny jest u jednej osoby na 1000. Opracowano test do badania jego obecności. Test jednak
czasami myli się:
• wykrywa rzeczywistą obecność genu w 98 przypadkach na 100,
• a w przypadku braku genu stwierdza jego obecność w 3 przypadkach na 100.
• Wylosowano jedną osobę i test stwierdził u niej obecność tego genu.
• Oblicz prawdopodobieństwo, że tak jest naprawdę, tzn. wylosowana osoba ma ten gen.
• Jakiej rady można udzielić wynalazcy tego testu?
Rozwiązanie
• Niech + oznacza, ze wylosowana osoba ma ten gen, a −, że go nie ma.
• Jest to typowa sytuacja podpadająca pod wzór Bayesa: Ω = + ∪ −
oraz
+ ∩ − = ∅.
• Niech W oznacza, że test „wykrył” gen.
Z danych zadania
• P (+) =
1
1000 ,
• P (W | +) =
999
1000 .
P (−) =
98
100 ,
P (W | −) =
3
100 .
• Musimy obliczyć:
P (+ | W ) =?
Stosujemy wzór Bayesa
Dokładnie tak, jak w zadaniu o daltonistach:
P (+ | W ) =
=
P (+ ∩ W )
P (W | +) · P (+)
=
=
P (W )
P (W | +) · P (+) + P (W | −) · P (−)
98
100
·
98
100
1
1000
1
· 1000
3
+ 100
·
=
999
1000
98
≈ 0, 03.
98 + 3 · 999
Jak poprawić test?
• Nie zmienimy
1
1000
oraz
999
1000 .
• Poprawienie wykrywalności z
• Trzeba zmniejszyć liczbę
3
100
98
100
nawet do
100
100
na przykład na
przypadków niewiele poprawia.
3
1000 .
5
Wtedy mielibyśmy
98
98+3·99,9
≈ 0, 246.

Podobne dokumenty