Prawdopodobienstwo i statystyka
Transkrypt
Prawdopodobienstwo i statystyka
Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw 18 października 2016 Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Dlaczego wybór przestrzeni probabilistycznej jest tak ważny? Przestrzeń probabilistyczna jest modelem eksperymentu losowego, który jest dla nas interesujący. Wybór złego modelu prowadzi do niewłaściwych prognoz lub interpretacji. Wiele z tak zwanych „paradoksów probabilistycznych” jest związanych z nieprecyzyjnym sformułowaniem dopuszczającym rozmaite modele probabilistyczne. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Dlaczego wybór przestrzeni probabilistycznej jest tak ważny? Przykład: Paradoks Kawalera (Chevalier) de Méré Francuski (lub flamandzki) gracz i pisarz, znany jako „Chevalier de Méré” i żyjący w XVII wieku, uważał, że wyrzucenie przynajmniej jednej „szóstki” w 4 rzutach kostką ma to samo prawdopodobieństwo, co uzyskanie przynajmniej jednej pary „szóstek” w 24 rzutach dwiema kostkami. Spotkały go nieprzyjemne konsekwencje finansowe tego przekonania. Dlatego zwrócił się do Błażeja Pascala o pomoc w rozwikłaniu zagadki. I Pascal (jak również Piotr de Fermat) znalazł właściwe rozwiązanie. Zob. np. https://www.boundless.com/statistics/textbooks/boundlessstatistics-textbook/probability-8/more-about-chance-35/theparadox-of-the-chevalier-de-mere-176-4450/ Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Dlaczego wybór przestrzeni probabilistycznej jest tak ważny? Przykład: Wariant paradoksu Kawalera de Méré Rzucając trzema kostkami sumujemy liczbę oczek. Suma 11 może być otrzymana na 6 sposobów: 1+4+6 = 1+5+5 = 2+4+5 = 2+3+6 = 3+4+4 = 3+3+5. Ten sam fakt ma miejsce dla sumy 12: 1+5+6 = 2+5+5 = 2+4+6 = 3+3+6 = 3+4+5 = 4+4+4. Wynika stąd, że zdarzenia „suma wynosi 11” i „suma wynosi 12” są jednakowo prawdopodobne. To nieprawda! Nasz „sposoby” nie są rzeczywistymi wynikami eksperymentu. W zbudowanym modelu przyjęto milczące założenie, że kości są „nierozróżnialne”. A kości są rozróżnialne! Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezależność zdarzeń Przykład Rzucamy kostkę 3 razy. Co przyjąć za o Ω? n Ω = (i, j, k) ; i, j, k ∈ {1, 2, 3, 4, 5, 6} . #Ω = 63 . Rozważmy trzy zdarzenia i obliczmy ich prawdopodobieństwa: n o A = (i, j, k) ; i jest parzyste , #A = 3 · 6 · 6, 3·6·6 = 1/2, P(A) = 6·6·6 n o B = (i, j, k) ; j jest nieparzyste , #B = 6 · 3 · 6, 6·3·6 = 1/2, P(B) = 6·6·6 n o C = (i, j, k) ; k ∈ {1, 2} , #A = 6 · 6 · 2, 6·6·2 P(C ) = = 1/3. 6·6·6 Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezależność zdarzeń Przykład - kontynuacja Obliczmy prawdopodobieństwa przekrojów. n o A ∩ B = (i, j, k) ; i jest parzyste oraz j jest nieparzyste , 3·3·6 #A ∩ B = 3 · 3 · 6, P(A ∩ B) = = 1/4, 6 · 6 · 6 n o A ∩ C = (i, j, k) ; i jest parzyste oraz k ∈ {1, 2} , 3·6·2 = 1/6, #A ∩ C = 3 · 6 · 2, P(A ∩ C ) = 6·6·6 n o B ∩ C = (i, j, k) ; j jest nieparzyste oraz k ∈ {1, 2} , 6·3·2 #A ∩ C = 6 · 3 · 2, P(B ∩ C ) = = 1/6. 6·6·6 Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezależność zdarzeń Przykład - kontynuacja Zauważmy, że P(A ∩ B) = 1/4 = 1/2 · 1/2 = P(A) · P(B) P(A ∩ C ) = 1/6 = 1/2 · 1/3 = P(A) · P(C ) P(B ∩ C ) = 1/6 = 1/2 · 1/3 = P(B) · P(C ). Mówimy, że A, B, C są „zdarzeniami niezależnymi parami”. Ale mamy także: 3·3·2 = 1/12 = 1/2 · 1/2 · 1/3 6·6·6 = P(A) · P(B) · P(C ). P(A ∩ B ∩ C ) = Dlatego mówimy, że A, B, C są „izdarzeniami niezależnymi”. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezależność zdarzeń Definicja Mówimy, że zdarzenia {Ai ; i ∈ I } są niezależne, jeśli dla każdego skończonego podzbioru I 0 ⊂ I mamy P \ Ai = i∈II0 Y P(Ai ). i∈II0 Definicja Mówimy, że zdarzenia {Ai ; i ∈ I } są niezależne parami, jeśli dla wszystkich różnych i 6= j P Ai ∩ Aj = P(Ai ) · P(Aj ). Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezależność zdarzeń Przykład: Bernstein, „czworościenna kostka” Niech Ω = {1, 2, 3, 4} z prawdopodobieństwem klasycznym. Określamy A = {1, 2}, B = {1, 3}, C = {1, 4}. Mamy P(A ∩ B) = 1/4 = P(A) · P(B) P(A ∩ C ) = 1/4 = P(A) · P(C ) P(B ∩ C ) = 1/4 = P(B) · P(C ). Z drugiej strony P(A ∩ B ∩ C ) = 1/4 6= 1/8 = P(A) · P(B) · P(C ). Tak więc A, B, C są niezależne parami, ale NIE SĄ niezależne (czyli są zależne). Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezależność zdarzeń Istotna uwaga Należy podkreślić, że ogólne reguły, np. P(Ac ) = 1 − P(A) lub P(A ∪ B) = P(A) + P(B) − P(A ∩ B) są zawsze spełnione, podczas gdy reguła mnożenia P(A ∩ B) = P(A) · P(B) jest spełniona tylko dla zdarzeń niezależnych. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezależność uzupełnień itp. Załózmy, że A i B są niezależne. Obliczmy P(A ∩ B c ): P(A ∩ B c ) = P(A \ A ∩ B) = P(A) − P(A ∩ B) = P(A) − P(A) · P(B) = P(A) · (1 − P(B)) = P(A)P(B c ) Podobnie, z prawa De Morgana P(Ac ∩ B c ) = P((A ∪ B)c ) = 1 − P(A ∪ B) = 1 − P(A) + P(B) − P(A ∩ B) = 1 − P(A) − P(B) + P(A) · P(B) = (1 − P(A)) · (1 − P(B)) = P(Ac )P(B c ). Wynika stąd, że również pary A i B c , Ac i B, Ac i B c są niezależne. Podobna własność ma miejsce dla dowolnych rodzin zdarzeń niezależnych. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Raz jeszcze Kawaler de Méré W tej chwili potrafimy już obliczyć prawdopodobieństwa zdarzeń rozważanych przez Kawalera de Méré. Dla eksperymentu czterokrotnego rzutu kostką n o mamy Ω1 = (i, j, k, l) ; i, j, k, l ∈ {1, 2, 3, 4, 5, 6} = Ω40 , gdzie Ω0 = {1, 2, 3, 4, 5, 6}. Oczywiście n#Ω1 = 64 . Niech A = (i, j, k, l) ; i = 6 lub j = 6 or k = 6 or l = o 6 = A1 ∪ A2 ∪ A3 ∪ A4 . Ile wynosi P(A)? Moglibyśmy zastosować wzór włączeń i wyłączeń. A1 , A2 , A3 , A4 są niezależne, łatwiej jest więc obliczyć P(A) = 1 − P(Ac ) = 1 − P(Ac1 ∩ Ac2 ∩ Ac3 ∩ Ac4 ) = 1 − P(Ac1 )4 = 1 − (5/6)4 ≈ 1 − 0, 482 = 0, 518 > 1/2. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Raz jeszcze Kawaler de Méré Dla eksperymentu rzutu dwiema kostkami 24 razy mamy Ω2 = n (i, j), . . . , (k, l) ; i, j, . . . , k, l ∈ {1, 2, 3, 4, 5, 6} {z | = Ω20 24 pary 24 o } . n o Jeśli Bm = (i, j), . . . , (k, l) ; m-ta para jest (6, 6) , to B = B1 ∪ B2 ∪ . . . ∪ B24 jest zdarzeniem, że rzucając dwiema kostkami 24 razy otrzymamy przynajmniej raz wynik (6, 6). Rozumując jak poprzednio 24 [ P(B) = 1 − P(B c ) = 1 − P ( Bm ) c m=1 = 1 − P( 24 \ Bmc ) = 1 − (35/36)24 m=1 ≈ 1 − 0, 509 = 0, 491 < 1/2. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Raz jeszcze Kawaler de Méré Rozważmy „wariant paradoksu de Méré”. Dla trzykrotnego rzutu kostką n o Ω3 = (i, j, k) ; i, j, k ∈ {1, 2, 3, 4, 5, 6} = Ω30 , #Ω = 216. Przypuśćmy, że wszystkie liczby i, j, k są różne. Wtedy można utworzyć 3 · 2 · 1 = 6 odpowiadających elementarnych wyników: (i, j, k), (i, k, j), (j, i, k), (j, k, i), (k, i, j), (k, j, i). Przypuśćmy teraz, że dwie liczby są równe (say i = j) i różne od nich k. Wtedy są tylko 3 odpowiadające wyniki elementarne: (i, i, k), (i, k, i), (k, i, i). Gdy wszystkie liczby są identyczne (i = j = k), odpowiada im tylko jedne wynik elementarny (i, i, i). Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Raz jeszcze Kawaler de Méré Teraz połóżmy n o n o C11 = (i, j, k) ; i + j + k = 11 C12 = (i, j, k) ; i + j + k = 12 C11 składa się z 27 rezultatów elementarnych, stąd P(C11 ) = 0, 125. 1 + {z 4 + 6} = |1 + {z 5 + 5} = |2 + {z 4 + 5} = | 6 razy 3 razy 6 razy 2| + {z 3 + 6} = 3| + {z 4 + 4} = 3| + {z 3 + 5} . 6 razy 3 razy 3 razy C12 składa się z 25 rezultatów elementarnych, stąd P(C12 ) ≈ 0, 1157. 1| + {z 5 + 6} = 2| + {z 5 + 5} = 2| + {z 4 + 6} = 6 razy 3 razy 6 razy 3 + {z 3 + 6} = |3 + {z 4 + 5} = |4 + {z 4 + 4} . | 3 razy 6 razy Prawdopodobieństwo i statystyka 1 raz Wykład III: Reguły obliczania prawdopodobieństw Reguły obliczania prawdopodobieństw Regułami obliczania prawdopodobieństw nazywamy następujące zasady i wzory. 1 Zasada dopełnienia: Jeśli Ac jest dopełnieniem zdarzenia A, to P(Ac ) = 1 − P(A). 2 Zasada dodawania: Jeśli zdarzenia A1 , A2 , . . . , An są parami rozłączne (lub „wzajemnie wykluczają się”), to P A1 ∪ A2 ∪ . . . ∪ An = P(A1 ) + P(A2 ) + . . . + P(An ). Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Reguły obliczania prawdopodobieństw 3 Wzór łączeń-wyłączeń: Dla dowolnych zdarzeń A1 , A2 , . . . , An ∈ F P( n [ Aj ) = j=1 n X P(Aj ) j=1 − X P(Ai ∩ Aj ) 1¬i<j¬n + X P(Ai ∩ Aj ∩ Ak ) 1¬i<j<k¬n − . . . + (−1)n+1 P(A1 ∩ A2 ∩ . . . ∩ An ). 4 Zasada mnożenia: Jeśli A1 , A2 , . . . An są niezależne, to P A1 ∩ A2 ∩ . . . ∩ An = P(A1 )P(A2 ) . . . P(An ). Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Reguły obliczania prawdopodobieństw 5 Ogólna zasada mnożenia: Jeśli P(A2 ∩ A3 ∩ . . . ∩ An ) > 0, to P A1 ∩ A2 ∩ A3 ∩ . . . ∩ An = P A1 A2 ∩ . . . ∩ An P(A2 A2 ∩ . . . ∩ An . . . P An−1 An , gdzie dla B, C ∈ F, P(C ) > 0, P B C = P B ∩C P C jest prawdopodobieństwem warunkowym zdarzenia B pod warunkiem C . Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Reguły obliczania prawdopodobieństw 6 Wzór na prawdopodobieństwo całkowite: Jeśli H1 , H2 , . . . , Hn ∈ F są parami rozłączne, możliwe (tzn. P(Hj ) > 0 dla j = 1, 2, . . . , n) i wyczerpują przestrzeń (tzn. H1 ∪ H2 ∪ . . . ∪ Hn = Ω), to dla dowolnego zdarzenia A ∈ F P A = P AH1 P H1 +P AH2 P H2 + . . . + P AHn P Hn . 7 Wzór Bayesa: Jeśli H1 , H2 , . . . , Hn są jak w (6) oraz P(A) > 0, to dla każdego Hj prawdopodobieństwo a posteriori jest dane przez P Hj A = Pn Prawdopodobieństwo i statystyka P AHj P Hj i=1 P AHi P Hi . Wykład III: Reguły obliczania prawdopodobieństw Przykład W populacji jest przeciętnie 1% osób cierpiących na pewne schorzenie. Wybieramy losowo osobę. Niech H1 będzie zdarzeniem, że ta osoba cierpi na to schorzenie, H2 - zdarzenie przeciwne. W celu wykrycia schorzenia przeprowadza się test T , dający dwa wyniki: T+ i T− . Test jest wysoce skuteczny: P(T+ |H1 ) = 0.98, ale i obarczony błędem: P(T+ |H2 ) = 0, 03. Przeprowadzamy test wybranej osoby. Ile wynosi P(T+ )? P(T+ ) = P(T+ |H1 )P(H1 ) + P(T+ |H2 )P(H2 ) = 0, 98 · 0, 01 + 0, 03 · 0, 99 = 0, 0396. Ale tę osobę interesuje, czy ma schorzenie! P(H1 |T+ ) =? P(H1 |T+ ) = P(T+ |H1 )P(H1 ) 0, 0098 = ≈ 0, 25. P(T+ ) 0, 0396 Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezawodność układu Definicja Niezawodnością układu (lub elementu układu) nazywamy prawdopodobieństwo zdarzenia, że układ (element układu) funkcjonuje prawidłowo. Zastosujemy reguły obliczania prawdopodobieństw w obliczaniu niezawodności kilku systemów złożonych. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezawodność układu szeregowego Rozważmy następujący układ szeregowy. R1 R2 R3 Obliczyć niezawodność RU układu, jeśli znane są niezawodności R1 , R2 , R3 poszczególnych elementów. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezawodność układu równoległego Rozważmy następujący układ równoległy. R1 R2 R3 Obliczyć niezawodność RU układu, jeśli znane są niezawodności R1 , R2 , R3 poszczególnych elementów. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezawodność układu szeregowo-równoległego Rozważmy następujący układ szeregowo-równoległy. R1 R2 R3 R4 Obliczyć niezawodność RU układu, jeśli znane są niezawodności R1 , R2 , R3 , R4 poszczególnych elementów. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezawodność mostka Rozważmy następujący układ, nazywany czasami „mostkiem”. R1 R2 R5 R3 R4 Obliczyć niezawodność RU układu, jeśli znane są niezawodności R1 , R2 , R3 , R4 , R5 poszczególnych elementów. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw Niezawodność mostka Wskazówka: Niech Gi będzie zdarzeniem, że i-ty element funkcjonuje właściwie. Wtedy P(Gi ) = Ri i P(Gic ) = 1 − Ri . Niech U będzie zdarzeniem, że cały układ funkcjonuje poprawnie. Obliczyć P U G5 i P U G5c , a następnie zastosować wzór na prawdopodobieństwo całkowite. Prawdopodobieństwo i statystyka Wykład III: Reguły obliczania prawdopodobieństw