Prawdopodobienstwo i statystyka

Transkrypt

Prawdopodobienstwo i statystyka
Prawdopodobieństwo i statystyka
Wykład III:
Reguły obliczania prawdopodobieństw
18 października 2016
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Dlaczego wybór przestrzeni probabilistycznej jest
tak ważny?
Przestrzeń probabilistyczna jest modelem eksperymentu
losowego, który jest dla nas interesujący.
Wybór złego modelu prowadzi do niewłaściwych prognoz
lub interpretacji.
Wiele z tak zwanych „paradoksów probabilistycznych”
jest związanych z nieprecyzyjnym sformułowaniem
dopuszczającym rozmaite modele probabilistyczne.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Dlaczego wybór przestrzeni probabilistycznej jest
tak ważny?
Przykład: Paradoks Kawalera (Chevalier) de Méré
Francuski (lub flamandzki) gracz i pisarz, znany jako „Chevalier de
Méré” i żyjący w XVII wieku, uważał, że wyrzucenie przynajmniej
jednej „szóstki” w 4 rzutach kostką ma to samo
prawdopodobieństwo, co uzyskanie przynajmniej jednej pary „szóstek”
w 24 rzutach dwiema kostkami.
Spotkały go nieprzyjemne konsekwencje finansowe tego
przekonania.
Dlatego zwrócił się do Błażeja Pascala o pomoc w rozwikłaniu
zagadki. I Pascal (jak również Piotr de Fermat) znalazł właściwe
rozwiązanie.
Zob. np.
https://www.boundless.com/statistics/textbooks/boundlessstatistics-textbook/probability-8/more-about-chance-35/theparadox-of-the-chevalier-de-mere-176-4450/
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Dlaczego wybór przestrzeni probabilistycznej jest
tak ważny?
Przykład: Wariant paradoksu Kawalera de Méré
Rzucając trzema kostkami sumujemy liczbę oczek. Suma 11
może być otrzymana na 6 sposobów:
1+4+6 = 1+5+5 = 2+4+5 = 2+3+6 = 3+4+4 = 3+3+5.
Ten sam fakt ma miejsce dla sumy 12:
1+5+6 = 2+5+5 = 2+4+6 = 3+3+6 = 3+4+5 = 4+4+4.
Wynika stąd, że zdarzenia „suma wynosi 11” i „suma wynosi
12” są jednakowo prawdopodobne.
To nieprawda! Nasz „sposoby” nie są rzeczywistymi
wynikami eksperymentu.
W zbudowanym modelu przyjęto milczące założenie, że kości
są „nierozróżnialne”. A kości są rozróżnialne!
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezależność zdarzeń
Przykład
Rzucamy
kostkę 3 razy. Co przyjąć za o
Ω?
n
Ω = (i, j, k) ; i, j, k ∈ {1, 2, 3, 4, 5, 6} . #Ω = 63 .
Rozważmy trzy zdarzenia i obliczmy ich prawdopodobieństwa:
n
o
A = (i, j, k) ; i jest parzyste , #A = 3 · 6 · 6,
3·6·6
= 1/2,
P(A) =
6·6·6
n
o
B = (i, j, k) ; j jest nieparzyste , #B = 6 · 3 · 6,
6·3·6
= 1/2,
P(B) =
6·6·6
n
o
C = (i, j, k) ; k ∈ {1, 2} , #A = 6 · 6 · 2,
6·6·2
P(C ) =
= 1/3.
6·6·6
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezależność zdarzeń
Przykład - kontynuacja
Obliczmy prawdopodobieństwa przekrojów.
n
o
A ∩ B = (i, j, k) ; i jest parzyste oraz j jest nieparzyste ,
3·3·6
#A ∩ B = 3 · 3 · 6, P(A ∩ B) =
= 1/4,
6
·
6
·
6
n
o
A ∩ C = (i, j, k) ; i jest parzyste oraz k ∈ {1, 2} ,
3·6·2
= 1/6,
#A ∩ C = 3 · 6 · 2, P(A ∩ C ) =
6·6·6
n
o
B ∩ C = (i, j, k) ; j jest nieparzyste oraz k ∈ {1, 2} ,
6·3·2
#A ∩ C = 6 · 3 · 2, P(B ∩ C ) =
= 1/6.
6·6·6
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezależność zdarzeń
Przykład - kontynuacja
Zauważmy, że
P(A ∩ B) = 1/4 = 1/2 · 1/2 = P(A) · P(B)
P(A ∩ C ) = 1/6 = 1/2 · 1/3 = P(A) · P(C )
P(B ∩ C ) = 1/6 = 1/2 · 1/3 = P(B) · P(C ).
Mówimy, że A, B, C są „zdarzeniami niezależnymi parami”.
Ale mamy także:
3·3·2
= 1/12 = 1/2 · 1/2 · 1/3
6·6·6
= P(A) · P(B) · P(C ).
P(A ∩ B ∩ C ) =
Dlatego mówimy, że A, B, C są „izdarzeniami niezależnymi”.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezależność zdarzeń
Definicja
Mówimy, że zdarzenia {Ai ; i ∈ I } są niezależne, jeśli dla
każdego skończonego podzbioru I 0 ⊂ I mamy
P
\
Ai =
i∈II0
Y
P(Ai ).
i∈II0
Definicja
Mówimy, że zdarzenia {Ai ; i ∈ I } są niezależne parami, jeśli
dla wszystkich różnych i 6= j
P Ai ∩ Aj = P(Ai ) · P(Aj ).
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezależność zdarzeń
Przykład: Bernstein, „czworościenna kostka”
Niech Ω = {1, 2, 3, 4} z prawdopodobieństwem klasycznym.
Określamy A = {1, 2}, B = {1, 3}, C = {1, 4}.
Mamy
P(A ∩ B) = 1/4 = P(A) · P(B)
P(A ∩ C ) = 1/4 = P(A) · P(C )
P(B ∩ C ) = 1/4 = P(B) · P(C ).
Z drugiej strony
P(A ∩ B ∩ C ) = 1/4 6= 1/8 = P(A) · P(B) · P(C ).
Tak więc A, B, C są niezależne parami, ale NIE SĄ niezależne
(czyli są zależne).
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezależność zdarzeń
Istotna uwaga
Należy podkreślić, że ogólne reguły, np.
P(Ac ) = 1 − P(A)
lub
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
są zawsze spełnione, podczas gdy reguła mnożenia
P(A ∩ B) = P(A) · P(B)
jest spełniona tylko dla zdarzeń niezależnych.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezależność uzupełnień itp.
Załózmy, że A i B są niezależne.
Obliczmy P(A ∩ B c ):
P(A ∩ B c ) = P(A \ A ∩ B) = P(A) − P(A ∩ B)
= P(A) − P(A) · P(B) = P(A) · (1 − P(B))
= P(A)P(B c )
Podobnie, z prawa De Morgana
P(Ac ∩ B c ) = P((A ∪ B)c ) = 1 − P(A ∪ B)
= 1 − P(A) + P(B) − P(A ∩ B)
= 1 − P(A) − P(B) + P(A) · P(B)
= (1 − P(A)) · (1 − P(B)) = P(Ac )P(B c ).
Wynika stąd, że również pary A i B c , Ac i B, Ac i B c są
niezależne.
Podobna własność ma miejsce dla dowolnych rodzin zdarzeń
niezależnych.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Raz jeszcze Kawaler de Méré
W tej chwili potrafimy już obliczyć prawdopodobieństwa
zdarzeń rozważanych przez Kawalera de Méré.
Dla eksperymentu
czterokrotnego rzutu kostką
n
o mamy
Ω1 = (i, j, k, l) ; i, j, k, l ∈ {1, 2, 3, 4, 5, 6} = Ω40 , gdzie
Ω0 = {1, 2, 3, 4, 5, 6}.
Oczywiście n#Ω1 = 64 .
Niech A = (i, j, k, l) ; i = 6 lub j = 6 or k = 6 or l =
o
6 = A1 ∪ A2 ∪ A3 ∪ A4 . Ile wynosi P(A)?
Moglibyśmy zastosować wzór włączeń i wyłączeń.
A1 , A2 , A3 , A4 są niezależne, łatwiej jest więc obliczyć
P(A) = 1 − P(Ac ) = 1 − P(Ac1 ∩ Ac2 ∩ Ac3 ∩ Ac4 )
= 1 − P(Ac1 )4 = 1 − (5/6)4
≈ 1 − 0, 482 = 0, 518 > 1/2.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Raz jeszcze Kawaler de Méré
Dla eksperymentu rzutu dwiema kostkami 24 razy mamy
Ω2 =
n
(i, j), . . . , (k, l) ; i, j, . . . , k, l ∈ {1, 2, 3, 4, 5, 6}
{z
|
= Ω20
24 pary
24
o
}
.
n
o
Jeśli Bm = (i, j), . . . , (k, l) ; m-ta para jest (6, 6) , to
B = B1 ∪ B2 ∪ . . . ∪ B24 jest zdarzeniem, że rzucając dwiema
kostkami 24 razy otrzymamy przynajmniej raz wynik (6, 6).
Rozumując jak poprzednio
24
[
P(B) = 1 − P(B c ) = 1 − P (
Bm ) c
m=1
= 1 − P(
24
\
Bmc )
= 1 − (35/36)24
m=1
≈ 1 − 0, 509 = 0, 491 < 1/2.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Raz jeszcze Kawaler de Méré
Rozważmy „wariant paradoksu de Méré”.
Dla trzykrotnego rzutu kostką
n
o
Ω3 = (i, j, k) ; i, j, k ∈ {1, 2, 3, 4, 5, 6} = Ω30 , #Ω = 216.
Przypuśćmy, że wszystkie liczby i, j, k są różne. Wtedy
można utworzyć 3 · 2 · 1 = 6 odpowiadających
elementarnych wyników:
(i, j, k), (i, k, j), (j, i, k), (j, k, i), (k, i, j), (k, j, i).
Przypuśćmy teraz, że dwie liczby są równe (say i = j) i
różne od nich k. Wtedy są tylko 3 odpowiadające wyniki
elementarne:
(i, i, k), (i, k, i), (k, i, i).
Gdy wszystkie liczby są identyczne (i = j = k),
odpowiada im tylko jedne wynik elementarny (i, i, i).
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Raz jeszcze Kawaler de Méré
Teraz połóżmy
n
o
n
o
C11 = (i, j, k) ; i + j + k = 11
C12 = (i, j, k) ; i + j + k = 12
C11 składa się z 27 rezultatów elementarnych, stąd
P(C11 ) = 0, 125.
1 + {z
4 + 6} = |1 + {z
5 + 5} = |2 + {z
4 + 5} =
|
6 razy
3 razy
6 razy
2| + {z
3 + 6} = 3| + {z
4 + 4} = 3| + {z
3 + 5} .
6 razy
3 razy
3 razy
C12 składa się z 25 rezultatów elementarnych, stąd
P(C12 ) ≈ 0, 1157.
1| + {z
5 + 6} = 2| + {z
5 + 5} = 2| + {z
4 + 6} =
6 razy
3 razy
6 razy
3 + {z
3 + 6} = |3 + {z
4 + 5} = |4 + {z
4 + 4} .
|
3 razy
6 razy
Prawdopodobieństwo i statystyka
1 raz
Wykład III: Reguły obliczania prawdopodobieństw
Reguły obliczania prawdopodobieństw
Regułami obliczania prawdopodobieństw nazywamy
następujące zasady i wzory.
1
Zasada dopełnienia: Jeśli Ac jest dopełnieniem zdarzenia
A, to
P(Ac ) = 1 − P(A).
2
Zasada dodawania: Jeśli zdarzenia A1 , A2 , . . . , An są
parami rozłączne (lub „wzajemnie wykluczają się”), to
P A1 ∪ A2 ∪ . . . ∪ An = P(A1 ) + P(A2 ) + . . . + P(An ).
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Reguły obliczania prawdopodobieństw
3
Wzór łączeń-wyłączeń: Dla dowolnych zdarzeń
A1 , A2 , . . . , An ∈ F
P(
n
[
Aj ) =
j=1
n
X
P(Aj )
j=1
−
X
P(Ai ∩ Aj )
1¬i<j¬n
+
X
P(Ai ∩ Aj ∩ Ak )
1¬i<j<k¬n
− . . . + (−1)n+1 P(A1 ∩ A2 ∩ . . . ∩ An ).
4
Zasada mnożenia: Jeśli A1 , A2 , . . . An są niezależne, to
P A1 ∩ A2 ∩ . . . ∩ An = P(A1 )P(A2 ) . . . P(An ).
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Reguły obliczania prawdopodobieństw
5
Ogólna zasada mnożenia: Jeśli P(A2 ∩ A3 ∩ . . . ∩ An ) > 0,
to
P A1 ∩ A2 ∩ A3 ∩ . . . ∩ An =
P A1 A2 ∩ . . . ∩ An P(A2 A2 ∩ . . . ∩ An . . . P An−1 An ,
gdzie dla B, C ∈ F, P(C ) > 0,
P B C
=
P B ∩C
P C
jest prawdopodobieństwem warunkowym zdarzenia B pod
warunkiem C .
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Reguły obliczania prawdopodobieństw
6
Wzór na prawdopodobieństwo całkowite: Jeśli
H1 , H2 , . . . , Hn ∈ F są parami rozłączne, możliwe (tzn.
P(Hj ) > 0 dla j = 1, 2, . . . , n) i wyczerpują przestrzeń
(tzn. H1 ∪ H2 ∪ . . . ∪ Hn = Ω), to dla dowolnego
zdarzenia A ∈ F
P A = P AH1 P H1 +P AH2 P H2 +
. . . + P AHn P Hn .
7
Wzór Bayesa: Jeśli H1 , H2 , . . . , Hn są jak w (6) oraz
P(A) > 0, to dla każdego Hj prawdopodobieństwo
a posteriori jest dane przez
P
Hj A
= Pn
Prawdopodobieństwo i statystyka
P AHj P Hj
i=1 P AHi P Hi
.
Wykład III: Reguły obliczania prawdopodobieństw
Przykład
W populacji jest przeciętnie 1% osób cierpiących na
pewne schorzenie.
Wybieramy losowo osobę. Niech H1 będzie zdarzeniem, że
ta osoba cierpi na to schorzenie, H2 - zdarzenie przeciwne.
W celu wykrycia schorzenia przeprowadza się test T ,
dający dwa wyniki: T+ i T− .
Test jest wysoce skuteczny: P(T+ |H1 ) = 0.98, ale i
obarczony błędem: P(T+ |H2 ) = 0, 03.
Przeprowadzamy test wybranej osoby. Ile wynosi P(T+ )?
P(T+ ) = P(T+ |H1 )P(H1 ) + P(T+ |H2 )P(H2 ) =
0, 98 · 0, 01 + 0, 03 · 0, 99 = 0, 0396.
Ale tę osobę interesuje, czy ma schorzenie! P(H1 |T+ ) =?
P(H1 |T+ ) =
P(T+ |H1 )P(H1 )
0, 0098
=
≈ 0, 25.
P(T+ )
0, 0396
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezawodność układu
Definicja
Niezawodnością układu (lub elementu układu) nazywamy
prawdopodobieństwo zdarzenia, że układ (element układu)
funkcjonuje prawidłowo.
Zastosujemy reguły obliczania prawdopodobieństw w
obliczaniu niezawodności kilku systemów złożonych.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezawodność układu szeregowego
Rozważmy następujący układ szeregowy.
R1
R2
R3
Obliczyć niezawodność RU układu, jeśli znane są
niezawodności R1 , R2 , R3 poszczególnych elementów.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezawodność układu równoległego
Rozważmy następujący układ równoległy.
R1
R2
R3
Obliczyć niezawodność RU układu, jeśli znane są
niezawodności R1 , R2 , R3 poszczególnych elementów.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezawodność układu szeregowo-równoległego
Rozważmy następujący układ szeregowo-równoległy.
R1
R2
R3
R4
Obliczyć niezawodność RU układu, jeśli znane są
niezawodności R1 , R2 , R3 , R4 poszczególnych elementów.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezawodność mostka
Rozważmy następujący układ, nazywany czasami
„mostkiem”.
R1
R2
R5
R3
R4
Obliczyć niezawodność RU układu, jeśli znane są
niezawodności R1 , R2 , R3 , R4 , R5 poszczególnych
elementów.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw
Niezawodność mostka
Wskazówka: Niech Gi będzie zdarzeniem, że i-ty
element funkcjonuje właściwie.
Wtedy P(Gi ) = Ri i P(Gic ) = 1 − Ri .
Niech U będzie zdarzeniem, że cały układ funkcjonuje
poprawnie. Obliczyć P U G5 i P U G5c , a następnie zastosować
wzór na prawdopodobieństwo całkowite.
Prawdopodobieństwo i statystyka
Wykład III: Reguły obliczania prawdopodobieństw