Frakcję dla dziecka

Transkrypt

Frakcję dla dziecka
Prawdopodobieństwo:
formalizm matematyczny
Działania na zbiorach
i własności prawdopodobieństwa
• A, B, C – zdarzenia losowe
A B
A B
• P(A) – prawdopodobieństwo zdarzenia E
• 0≤P(A)≤1
A  B =   P(A  B) = P(A)  P(B)
• S – przestrzeń probabilistyczna (zbiór wszystkich
możliwych wyników eksperymentu-zdarzeń
elementarnych)
• P(S)=
?
Diagramy Venna
S
B
A
A\ B
B\ A
A B
A B
Prawdopodobieństwo klasyczne
• Założenie – wszystkie możliwe elementarne
wyniki eksperymentu są jednakowo
prawdopodobne (np. prawdopodobieństwo
wylosowania każdego studenta jest takie samo).
• N – liczba możliwych wyników eksperymentu
(Tu N=
?)
• x – liczba tych wyników , które
spełniają/sprzyjają zdarzeniu E
(Tu E= „Dostał/a 5.0 z egzaminu”, x=
?)
• P(E)=x/N
(Tu P(E)=
?)
• W praktyce prawdopodobieństwo często
ustalamy jako częstość/proporcję grupy
posiadającą interesującą nas własność.
• Przykład: Na 45-ciu studentów 15-tu dostało 5.0
z egzaminu. Jakie jest prawdopodobieństwo, że
losując studenta z tej grupy trafimy na takiego,
który dostał 5.0 z egzaminu?
Interpretacja częstościowa
prawdopodobieństwa
• Gdy liczba niezależnych powtórzeń
eksperymentu dąży do nieskończoności to
względna częstość występowania
zdarzenia E dąży do P(E).
Przykłady zdarzeń
• E = „wyrzucenie orła w rzucie symetryczną
monetą”: P(E) =
• E = „wyrzucenie 4 w rzucie symetryczną
kostką”: P(E) =
• E = „otrzymam 1 lub 6 w rzucie kostką”:
P(E) =
• Ania i Basia rzucają monetą. E = obie dostaną orła.
P(E) =
• Uzasadnienie
 A dostanie O i B dostanie O
 A dostanie O i B dostanie R
 A dostanie R i B dostanie O
 A dostanie R i B dostanie R
 Te cztery zdarzenia są jednakowo prawdopodobne
(P(E)=P(OO)=P(OR)=P(RO)=P(RR)=
?)
 Prawdopodobieństwo, że dostaniemy dokładnie jednego
orła (Ania albo Basia) =
Niezależność
• Krzyżówka dwóch heterozygot
• Genotyp obu rodziców : Aa
• Dzieci: P(AA) =
? Pr(Aa albo aA) =
P(aa) =
?
Definicja: Zdarzenia A i B są niezależne, gdy
?
• Jeżeli liczba dzieci będzie bardzo duża to frakcja
heterozygot będzie bliska
?
• Przypomnienie: frakcja w próbie aproksymuje
frakcję w populacji.
P ( A  B ) = P ( A)  P ( B)
• Przykład: Rozważmy dwa rzuty monetą.
A=otrzymano orła w pierwszym rzucie
B=otrzymano orła w drugim rzucie
• P(dwa orły) =
?
Prawdopodobieństwo warunkowe
Zdarzenie
0.5
0.5
0.5
O
OO
P-stwo
P(A|B) – prawdopodobieństwo zajścia zdarzenia A pod
warunkiem, że zajdzie zdarzenie B.
Definicja matematyczna:
O
0.5
R
OR
0.5
O
RO
0.5
O
R
RR
P( A  B)
P( B)
P( A  B) = P( B)  P ( A | B )
P( A | B) =
Przykład:
• Przypuśćmy, że 2% populacji zarażone jest
wirusem HIV, a test do wykrywania obecności
wirusa HIV ma następujące własności:
Jeżeli się ma HIV, to prawdopodobieństwo
jego wykrycia wynosi 0.997 (prawdziwy
dodatni wynik testu).
Gdy się nie ma HIV, to prawdopodobieństwo
właściwej diagnozy wynosi 0.985 (prawdziwy
ujemny wynik testu).
Zdarzenie
Test +
•
•
•
•
•
•
•
A – wybrany losowo człowiek jest chory
B – test wykazuje obecność wirusa
P(A)=
P(B|A)=
A’- wybrany losowo człowiek jest zdrowy
B’-test nie wykazuje obecności wirusa
P(B’|A’)=
P-stwo
Prawdziwy +
HIV +
Test -
Fałszywy -
Test +
Fałszywy +
• Jakie jest p-stwo, że u losowo
wybranej osoby test wykaże
obecność wirusa ?
HIV –
Test -
Prawdziwy -
Wzór Bayesa
• Jakie jest p-stwo, ze osoba u której test
wskazał obecność wirusa jest faktycznie
zakażona?
P( A | B) =
P( B | A)  P ( A)
P( B)
Zdarzenie
Wpływ rozkładu a priori.
30% ludzi ma HIV,

test do wykrywania HIV ma czułość 99.7% i specyficzność
98.5% (jak przedtem).
Prawdziwy +
Test -
Fałszywy -
Test +
Fałszywy +
HIV +
Załóżmy teraz, że w pewnej populacji:

Test +
P-stwo
Jakie jest prawdopodobieństwo, że osoba z dodatnim wynikiem
testu ma HIV?
HIV –
Test -
P-stwo, że osoba z dodatnim wynikiem testu
jest (faktycznie) chora wynosi:
Prawdziwy -
Zmienna losowa:
Wartość zależna od wyniku eksperymentu.

P ( HIV  i test  )
P ( HIV  | test  ) =
P (test )
Zmienna losowa dyskretna
Przykład: Liczba orłów uzyskanych w jednym rzucie monetą.
Ciągła zmienna losowa

Zbiór wartości, które może przyjąć zmienna losowa dyskretna
jest skończony lub przeliczalny. Możliwe wartości będziemy
oznaczali x1,x2, …

Prawdopodobieństwo przyjęcia każdej ustalonej wartości
wynosi zero, np. P(X=3.14159265358979323)=0

Rozkład zmiennej dyskretnej X określamy podając
prawdopodobieństwa pi=P(X=xi).

Na tym kursie będziemy rozważać tylko zmienne losowe
ciągłe opisane funkcją gęstości f(x).

Np. w rzucie symetryczną kostką liczba oczek X ma rozkład
P(X=i)=
, i=1,...6.
Dystrybuanta zmiennej X:

Dla liczby
Narysuj dystrybuantę dyskretnej zmiennej losowej
X takiej, że P(X=0)=1/3 oraz P(X=1)=2/3.
x definiujemy
FX ( x) = P( X  x)

Własności: FX(x) jest funkcją niemalejącą, ciągłą
z prawej strony, oraz
lim x - F ( x) =
lim x  F ( x) =
Wartość oczekiwana i wariancja (wzory).
Narysuj dystrybuantę rozkładu jednostajnego na
odcinku [a,b].
Zmienna losowa dyskretna
 x
•
:=E(X)= xi P(X= xi)=xipi
Var(X)= (xi- x)2 P(X= xi) = xi2 pi - x2

Przykład 1 (rzut monetą, X=1, gdy orzeł, X=0, gdy
reszka)
E(X)=
Var(X)=
 Przykład 2 (X=wynik rzutu kostką)
E(X)=
Var(X)=
Wartość oczekiwana i wariancja, cd.
0  p 1
Rozkład dwupunktowy z parametrem

P(Y=1)=p, P(Y=0)=1-p.
Zmienna losowa ciągła

EX =  x f(x) dx
-

Oblicz:
 EY=
 VarY=


2
Var(X) =  (x - EX) f(x) dx =  x 2 f(x)dx - (EX) 2
-
-
Wartość oczekiwana jest środkiem ciężkości figury określonej
przez krzywą gęstości.
Własności wartości oczekiwanej i wariancji
Przykład: rozkład jednostajny na [0,1].
Dla dwóch zmiennych losowych X i Y:
E(X+Y)=EX+EY
E(aX+b)=aEX+b
E(X-Y)=EX-EY
Var(aX+b)=a2Var(X)
E(aX+bY+c)=
Niezależność zmiennych losowych:
Niezależność zmiennych losowych, cd.
Jeżeli zmienne X i Y są niezależne to dla każdej pary
zdarzeń A i B
Przykład 2: Wybieramy (losowo) liczbę z zakresu 12,...,101;
X:=cyfra dziesiątek, Y:=cyfra jedności, A={1, 2}, B={3, 4, 5}.
P( X  A, Y  B) = P( X  A) P(Y  B)
Przykład 3: Liczby oczek, X, Y, w dwóch kolejnych rzutach
kostką.
Przykład1: Wybieramy (losowo) liczbę dwucyfrową;
X:=liczba dziesiątek, Y:=liczba jedności, A={1, 2},
B={3, 4, 5}.
Jeżeli X i Y są niezależne, to
E(XY)=E(X)·E(Y)
Ćwiczenia: X i Y niezależne
Var(X-Y)=
i
Var(X+Y)=Var(X)+Var(Y).
Var(X+X)=
Schemat Bernoulliego
i rozkład dwumianowy
Rozkład dwumianowy (n=3,p=0.5)
Anita, Beata i Krystyna rzucają monetą i podają łączną
liczbę orłów,Y. Podaj rozkład zmiennej Y
A
B
K
O
O
O
O
R
R
R
R
O
O
R
R
O
O
R
R
O
R
O
R
O
R
O
R
P-stwo
Zdarzenie P-stwo
3O (0R)
2O (1R)
1O (2R)
0O (3R)
Schemat Bernoulliego:

n niezależnych powtórzeń tego samego eksperymentu
 dwa możliwe wyniki w każdej próbie - ``sukces’’ i
``porażka’’ (np. O i R, albo 1 i 0)
 w każdej próbie p-stwo sukcesu wynosi p
Rozkład dwumianowy:
Y
= łączna liczba sukcesów w schemacie Bernoulliego
Przykłady: liczba orłów na 5 rzutów, liczba wyzdrowień wśród
10 pacjentów poddanych pewnej kuracji
Pr(Y=y)

Histogram rozkładu w populacji.
Populacja =”wszystkie” rzuty trzema monetami
0,4
0,3
0,2
0,1
0
0
1
2
y
Rozkład dwumianowy:
ænö
P(Y = y ) =   p y (1 - p) n- y ,
 y
ænö
n!
gdzie   =
,
 y  y!(n - y )!
y = 0,1,..., n
3
ænö
 
Niektóre własności symbolu Newtona
 y

Liczba możliwych ciągów y sukcesów i n-y porażek

ænö
  =
0

ænö
 =
1 

Ogólnie
ænö
 =
n
æn ö
 =
 n - 1
W przykładzie p=1/2;
æ 3ö
 =
0
æ3ö
 =
1 
æ 3ö
 =
 2
æ 3ö
 =
 3
P (Y = 0) =
P (Y = 1) =
P (Y = 2) =
P (Y = 3) =

Uwaga: Rozkład dwumianowy jest symetryczny dla p=1/2.
ænö æn
ö
 y = n- y
  

Odpowiedź:
Przykład: Efekt uboczny lekarstwa

20% ludzi dostaje nudności po zażyciu pewnego lekarstwa

Lekarz przepisał lekarstwo czterem nowym pacjentom

Y – liczba pacjentów w naszej próbie, którzy dostali nudności

Podaj rozkład zmiennej Y
Parametry rozkładu dwumianowego

P(co najmniej dwóch dostanie nudności) =

P(co najwyżej jeden dostanie nudności) =
 EY
= np
 Var
Y=np(1-p)

Podobne dokumenty