Frakcję dla dziecka
Transkrypt
Frakcję dla dziecka
Prawdopodobieństwo: formalizm matematyczny Działania na zbiorach i własności prawdopodobieństwa • A, B, C – zdarzenia losowe A B A B • P(A) – prawdopodobieństwo zdarzenia E • 0≤P(A)≤1 A B = P(A B) = P(A) P(B) • S – przestrzeń probabilistyczna (zbiór wszystkich możliwych wyników eksperymentu-zdarzeń elementarnych) • P(S)= ? Diagramy Venna S B A A\ B B\ A A B A B Prawdopodobieństwo klasyczne • Założenie – wszystkie możliwe elementarne wyniki eksperymentu są jednakowo prawdopodobne (np. prawdopodobieństwo wylosowania każdego studenta jest takie samo). • N – liczba możliwych wyników eksperymentu (Tu N= ?) • x – liczba tych wyników , które spełniają/sprzyjają zdarzeniu E (Tu E= „Dostał/a 5.0 z egzaminu”, x= ?) • P(E)=x/N (Tu P(E)= ?) • W praktyce prawdopodobieństwo często ustalamy jako częstość/proporcję grupy posiadającą interesującą nas własność. • Przykład: Na 45-ciu studentów 15-tu dostało 5.0 z egzaminu. Jakie jest prawdopodobieństwo, że losując studenta z tej grupy trafimy na takiego, który dostał 5.0 z egzaminu? Interpretacja częstościowa prawdopodobieństwa • Gdy liczba niezależnych powtórzeń eksperymentu dąży do nieskończoności to względna częstość występowania zdarzenia E dąży do P(E). Przykłady zdarzeń • E = „wyrzucenie orła w rzucie symetryczną monetą”: P(E) = • E = „wyrzucenie 4 w rzucie symetryczną kostką”: P(E) = • E = „otrzymam 1 lub 6 w rzucie kostką”: P(E) = • Ania i Basia rzucają monetą. E = obie dostaną orła. P(E) = • Uzasadnienie A dostanie O i B dostanie O A dostanie O i B dostanie R A dostanie R i B dostanie O A dostanie R i B dostanie R Te cztery zdarzenia są jednakowo prawdopodobne (P(E)=P(OO)=P(OR)=P(RO)=P(RR)= ?) Prawdopodobieństwo, że dostaniemy dokładnie jednego orła (Ania albo Basia) = Niezależność • Krzyżówka dwóch heterozygot • Genotyp obu rodziców : Aa • Dzieci: P(AA) = ? Pr(Aa albo aA) = P(aa) = ? Definicja: Zdarzenia A i B są niezależne, gdy ? • Jeżeli liczba dzieci będzie bardzo duża to frakcja heterozygot będzie bliska ? • Przypomnienie: frakcja w próbie aproksymuje frakcję w populacji. P ( A B ) = P ( A) P ( B) • Przykład: Rozważmy dwa rzuty monetą. A=otrzymano orła w pierwszym rzucie B=otrzymano orła w drugim rzucie • P(dwa orły) = ? Prawdopodobieństwo warunkowe Zdarzenie 0.5 0.5 0.5 O OO P-stwo P(A|B) – prawdopodobieństwo zajścia zdarzenia A pod warunkiem, że zajdzie zdarzenie B. Definicja matematyczna: O 0.5 R OR 0.5 O RO 0.5 O R RR P( A B) P( B) P( A B) = P( B) P ( A | B ) P( A | B) = Przykład: • Przypuśćmy, że 2% populacji zarażone jest wirusem HIV, a test do wykrywania obecności wirusa HIV ma następujące własności: Jeżeli się ma HIV, to prawdopodobieństwo jego wykrycia wynosi 0.997 (prawdziwy dodatni wynik testu). Gdy się nie ma HIV, to prawdopodobieństwo właściwej diagnozy wynosi 0.985 (prawdziwy ujemny wynik testu). Zdarzenie Test + • • • • • • • A – wybrany losowo człowiek jest chory B – test wykazuje obecność wirusa P(A)= P(B|A)= A’- wybrany losowo człowiek jest zdrowy B’-test nie wykazuje obecności wirusa P(B’|A’)= P-stwo Prawdziwy + HIV + Test - Fałszywy - Test + Fałszywy + • Jakie jest p-stwo, że u losowo wybranej osoby test wykaże obecność wirusa ? HIV – Test - Prawdziwy - Wzór Bayesa • Jakie jest p-stwo, ze osoba u której test wskazał obecność wirusa jest faktycznie zakażona? P( A | B) = P( B | A) P ( A) P( B) Zdarzenie Wpływ rozkładu a priori. 30% ludzi ma HIV, test do wykrywania HIV ma czułość 99.7% i specyficzność 98.5% (jak przedtem). Prawdziwy + Test - Fałszywy - Test + Fałszywy + HIV + Załóżmy teraz, że w pewnej populacji: Test + P-stwo Jakie jest prawdopodobieństwo, że osoba z dodatnim wynikiem testu ma HIV? HIV – Test - P-stwo, że osoba z dodatnim wynikiem testu jest (faktycznie) chora wynosi: Prawdziwy - Zmienna losowa: Wartość zależna od wyniku eksperymentu. P ( HIV i test ) P ( HIV | test ) = P (test ) Zmienna losowa dyskretna Przykład: Liczba orłów uzyskanych w jednym rzucie monetą. Ciągła zmienna losowa Zbiór wartości, które może przyjąć zmienna losowa dyskretna jest skończony lub przeliczalny. Możliwe wartości będziemy oznaczali x1,x2, … Prawdopodobieństwo przyjęcia każdej ustalonej wartości wynosi zero, np. P(X=3.14159265358979323)=0 Rozkład zmiennej dyskretnej X określamy podając prawdopodobieństwa pi=P(X=xi). Na tym kursie będziemy rozważać tylko zmienne losowe ciągłe opisane funkcją gęstości f(x). Np. w rzucie symetryczną kostką liczba oczek X ma rozkład P(X=i)= , i=1,...6. Dystrybuanta zmiennej X: Dla liczby Narysuj dystrybuantę dyskretnej zmiennej losowej X takiej, że P(X=0)=1/3 oraz P(X=1)=2/3. x definiujemy FX ( x) = P( X x) Własności: FX(x) jest funkcją niemalejącą, ciągłą z prawej strony, oraz lim x - F ( x) = lim x F ( x) = Wartość oczekiwana i wariancja (wzory). Narysuj dystrybuantę rozkładu jednostajnego na odcinku [a,b]. Zmienna losowa dyskretna x • :=E(X)= xi P(X= xi)=xipi Var(X)= (xi- x)2 P(X= xi) = xi2 pi - x2 Przykład 1 (rzut monetą, X=1, gdy orzeł, X=0, gdy reszka) E(X)= Var(X)= Przykład 2 (X=wynik rzutu kostką) E(X)= Var(X)= Wartość oczekiwana i wariancja, cd. 0 p 1 Rozkład dwupunktowy z parametrem P(Y=1)=p, P(Y=0)=1-p. Zmienna losowa ciągła EX = x f(x) dx - Oblicz: EY= VarY= 2 Var(X) = (x - EX) f(x) dx = x 2 f(x)dx - (EX) 2 - - Wartość oczekiwana jest środkiem ciężkości figury określonej przez krzywą gęstości. Własności wartości oczekiwanej i wariancji Przykład: rozkład jednostajny na [0,1]. Dla dwóch zmiennych losowych X i Y: E(X+Y)=EX+EY E(aX+b)=aEX+b E(X-Y)=EX-EY Var(aX+b)=a2Var(X) E(aX+bY+c)= Niezależność zmiennych losowych: Niezależność zmiennych losowych, cd. Jeżeli zmienne X i Y są niezależne to dla każdej pary zdarzeń A i B Przykład 2: Wybieramy (losowo) liczbę z zakresu 12,...,101; X:=cyfra dziesiątek, Y:=cyfra jedności, A={1, 2}, B={3, 4, 5}. P( X A, Y B) = P( X A) P(Y B) Przykład 3: Liczby oczek, X, Y, w dwóch kolejnych rzutach kostką. Przykład1: Wybieramy (losowo) liczbę dwucyfrową; X:=liczba dziesiątek, Y:=liczba jedności, A={1, 2}, B={3, 4, 5}. Jeżeli X i Y są niezależne, to E(XY)=E(X)·E(Y) Ćwiczenia: X i Y niezależne Var(X-Y)= i Var(X+Y)=Var(X)+Var(Y). Var(X+X)= Schemat Bernoulliego i rozkład dwumianowy Rozkład dwumianowy (n=3,p=0.5) Anita, Beata i Krystyna rzucają monetą i podają łączną liczbę orłów,Y. Podaj rozkład zmiennej Y A B K O O O O R R R R O O R R O O R R O R O R O R O R P-stwo Zdarzenie P-stwo 3O (0R) 2O (1R) 1O (2R) 0O (3R) Schemat Bernoulliego: n niezależnych powtórzeń tego samego eksperymentu dwa możliwe wyniki w każdej próbie - ``sukces’’ i ``porażka’’ (np. O i R, albo 1 i 0) w każdej próbie p-stwo sukcesu wynosi p Rozkład dwumianowy: Y = łączna liczba sukcesów w schemacie Bernoulliego Przykłady: liczba orłów na 5 rzutów, liczba wyzdrowień wśród 10 pacjentów poddanych pewnej kuracji Pr(Y=y) Histogram rozkładu w populacji. Populacja =”wszystkie” rzuty trzema monetami 0,4 0,3 0,2 0,1 0 0 1 2 y Rozkład dwumianowy: ænö P(Y = y ) = p y (1 - p) n- y , y ænö n! gdzie = , y y!(n - y )! y = 0,1,..., n 3 ænö Niektóre własności symbolu Newtona y Liczba możliwych ciągów y sukcesów i n-y porażek ænö = 0 ænö = 1 Ogólnie ænö = n æn ö = n - 1 W przykładzie p=1/2; æ 3ö = 0 æ3ö = 1 æ 3ö = 2 æ 3ö = 3 P (Y = 0) = P (Y = 1) = P (Y = 2) = P (Y = 3) = Uwaga: Rozkład dwumianowy jest symetryczny dla p=1/2. ænö æn ö y = n- y Odpowiedź: Przykład: Efekt uboczny lekarstwa 20% ludzi dostaje nudności po zażyciu pewnego lekarstwa Lekarz przepisał lekarstwo czterem nowym pacjentom Y – liczba pacjentów w naszej próbie, którzy dostali nudności Podaj rozkład zmiennej Y Parametry rozkładu dwumianowego P(co najmniej dwóch dostanie nudności) = P(co najwyżej jeden dostanie nudności) = EY = np Var Y=np(1-p)