Rachunek pstwa w5-2012
Transkrypt
Rachunek pstwa w5-2012
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 5. PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA Rozkłady skokowe Rozkład jednopunktowy Określamy: P(X = c) = 1 gdzie c ustalona liczba. 1 EX = c, D2X = 0 (tylko ten rozkład ma zerową wariancję !!!) 2 Rozkład dwupunktowy (zerojedynkowy) Niech p ∈(0, 1) będzie ustaloną liczbą. Określamy: P(X = 0) = q, P(X = 1) = p ; gdzie q = 1 – p. Umowa: 0 - porażka 1 - sukces 3 EX = p, D2X = pq 4 Rozkład dwumianowy Dla danych p ∈(0, 1) , n ∈ N określamy funkcję prawdopodobieństwa n k n − k P( X = k ) = p q (wzór Bernoulliego) k gdzie q = 1 – p k = 0, 1, 2, ... , n. 5 6 Jakub Bernoulli (1654 - 1705) - szwajcarski matematyk i fizyk. 7 Jeśli przyjmiemy, że n oznacza liczbę niezależnych doświadczeń z których każde kończy się jednym z dwóch wyników: „sukcesem" (z prawdopodobieństwem p w każdym doświadczeniu) lub „porażką” i zmienna losowa X oznacza liczbę „sukcesów” to powyższy wzór wyznacza prawdopodobieństwo uzyskania dokładnie k sukcesów w n doświadczeniach (próbach). 8 Sprawdzenie n k n−k n ( ) P ( X = k ) = p q = p + q =1 ∑ ∑ k k =0 k =0 n n 9 EX = np, D2X = npq 10 Przykład Prawdopodobieństwo uszkodzenia kserokopiarki przed upływem gwarancji wynosi 0,2. Firma zakupiła 6 kserokopiarek. Obliczyć prawdopodobieństwo, że przed upływem gwarancji 2 kserokopiarki ulegną uszkodzeniu. Jaka jest najbardziej prawdopodobna liczba uszkodzonych kserokopiarek przed upływem gwarancji. X – liczba uszkodzonych kserokopiarek przed upływem gwarancji, 11 6 2 4 P ( X = 2) = 0,2 0,8 = 15 ⋅ 0,04 ⋅ 0,4096 = 0,24576 2 12 Uwaga xk 0 pk 0,2621 1 2 3 4 5 6 0,3932 0,2458 0,0819 0,0154 0,0015 0,0001 13 Przykład Rzucamy 4 razy kostką sześcienną. Jakie jest prawdopodobieństwo, że w co najmniej 3 rzutach liczba oczek będzie podzielna przez 3?. 14 Szukane prawdopodobieństwo to P(X ≥ 3) = P(X = 3) + P(X = 4), gdzie „sukcesem” jest uzyskanie 3 lub 6 oczek, więc p = 1/3. 15 Zatem 3 1 4 1 2 2 8 P( X = 3) = = 4 ⋅ = 81 81 3 3 3 4 0 4 1 2 1 1 P( X = 4) = = 1 ⋅ = 81 81 4 3 3 P ( X ≥ 3) = P ( X = 3) + P ( X = 4) = 16 8 1 1 + = 81 81 9 Przykład Obliczymy wartość oczekiwaną rozkładu dwumianowego. n n k n−k n! EX = ∑ k p q = ∑ k p k q n−k = k!(n − k )! k =0 k k =1 n (n − 1)! = np ∑ p k −1q n −k = np ( p + q ) n −1 = np k =1 ( k − 1)!( n − k )! n 17 Rozkład geometryczny X - liczba prób Bernoulliego poprzedzających pierwszy sukces P ( X = k ) = pq k q=1-p k = 0, 1, 2, ... 18 Sprawdzenie ∞ ∞ k =0 k =0 k P ( X = k ) = pq ∑ ∑ = 19 p =1 1− q 2 EX = q/p; D X = q/p 20 2 Rozkład Poissona Dla λ > 0 określamy funkcję prawdopodobieństwa λ k −λ P (X = k ) = e k = 0, 1, 2, ... k! 21 Siméon Denis Poisson (1781–1840), francuski mechanik teoretyk, fizyk i matematyk. W matematyce zajmował się całkami oznaczonymi, równaniami różnicowymi i różniczkowymi oraz teorią prawdopodobieństwa. 22 Sprawdzenie ∞ ∞ k =0 k =0 ∑ P( X = k ) = ∑ =e −λ ∞ λ k ∑ k! = e λ k k! −λ λ e −λ = e =1 k =0 23 EX = λ D2X = λ 24 Przykład Obliczymy wartość oczekiwaną rozkładu Poissona. ∞ ∞ λk −λ λk −1 −λ EX = ∑ k e = λe ∑ = λ e −λ e λ = λ k =0 k! k =1 25 (k − 1)! Rozkład Poissona (możliwość odczytu w tablicy) może dla dużych n (praktycznie n ≥ 30) i małych p (praktycznie p ≤ 0,2) przybliżać rozkład dwumianowy (przybliżenie Poissona) n k n − k λk − λ p q ≈ e gdzie λ = n ⋅ p k! k 26 Przykład W pudełku jest 400 żarówek. Jakie jest prawdopodobieństwo, że wśród nich jest 5 żarówek wadliwych, jeśli wadliwość produkcji takich żarówek wynosi 0,5%? Jaka jest najbardziej prawdopodobna liczba uszkodzonych żarówek w tym pudełku? 27 Zastosujemy przybliżenie Poissona, λ = n ⋅ p = 400 ⋅ 0,005 = 2 . W tablicy rozkładu Poissona (tablica I) odczytamy, że: P(X = 5) = 0,0361 Również w tablicy rozkładu Poissona odczytamy, że najbardziej prawdopodobna liczba uszkodzonych żarówek w tym pudełku to 1 lub 2 (dla obu tych liczb prawdopodobieństwo jest równe 0,2707). 28 Rozkłady ciągłe Rozkład jednostajny Rozkład którego gęstość jest stała w pewnym przedziale nazywamy jednostajnym. Gęstość rozkładu jednostajnego w (a, b) 1 x ∈ (a; b) f ( x) = b − a 0 x ∉ ( a ; b) 29 Ponieważ gęstość ta ma oś symetrii w punkcie x = (a + b)/2 to EX = (a+b)/2 30 Pokażemy, że D2X = (b – a)2/12 31 Przykład Najpierw obliczymy EX2 3 b b 1 1 x EX = ∫ x dx = b−a b−a 3 a 2 2 = a 1 b 3 a 3 a 2 + 2ab + b 2 − = = b−a 3 3 3 Zatem (b − a ) a 2 + 2ab + b 2 a + b 2 2 2 D X = EX − ( EX ) = − = 3 12 2 2 32 2 Rozkład wykładniczy Rozkład ten występuje często w zagadnieniach rozkładu czasu między zgłoszeniami (awariami) lub czasu oczekiwania na obsługę w systemach kolejkowych. Gęstość rozkładu wykładniczego o parametrze a > 0 ma postać ae − ax f ( x) = 0 33 x>0 x≤0 dystrybuantą tego rozkładu jest funkcja 1 − e − ax F ( x) = 0 (uzasadnienie: F'(x) = f(x)) 34 x>0 x≤0 Przykład Obliczymy EX ∞ ∞ 1 1 EX = ∫ xae − ax dx = − xe − ax − e − ax = a 0 a 0 1 D2 X = 2 a 35 Własność. 1) Jeśli liczba zgłoszeń w systemie kolejkowym w przedziale czasu (t, t + T) ma rozkład Poissona o parametrze λT, oraz liczby zgłoszeń przychodzące w rozłącznych przedziałach czasu są niezależne to czas X między kolejnymi zgłoszeniami ma rozkład wykładniczy o parametrze a = 1/λ. 2) Dla dowolnych t, T > 0 mamy P( X ≥ t + T | X ≥ t ) = P( X ≥ T ) (własność braku pamięci) P( X ≥ t + T | X ≥ t ) = P( X ≥ t + T ∧ X ≥ t ) P( X ≥ t + T ) = = P( X ≥ t ) P( X ≥ t ) e − ( t +T ) a = −ta = e −Ta = P( X ≥ T ) e Jest to jedyny rozkład ciągły o tej własności. 36 Rozkład normalny (Gaussa) N (m,σ ) m ∈ R , σ ∈(0, + ∞) Dla Określamy gęstość rozkładu f ( x) = 1 σ 2π e ( x−m )2 − 2σ 2 37 x∈R Carl Friedrich Gauss (1777 - 1855) – niemiecki matematyk i fizyk. Jego badania związane z teorią błędów doprowadziły do odkrycia rozkładu normalnego zmiennej losowej (nazywany także rozkładem Gaussa), który jest najważniejszym rozkładem w teorii prawdopodobieństwa. 38 39 Uwaga Jeśli X ma rozkład N(m, σ) to zmienna losowa Y = (X – m)/σ ma rozkład N(0, 1) (takie przekształcenie nazywamy standaryzacją). 40 Wartości dystrybuanty dla argumentów ujemnych wyznaczamy na podstawie zależności Φ(– x) = 1 – Φ(x) 41 Przykład Dochód miesięczny (zł) w pewnej populacji osób ma rozkład normalny N(1600; 300). Jaki procent osób w tej populacji ma dochód miesięczny poniżej 1000 zł? X – wysokość miesięcznego dochodu X − 1600 1000 − 1600 P ( X < 1000) = P < = P(Y < −2 ) = 300 300 = Φ (−2) = 1 − Φ(2) = 1 − 0,9772 = 0,0228 = 2,28% 42 Przykład Czas wykonania pewnego detalu (min.) jest zmienną losową o rozkładzie normalnym N(m; σ). Wiadomo, że 80% robotników wykonuje ten detal dłużej niż 10 minut a 60% robotników dłużej niż 12 minut. a)wyznacz parametry rozkładu czasu wykonania detalu m i σ, b) jaki odsetek robotników wykonuje ten detal w czasie krótszym niż 6 minut? X – czas wykonania detalu. 43 P( X > 10) = 0,8 stąd m − 10 σ = 0,84 m − 12 P( X > 12) = 0,6 stąd σ = 0,25 Rozwiązując powyższy układ równań otrzymamy m = 12,85; σ = 3,39. X −12,85 6 −12,85 = P(Y < −2,02) = P(X < 6) = P < 3,39 3,39 = Φ(−2,02) =1−Φ(2,02) = 0,0217= 2,17% 44 Prawo trzech sigm Jeśli X ma rozkład N(m, σ) to P(m − σ < X < m + σ ) = 0,683 , P (m − 2σ < X < m + 2σ ) = 0,955 , P(m − 3σ < X < m + 3σ ) = 0,997 Ostatnia równość świadczy o tym, że chociaż rozkład normalny ma gęstość różną od zera na całej prostej to praktycznie niemal wszystkie realizacje skupiają się w przedziale ( m − 3σ , m + 3σ ) własność tą nazywamy prawem trzech sigm. 45 Interpretacja graficzna parametrów rozkładu N(m, σ) 46 Trzy rozkłady ciągłe, które mają duże znaczenie w statystyce matematycznej: – Rozkład chi kwadrat, – Rozkład Studenta, – Rozkład F – Snedecora Rozkłady te są stablicowane. 47 Rozkład chi kwadrat (χ2) Yn n – liczba stopni swobody Yn = X 12 + .... + X n2 X1 , ..., Xn - niezależne, o rozkładzie N(0, 1) EX = n; D2X = 2n 48 Odczyt z tablicy dla rozkładu chi kwadrat. (podobnie interpretujemy graficznie odczyt z tablicy F – Snedecora.) P (Yn ≥ k ) = α 49 Uwaga. 1) Dla n = 1, 2 wykres gęstości rozkładu chi kwadrat jest inny (tylko część malejąca wykresu) 2) dla n > 30 stosujemy przybliżenie rozkładem normalnym. 2Yn ~ N ( 2n − 1;1) 50 Rozkład Studenta Tn n – liczba stopni swobody X Tn = Yn X, Yn - niezależne X o rozkładzie N(0, 1); Yn o rozkładzie chi kwadrat z n stopniami swobody EX = 0 ; dla n > 1 D2X = n/(n-2) dla n > 2 Uwaga. Tn n→∞ → N (0,1) 51 Odczyt z tablicy (tablica IV) dla rozkładu Studenta. P ( Tn ≥ k ) = α 52