2 Zmienne losowe dyskretne
Transkrypt
2 Zmienne losowe dyskretne
PROB2 – Zmienne losowe dyskretne 1 plik dyskretne.tex 9 grudnia 2005, ELEMENTY PROBABILISTYKI R.2 2 2.1 Zmienne losowe dyskretne Ogólne definicje i wÃlasności Zmienna losowa X jest zmienna, losowa, dyskretna,, jeśli przyjmuje tylko skończona, (lub przeliczalna) , liczbe, wartości x0 , x1 , . . . , xk z określonymi prawdopodobieństwami p0 , p2 , . . . , pk . Tak wiec , mamy: x0 , x1 , . . . , xk – możliwe wartości zmiennej losowej, p0 , p1 , . . . , pk – p-stwa wystapienia poszczególnych wartości. , Liczba k może oznaczać dowolnie duża, liczbe, caÃlkowita,, w szczególności możliwych wartości xi może być nieskończenie wiele. Piszemy wtedy x0 , x1 , . . . , ∞. Zbiór wszystkich możliwych wartości zmiennej losowej X bedziemy oznaczać symbolem , H i nazywać nośnikiem rozkÃladu zmiennej X. Prawdopodobieństwa pi , i = 0, . . . , k (lub i = 0, . . . , ∞) musza, speÃlniać warunki: P 1) 0 ≤ pi ≤ 1, 2) i∈H pi = 1. Równoważne oznaczenia prawdopodobieństw pi : pi = P (X = xi ), lub pi = P (X = i). PrzykÃlad. Zmienna losowa przyjmujaca 4 wartości. Zmienna losowa X określona w , tabelce poniżej przyjmuje tylko 4 wartości, podane w pierwszym wierszu tabelki. Drugi wiersz tabelki zawiera odpowiednie prawdopodobieństwa. W trzecim wierszu tabelki (cum pi ) zsumowano kolejne prawdopodobieństwa. Jak widać, sumuja, sie, one do jedności. xi pi sum pi 0 2 3 5 0.1 0.3 0.4 0.2 0.1 0.4 0.8 1.0 zbiór H, nośnik rozkÃladu kolejne prawdopodobieństwa skumulowane p-stwa Tak wiec, rozkÃlad prawdopodobieństwa zmiennej losowej X jest określony za po, moca, par {xi , pi }. Dla omawianego przykÃladu rozkÃlad ten jest przedstawiony graficznie na rys. 2.1, lewy wykres: Cumulative p.d.f. 1 0.4 0.8 0.3 0.6 F(x) p(x) Discrete probabilities 0.5 0.2 0.4 0.1 0.2 0 0 2 3 x 5 0 −2 0 2 4 6 x Rysunek 2.1: PrzykÃladowy rozkÃlad dyskretnej zmiennej losowej X (lewa strona) oraz jego skumulowane wartości (prawy strona). PROB2 – Zmienne losowe dyskretne 2 Na tym samym rysunku (2.1), na wykresie z prawej strony, jest przedstawiony wykres skumulowanych wartości dla omawianego rozkÃladu. Jak widzimy, dla zmiennej losowej dyskretnej wykres ten przedstawia niemalejac Funkcja ta ma , a, funkcje, schodkowa. , punkty nieciagà , lości dla wartości x1 , x2 , . . . , xk ; wielkości skoków sa, równe wartościom pi przyjmowanym przez X w tych punktach. Funkcja F(x) przedstawiajaca skumulowane wartości zostaÃla w tym przypadku zdefi, niowana jako X F (x) = P (X ≤ x) = P (X = xi ) (2.1) xi ≤x Typowymi przykÃladami zmiennych losowych dyskretnych sa:, 1. 2. 3. 4. 5. 2.2 rozkÃlad rozkÃlad rozkÃlad rozkÃlad rozkÃlad binarny, czyli zerojedynkowy dwumianowy, rozkÃlad Poissona Pascala, czyli ujemny dwumianowy geometryczny hipergeometryczny Wartość oczekiwana i wariancja zmiennej losowej dyskretnej Zanim przejdziemy do omówienie niektórych z wymienionych rozkÃladów, Wprowadzimy bardzo ważne określenia charakteryzujace rozkÃlady zmiennych losowych. Sa, nimi wartość , oczekiwana i wariancja zmiennej losowej X. Deficje te podajemy dla zmiennych losowych dyskretnych. Wartość oczekiwana µ wskazuje na wartość średnia, rozkÃladu, natomiast odchylenie standardowe σ na rozproszenie wartości xi wokóÃl średniej µ. Definicja. Wartościa, oczekiwana, dyskretnej zmiennej losowej X nazywa sie, wyrażenie (H oznacza nośnik wartości zmiennej losowej X): Sumowanie możemy również zapisać z wyszczególnieniem elementów sumowanych, np. Pk P∞ i=0 . i=1 , lub E(X) = P xi ∈H xi pi . Wartość oczekiwana, oznacza sie, czesto symbolem µ. Mamy wiec: µ = E(X). , , Definicja. Wariancja, dyskretnej zmiennej losowej X nazywa sie, wyrażenie: V ar(X) = E[(X − µ)2 ] = P xi ∈H (xi − µ)2 pi . Wariancja jest oznaczana również symbolem σ 2 . Pierwiastek z wariancji nazywa sie, odchyleniem standardowym. Przyklad z poprzedniej sekcji, kontynuacja. Obliczamy E(X) i V ar(X) Wartość oczekiwana: E(X) = 0 × 0.1 + 2 × 0.3 + 3 × 0.4 + 5 × 0.2 = 2.8. Wariancja: V ar(X) = (−2.8)2 × 0.1 + 0.82 × 0.3 + 0.22 × 0.4 + 2.22 × 0.2 = 0.784 + 0.192 + 0.016 q + 0.968 =√1.960. Odchylenie standardowe: σ = V ar(X) = 1.960 = 1.4. PROB2 – Zmienne losowe dyskretne 3 Obliczenia najlepiej zorganizować w tabelce, wtedy trudniej o omyÃlke: , xi pi xi × pi (xi − µ) (xi − µ)2 (xi − µ)2 × pi 0 0.1 0.0 -2.8 7.84 0.784 2 0.3 0.6 -0.8 0.64 0.192 3 0.4 1.2 0.2 0.02 0.016 5 0.2 1.0 2.2 4.84 0.968 suma 2.8 1.960 Otrzymamy wtedy: E(X) ≡ µ = 2.8, V ar(X) ≡ σ 2 = 1.96, czyli te same wyniki co poprzednio. Zadania Zadanie 2.1. Loteria zawiera 1 los wygrywajacy 1000 $, dwa losy wygrywajace 500 $, 5 , , losów wygrywajacych 100 $, oraz 50 losów wygrywajacych 5 $. Poza tym sa, losy puste, , , czyli nie wygrywajace nic. , Jaka jest oczekiwana wygrana? Ile powinien kosztować los, aby organizatorzy nie stracili na loterii? Zadanie 2.2. W urnie znajduja, sie: 4 kule czerwone, 3 biaÃle i 1 czarna. Grajacy , , otrzymuje 10 centów, gdy wyciagnie kul e czerwon a,, nie otrzymuje nic, gdy wyciagnie kule, , , , biaÃla,, i pÃlaci 50 centów, gdy wyciagnie kule, czarna., , Jaka jest oczekiwana wygrana? Zadanie 2.3. W zakladzie opracowano nowy produkt. Jest on wart (można go sprzedać) za 1000 $. Wylansowanie i wprowadzenie na rynek produktu kosztuje 1500 $. Cze, ść A. Produkt wprowadzony na rynek może a) odnieść duży sukces – z p-stwem =.2, b) odnieść umiarkowany sukces – z p-stwem 0.5, c) nie spotkać sie, z żadnym zainteresowaniem – z p-stwem 0.3. Ocena zysków: w przypadku a): 10000 $, w przypadku b): 4000 $, w przypadku c): –6000 $. Cze, ść B. Postanowiono przed ostateczna, decyzja, (sprzedać produkt czy lansować go samodzielnie) przeprowadzić odpowiednie badania rynkowe. Badania takie kosztuja, 500 $. Badania rynkowe moga, być pozytywne (że rynek jest zainteresowany produktem) lub negatywne (że rynek nie jest zainteresowany produktem). Niezależnie od opinii z badań rynkowych zakÃlad może chcieć mimo wszystko wprowadzić swój produkt na rynek. Wtedy p-stwa dużego sukcesu, umiarkowanego sukcesu i porażki, oceniane osobno dla przypadków pozytywnej i negatywnej opinii badań, przedstawiaja, sie, nastepuj aco: , , Gdy badania rynkowe pozytywne Gdy badania rynkowe negatywne Projekt może odnieść Duży sukces Umiarkowany sukces MaÃly sukces 0.6 0.2 0.2 0.1 0.3 0.6 Jakie sa, oczekiwane zyski w obu przypadkach? Czy zaklad powinien wprowadzać swój produkt na rynek, czy też sprzedać go? PROB2 – Zmienne losowe dyskretne 2.3 4 RozkÃlad binomialny (dwumianowy lub Bernoulliego) Mamy serie, n niezależnych doświadczeń. Wynikiem każdego doświadczenia jest ’sukces’ lub ’porażka’ (np. orzeÃl lub reszka). Prawdopodobieństwo sukcesu jest takie samo w każdym doświadczeniu i wynosi p, gdzie 0 < p < 1. Określamy zmienna, losowa, X jako liczbe, sukcesów w opisanej serii n doświadczeń. Zmienna losowe X może przyjmować wartości 0, 1, . . . n z prawdopodobieństwami p0 , p1 , . . . , pn określonymi nastepuj aco: , , à ! pi = P (X = i) = n i p (1 − p)n−i , i = 0, 1, . . . , n. i Parametrami rozkÃladu binomialnego sa:, n – dÃlugość serii, oraz p – prawdopodobieństwo sukcesu w jednym doświadczeniu, dlatego też zmienna, o rozkÃladzie binomialnym oznacza sie, jako funkcje, b(i; n, p). Chcac , zaznaczyć wyraźnie, że zmienna losowa X ma rozkÃlad binomialny, dajemy literke, b jako wskaźnik dolny symbolu oznaczajacego te, zmienna, i piszemy Xb jako oznaczenie tej , zmiennej losowej Xb ∼ b(n, p). Dla przykÃladu pokazujemy rozkÃlad binomialny b(i; 24, 0.75) i jego dystrybuante. , Argumenty obu funkcji sa, oznaczone symbolem ’x’. L à atwo sprawdzić, że wartość oczekiwana tego rozkÃladu wynosi np = 24 · 0.75 = 18.00, a wariancja np(1 − p) = 24 · 0.75 · 0.25 = 4.50. Rysunek 2.2. RozkÃlad prawdopodobieństwa (góra) i skumulowane prawdopodobieństwa (dóÃl) dla rozkÃladu binomialnego z parametrami n = 24, p = 0.75, czyli rozkÃladu b(i; 24, 0.75). i prob[x=i] 0 0.00000 1 0.00000 2 0.00000 3 0.00000 4 0.00000 5 0.00000 6 0.00000 7 0.00000 8 0.00002 9 0.00009 10 0.00041 11 0.00157 12 0.00511 13 0.01414 14 0.03333 15 0.06665 16 0.11248 17 0.15879 18 0.18526 19 0.17551 20 0.13163 21 0.07522 22 0.03077 23 0.00803 24 0.00100 prob[x<=i] prob[x>i] 0.00000 1.00000 0.00000 1.00000 0.00000 1.00000 0.00000 1.00000 0.00000 1.00000 0.00000 1.00000 0.00000 1.00000 0.00000 1.00000 0.00002 0.99998 0.00011 0.99989 0.00052 0.99948 0.00209 0.99791 0.00720 0.99280 0.02134 0.97866 0.05466 0.94534 0.12132 0.87868 0.23380 0.76620 0.39259 0.60741 0.57784 0.42216 0.75335 0.24665 0.88498 0.11502 0.96020 0.03980 0.99097 0.00903 0.99900 0.00100 1.00000 0.00000 PROB2 – Zmienne losowe dyskretne 5 Rysunki i tabele otrzymano za pomoca, pakietu WINSTATS. Pokazuje sie, , że wartość oczekiwana zmiennej X o rozkÃladzie b(n,p) wynosi µ = np, 2 a wariancja σ = np(1 − p). Podstawiajac , q = 1 − p otrzymujemy: E(Xb ) = np, V ar(Xb ) = npq. Można pokazać, że rozkÃlad binomialny jest rozkÃladem symetrycznym. W przypadku n parzystego rozkÃlad binomialny posiada dwie takie same wartości modalne, natomiast w przypadku n nieparzystego — dokÃladnie jedna, wartośc modalna., 2.4 RozkÃlady graniczne rozkÃladu binomialnego przy n −→ +∞ Co sie, dzieje z rozkÃladem binomialnym, gdy liczba doświadczeń n rośnie nieograniczenie, czyli staje sie, bardzo duża? W zależności od p, prawdopodobieństwa sukcesu, wyróżniamy tu dwa przypadki: A. Parametr p wykazuje wartośc umiarkowana,, tj. ani bardzo maÃla,, ani bardzo duża., Na ogóÃl oznacza to, że 0.05 < p < 0.95. Wtedy można wykazać, że rozkÃlad binomialny daży asymptotycznie do rozkÃladu , normalnego (Gaussa–Laplace’a) o parametrach µ = np i σ 2 = npq, gdzie q = 1 − p. Oznacza to, że dla dużego n prawdopodobieństwa z rozkÃladu binomialnego b(n, p) moga, być wyznaczane za pomoca, prawdopodobieństw w rozkÃladzie normalnym N (µ = np, σ 2 = npq) {rozkÃladem tym bedziemy sie, zajmować w rozdziale 4}. , PrzykÃladowo na rysunku 2.2 (góra) można zobaczyć, że dla n = 24, p = 0.75 przedstawiony rozkÃlad binomialny jest już dość dobrze aproksymowany rozkÃladem normalnym. Dalsze przykÃlady rozkÃladu binomialnego sa, pokazane na końcu tego rozdziaÃlu. B. Parametr p jest maÃly, czyli wystapienie sukcesu jest zjawiskiem rzadkim. PoÃlóżmy: , np = λ i obliczmy granice, , gdy n → ∞ (odpowiada to sytuacji, gdy do partii towaru zawierajacego pewien procent braków bedziemy dodawać coraz to wiecej sztuk , , , dobrych). Otrzymujemy wtedy à ! lim n→∞ à ! à !i à n i n p (1 − p)n−i = lim n→∞ i i λ n λ 1 − n !n−i = ... = λi − λ e . i! Otrzymujemy ostatecznie rozkÃlad noszacy nazwe, rozkÃladu Poissona: , P (X = i|λ) = λi − λ e , i = 0, 1, . . . . i! RozkÃlad ten jest opisywany w nastepnej podsekcji jako kolejny przykÃlad rozkÃladu , dyskretnego, którego nośnik zawiera nieskończenie wiele wartości. PROB2 – Zmienne losowe dyskretne 2.5 6 RozkÃlad Poissona Definicja. Zmienna losowa X ma rozkÃlad Poissona, jeśli przyjmuje wartości i = 0, 1, 2, ... z prawdopodobieństwami pi wyznaczonymi nastepuj acym wzorem: , , pi = P (X = i|λ) = λi − λ e , i = 0, 1, . . . . i! Wartość λ > 0 jest parametrem rozkÃladu. P∞ P∞ λi − λ Oczywiście ≡ 1. i=0 pi = i=0 i! e Wartość oczekiwana i wariancja zmiennej o rozkÃladzie Poissona wynosza, odpowiednio: E(XP oisson ) = λ, V ar(XP oisson ) = λ. Rysunek 2.3: RozkÃlad prawdopodobieństwa (lewa) i jego wartości skumulowane (prawa) dla rozkÃladu Poissona z parametrami λ = 2.5 i λ = 5.0. NaÃlożono również aproksymacje, rozkÃladem normalnym i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 lambda = 2.5 lambda = 5.0 prob[x=i] prob[x<=i] prob[x>i] i prob[x=i] prob[x<=i] prob[x>i] 0.08208 0.08208 0.91792 0 0.00674 0.00674 0.99326 0.20521 0.28730 0.71270 1 0.03369 0.04043 0.95957 0.25652 0.54381 0.45619 2 0.08422 0.12465 0.87535 0.21376 0.75758 0.24242 3 0.14037 0.26503 0.73497 0.13360 0.89118 0.10882 4 0.17547 0.44049 0.55951 0.06680 0.95798 0.04202 5 0.17547 0.61596 0.38404 0.02783 0.98581 0.01419 6 0.14622 0.76218 0.23782 0.00994 0.99575 0.00425 7 0.10444 0.86663 0.13337 0.00311 0.99886 0.00114 8 0.06528 0.93191 0.06809 0.00086 0.99972 0.00028 9 0.03627 0.96817 0.03183 0.00022 0.99994 0.00006 10 0.01813 0.98630 0.01370 0.00005 0.99999 0.00001 11 0.00824 0.99455 0.00545 0.00001 1.00000 0.00000 12 0.00343 0.99798 0.00202 0.00000 1.00000 0.00000 13 0.00132 0.99930 0.00070 0.00000 1.00000 0.00000 14 0.00047 0.99977 0.00023 PROB2 – Zmienne losowe dyskretne 7 Rysunek 2.3 pokazuje wykresy rozkÃladu Poissona dla parametrów λ = 2.5 i λ = 5.0 oraz odpowiednie wartości prawdopodobieństw. RozkÃlad Poissona otrzymuje sie, jako rozkÃlad graniczny rozkÃladu dwumianowego, gdy dÃlugość serii (n) jest duża, a prawdopodobieństwo sukcesu (p) maÃle. ’Duże n’ oznacza wartości wieksze niż 30, ’maÃle p’ oznacza wartości mniejsze niż 0.05. Pojecia ’duże’ i ’maÃle’ , , sa, pojeciami rozmytymi (’fuzzy’) i zależ a od stopnia przybliżenia jaki chcemy osiagnć. , , , Z kolei, przy dużych wartościach λ, rozkÃlad Poissona może być aproksymowany rozkÃladem normalnym N (µ = λ, σ 2 = λ). PrzykÃlad takiej aproksymacji jest pokazany na rysunku 3.3; nie jest ona jeszcze bardzo dokÃladna. Zadania Zadanie 2.4. Liczba bÃledów popeÃlnianych przez studentów kursu jez. angielskiego przy , , dyktandzie pewnego testu opisuje sie, rozkÃladem Poissona z parametrem λ = 5.0. Jakie jest prawdopodobieństwo, że osoba piszaca dyktando a) nie popeÃlni żadnego , bÃledu, b) popeÃlni 10 bÃledów lub wiecej, c) popeÃlni dokÃladnie 4 lub 5 bÃledów? , , , , Zadanie 2.5. Producent twierdzi, że jego produkty (zapalniczki) nie zawieraja, wiecej, , niż 2,5 procent wadliwych sztuk. Zbadano karton zapalniczek zawierajacy 100 sztuk i znale, ziono 5 wadliwych zapalniczek. Czy można mieć watpliwość co do twierdzenia producenta, , że jego towar zawiera nie wiecej niź 2,5 procent wadliwych sztuk? , Zadanie 2.6. Na podstawie przeprowadzonej wyrywkowej kontroli ocenia sie, wadliwość masowo produkowanych wkretów na 2,5 %. Wkrety pakuje sie, w pudeÃleczka po 50 sztuk. , , Obliczyć prawdopodobieństwo, że w pudeÃleczku nie bedzie wadliwej sztuki. Rachunek , można przeprowadzić w oparciu o rozkÃlad Poissona lub rozkÃlad dwumianowy (dlaczego?). Porównaj wyniki. Literatura [1] Bobrowski D., Elementy rachunku prawdopodobieństwa z elementami statystyki matematycznej. Wydawnictwo Naukowe WSNHID, Poznań 2002. s. X+159. [2] Pakiet winstats http://math.exeter.edu/rparris Dodatek. Inne przykÃladowe wykresy i tablice wartości zmiennych losowych o rozkÃladzie binomialnym PROB2 – Zmienne losowe dyskretne i 0 1 2 3 4 5 6 7 8 prob[x=i] prob[x<=i] prob[i<x] BINOMIAL b[12, 0.25] 0.03168 0.03168 0.96832 0.12671 0.15838 0.84162 0.23229 0.39068 0.60932 0.25810 0.64878 0.35122 0.19358 0.84236 0.15764 0.10324 0.94560 0.05440 0.04015 0.98575 0.01425 0.01147 0.99722 0.00278 0.00239 0.99961 0.00039 0 1 2 3 4 5 6 7 8 9 10 BINOMIAL b[16, 0.25] 0.01002 0.01002 0.98998 0.05345 0.06348 0.93652 0.13363 0.19711 0.80289 0.20788 0.40499 0.59501 0.22520 0.63019 0.36981 0.18016 0.81035 0.18965 0.11010 0.92044 0.07956 0.05243 0.97287 0.02713 0.01966 0.99253 0.00747 0.00583 0.99836 0.00164 0.00136 0.99971 0.00029 i 4 5 6 7 8 9 10 11 12 prob[x=i] prob[x<=i] prob[i<x] BINOMIAL b[12, 0.75] 0.00239 0.00278 0.99722 0.01147 0.01425 0.98575 0.04015 0.05440 0.94560 0.10324 0.15764 0.84236 0.19358 0.35122 0.64878 0.25810 0.60932 0.39068 0.23229 0.84162 0.15838 0.12671 0.96832 0.03168 0.03168 1.00000 0.00000 6 7 8 9 10 11 12 13 14 15 16 BINOMIAL b[16, 0.75] 0.00136 0.00164 0.99836 0.00583 0.00747 0.99253 0.01966 0.02713 0.97287 0.05243 0.07956 0.92044 0.11010 0.18965 0.81035 0.18016 0.36981 0.63019 0.22520 0.59501 0.40499 0.20788 0.80289 0.19711 0.13363 0.93652 0.06348 0.05345 0.98998 0.01002 0.01002 1.00000 0.00000 8