2 Zmienne losowe dyskretne

Transkrypt

2 Zmienne losowe dyskretne
PROB2 – Zmienne losowe dyskretne
1
plik dyskretne.tex 9 grudnia 2005, ELEMENTY PROBABILISTYKI R.2
2
2.1
Zmienne losowe dyskretne
Ogólne definicje i wÃlasności
Zmienna losowa X jest zmienna, losowa, dyskretna,, jeśli przyjmuje tylko skończona, (lub przeliczalna)
, liczbe, wartości x0 , x1 , . . . , xk z określonymi prawdopodobieństwami p0 , p2 , . . . , pk .
Tak wiec
, mamy:
x0 , x1 , . . . , xk – możliwe wartości zmiennej losowej,
p0 , p1 , . . . , pk – p-stwa wystapienia
poszczególnych wartości.
,
Liczba k może oznaczać dowolnie duża, liczbe, caÃlkowita,, w szczególności możliwych
wartości xi może być nieskończenie wiele. Piszemy wtedy x0 , x1 , . . . , ∞.
Zbiór wszystkich możliwych wartości zmiennej losowej X bedziemy
oznaczać symbolem
,
H i nazywać nośnikiem rozkÃladu zmiennej X.
Prawdopodobieństwa pi , i = 0, . . . , k (lub i = 0, . . . , ∞) musza, speÃlniać warunki:
P
1) 0 ≤ pi ≤ 1,
2) i∈H pi = 1.
Równoważne oznaczenia prawdopodobieństw pi : pi = P (X = xi ), lub pi = P (X = i).
PrzykÃlad. Zmienna losowa przyjmujaca
4 wartości. Zmienna losowa X określona w
,
tabelce poniżej przyjmuje tylko 4 wartości, podane w pierwszym wierszu tabelki.
Drugi wiersz tabelki zawiera odpowiednie prawdopodobieństwa.
W trzecim wierszu tabelki (cum pi ) zsumowano kolejne prawdopodobieństwa. Jak widać,
sumuja, sie, one do jedności.
xi
pi
sum pi
0
2
3
5
0.1 0.3 0.4 0.2
0.1 0.4 0.8 1.0
zbiór H, nośnik rozkÃladu
kolejne prawdopodobieństwa
skumulowane p-stwa
Tak wiec,
rozkÃlad prawdopodobieństwa zmiennej losowej X jest określony za po,
moca, par {xi , pi }. Dla omawianego przykÃladu rozkÃlad ten jest przedstawiony graficznie na
rys. 2.1, lewy wykres:
Cumulative p.d.f.
1
0.4
0.8
0.3
0.6
F(x)
p(x)
Discrete probabilities
0.5
0.2
0.4
0.1
0.2
0
0
2
3
x
5
0
−2
0
2
4
6
x
Rysunek 2.1: PrzykÃladowy rozkÃlad dyskretnej zmiennej losowej X (lewa strona) oraz jego
skumulowane wartości (prawy strona).
PROB2 – Zmienne losowe dyskretne
2
Na tym samym rysunku (2.1), na wykresie z prawej strony, jest przedstawiony wykres
skumulowanych wartości dla omawianego rozkÃladu. Jak widzimy, dla zmiennej losowej dyskretnej wykres ten przedstawia niemalejac
Funkcja ta ma
, a, funkcje, schodkowa.
,
punkty nieciagÃ
, lości dla wartości x1 , x2 , . . . , xk ; wielkości skoków sa, równe wartościom pi
przyjmowanym przez X w tych punktach.
Funkcja F(x) przedstawiajaca
skumulowane wartości zostaÃla w tym przypadku zdefi,
niowana jako
X
F (x) = P (X ≤ x) =
P (X = xi )
(2.1)
xi ≤x
Typowymi przykÃladami zmiennych losowych dyskretnych sa:,
1.
2.
3.
4.
5.
2.2
rozkÃlad
rozkÃlad
rozkÃlad
rozkÃlad
rozkÃlad
binarny, czyli zerojedynkowy
dwumianowy, rozkÃlad Poissona
Pascala, czyli ujemny dwumianowy
geometryczny
hipergeometryczny
Wartość oczekiwana i wariancja zmiennej losowej dyskretnej
Zanim przejdziemy do omówienie niektórych z wymienionych rozkÃladów, Wprowadzimy
bardzo ważne określenia charakteryzujace
rozkÃlady zmiennych losowych. Sa, nimi wartość
,
oczekiwana i wariancja zmiennej losowej X. Deficje te podajemy dla zmiennych losowych
dyskretnych.
Wartość oczekiwana µ wskazuje na wartość średnia, rozkÃladu, natomiast odchylenie standardowe σ na rozproszenie wartości xi wokóÃl średniej µ.
Definicja. Wartościa, oczekiwana, dyskretnej zmiennej losowej X nazywa sie, wyrażenie
(H oznacza nośnik wartości zmiennej losowej X):
Sumowanie możemy również zapisać z wyszczególnieniem elementów sumowanych, np.
Pk
P∞
i=0 .
i=1 , lub
E(X) =
P
xi ∈H
xi pi .
Wartość oczekiwana, oznacza sie, czesto
symbolem µ. Mamy wiec:
µ = E(X).
,
,
Definicja. Wariancja, dyskretnej zmiennej losowej X nazywa sie, wyrażenie:
V ar(X) = E[(X − µ)2 ] =
P
xi ∈H
(xi − µ)2 pi .
Wariancja jest oznaczana również symbolem σ 2 .
Pierwiastek z wariancji nazywa sie, odchyleniem standardowym.
Przyklad z poprzedniej sekcji, kontynuacja. Obliczamy E(X) i V ar(X)
Wartość oczekiwana:
E(X) = 0 × 0.1 + 2 × 0.3 + 3 × 0.4 + 5 × 0.2 = 2.8.
Wariancja:
V ar(X) = (−2.8)2 × 0.1 + 0.82 × 0.3 + 0.22 × 0.4 + 2.22 × 0.2 =
0.784 + 0.192 + 0.016
q + 0.968 =√1.960.
Odchylenie standardowe: σ = V ar(X) = 1.960 = 1.4.
PROB2 – Zmienne losowe dyskretne
3
Obliczenia najlepiej zorganizować w tabelce, wtedy trudniej o omyÃlke:
,
xi
pi xi × pi (xi − µ) (xi − µ)2 (xi − µ)2 × pi
0 0.1
0.0
-2.8
7.84
0.784
2 0.3
0.6
-0.8
0.64
0.192
3 0.4
1.2
0.2
0.02
0.016
5 0.2
1.0
2.2
4.84
0.968
suma
2.8
1.960
Otrzymamy wtedy: E(X) ≡ µ = 2.8, V ar(X) ≡ σ 2 = 1.96,
czyli te same wyniki co poprzednio.
Zadania
Zadanie 2.1. Loteria zawiera 1 los wygrywajacy
1000 $, dwa losy wygrywajace
500 $, 5
,
,
losów wygrywajacych
100 $, oraz 50 losów wygrywajacych
5 $. Poza tym sa, losy puste,
,
,
czyli nie wygrywajace
nic.
,
Jaka jest oczekiwana wygrana? Ile powinien kosztować los, aby organizatorzy nie stracili na loterii?
Zadanie 2.2. W urnie znajduja, sie:
4 kule czerwone, 3 biaÃle i 1 czarna. Grajacy
,
,
otrzymuje 10 centów, gdy wyciagnie
kul
e
czerwon
a,, nie otrzymuje nic, gdy wyciagnie
kule,
,
,
,
biaÃla,, i pÃlaci 50 centów, gdy wyciagnie
kule, czarna.,
,
Jaka jest oczekiwana wygrana?
Zadanie 2.3. W zakladzie opracowano nowy produkt. Jest on wart (można go sprzedać)
za 1000 $. Wylansowanie i wprowadzenie na rynek produktu kosztuje 1500 $.
Cze, ść A. Produkt wprowadzony na rynek może
a) odnieść duży sukces – z p-stwem =.2,
b) odnieść umiarkowany sukces – z p-stwem 0.5,
c) nie spotkać sie, z żadnym zainteresowaniem – z p-stwem 0.3.
Ocena zysków:
w przypadku a): 10000 $,
w przypadku b): 4000 $,
w przypadku c): –6000 $.
Cze, ść B. Postanowiono przed ostateczna, decyzja, (sprzedać produkt czy lansować go
samodzielnie) przeprowadzić odpowiednie badania rynkowe. Badania takie kosztuja, 500 $.
Badania rynkowe moga, być pozytywne (że rynek jest zainteresowany produktem) lub
negatywne (że rynek nie jest zainteresowany produktem).
Niezależnie od opinii z badań rynkowych zakÃlad może chcieć mimo wszystko wprowadzić
swój produkt na rynek. Wtedy p-stwa dużego sukcesu, umiarkowanego sukcesu i porażki,
oceniane osobno dla przypadków pozytywnej i negatywnej opinii badań, przedstawiaja, sie,
nastepuj
aco:
,
,
Gdy badania rynkowe pozytywne
Gdy badania rynkowe negatywne
Projekt może odnieść
Duży sukces Umiarkowany sukces MaÃly sukces
0.6
0.2
0.2
0.1
0.3
0.6
Jakie sa, oczekiwane zyski w obu przypadkach? Czy zaklad powinien wprowadzać swój
produkt na rynek, czy też sprzedać go?
PROB2 – Zmienne losowe dyskretne
2.3
4
RozkÃlad binomialny (dwumianowy lub Bernoulliego)
Mamy serie, n niezależnych doświadczeń. Wynikiem każdego doświadczenia jest ’sukces’ lub
’porażka’ (np. orzeÃl lub reszka). Prawdopodobieństwo sukcesu jest takie samo w każdym
doświadczeniu i wynosi p, gdzie 0 < p < 1.
Określamy zmienna, losowa, X jako liczbe, sukcesów w opisanej serii n doświadczeń.
Zmienna losowe X może przyjmować wartości 0, 1, . . . n z prawdopodobieństwami p0 , p1 , . . . , pn
określonymi nastepuj
aco:
,
,
à !
pi = P (X = i) =
n i
p (1 − p)n−i , i = 0, 1, . . . , n.
i
Parametrami rozkÃladu binomialnego sa:, n – dÃlugość serii, oraz p – prawdopodobieństwo
sukcesu w jednym doświadczeniu, dlatego też zmienna, o rozkÃladzie binomialnym oznacza
sie, jako funkcje, b(i; n, p).
Chcac
, zaznaczyć wyraźnie, że zmienna losowa X ma rozkÃlad binomialny, dajemy literke,
b jako wskaźnik dolny symbolu oznaczajacego
te, zmienna, i piszemy Xb jako oznaczenie tej
,
zmiennej losowej
Xb ∼ b(n, p).
Dla przykÃladu pokazujemy rozkÃlad binomialny b(i; 24, 0.75) i jego dystrybuante.
, Argumenty obu funkcji sa, oznaczone symbolem ’x’. L
à atwo sprawdzić, że wartość oczekiwana
tego rozkÃladu wynosi np = 24 · 0.75 = 18.00, a wariancja np(1 − p) = 24 · 0.75 · 0.25 = 4.50.
Rysunek 2.2. RozkÃlad prawdopodobieństwa (góra) i skumulowane prawdopodobieństwa (dóÃl) dla rozkÃladu binomialnego z parametrami n = 24,
p = 0.75, czyli rozkÃladu b(i; 24, 0.75).
i prob[x=i]
0
0.00000
1
0.00000
2
0.00000
3
0.00000
4
0.00000
5
0.00000
6
0.00000
7
0.00000
8
0.00002
9
0.00009
10
0.00041
11
0.00157
12
0.00511
13
0.01414
14
0.03333
15
0.06665
16
0.11248
17
0.15879
18
0.18526
19
0.17551
20
0.13163
21
0.07522
22
0.03077
23
0.00803
24
0.00100
prob[x<=i] prob[x>i]
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00002
0.99998
0.00011
0.99989
0.00052
0.99948
0.00209
0.99791
0.00720
0.99280
0.02134
0.97866
0.05466
0.94534
0.12132
0.87868
0.23380
0.76620
0.39259
0.60741
0.57784
0.42216
0.75335
0.24665
0.88498
0.11502
0.96020
0.03980
0.99097
0.00903
0.99900
0.00100
1.00000
0.00000
PROB2 – Zmienne losowe dyskretne
5
Rysunki i tabele otrzymano za pomoca, pakietu WINSTATS.
Pokazuje sie,
, że wartość oczekiwana zmiennej X o rozkÃladzie b(n,p) wynosi µ = np,
2
a wariancja σ = np(1 − p). Podstawiajac
, q = 1 − p otrzymujemy:
E(Xb ) = np,
V ar(Xb ) = npq.
Można pokazać, że rozkÃlad binomialny jest rozkÃladem symetrycznym.
W przypadku n parzystego rozkÃlad binomialny posiada dwie takie same wartości modalne, natomiast w przypadku n nieparzystego — dokÃladnie jedna, wartośc modalna.,
2.4
RozkÃlady graniczne rozkÃladu binomialnego przy n −→ +∞
Co sie, dzieje z rozkÃladem binomialnym, gdy liczba doświadczeń n rośnie nieograniczenie,
czyli staje sie, bardzo duża? W zależności od p, prawdopodobieństwa sukcesu, wyróżniamy
tu dwa przypadki:
A. Parametr p wykazuje wartośc umiarkowana,, tj. ani bardzo maÃla,, ani bardzo duża., Na
ogóÃl oznacza to, że 0.05 < p < 0.95.
Wtedy można wykazać, że rozkÃlad binomialny daży
asymptotycznie do rozkÃladu
,
normalnego (Gaussa–Laplace’a) o parametrach µ = np i σ 2 = npq, gdzie q = 1 − p.
Oznacza to, że dla dużego n prawdopodobieństwa z rozkÃladu binomialnego b(n, p)
moga, być wyznaczane za pomoca, prawdopodobieństw w rozkÃladzie normalnym
N (µ = np, σ 2 = npq) {rozkÃladem tym bedziemy
sie, zajmować w rozdziale 4}.
,
PrzykÃladowo na rysunku 2.2 (góra) można zobaczyć, że dla n = 24, p = 0.75 przedstawiony rozkÃlad binomialny jest już dość dobrze aproksymowany rozkÃladem normalnym.
Dalsze przykÃlady rozkÃladu binomialnego sa, pokazane na końcu tego rozdziaÃlu.
B. Parametr p jest maÃly, czyli wystapienie
sukcesu jest zjawiskiem rzadkim. PoÃlóżmy:
,
np = λ i obliczmy granice,
, gdy n → ∞ (odpowiada to sytuacji, gdy do partii
towaru zawierajacego
pewien
procent braków bedziemy
dodawać coraz to wiecej
sztuk
,
,
,
dobrych). Otrzymujemy wtedy
à !
lim
n→∞
à ! à !i Ã
n i
n
p (1 − p)n−i = lim
n→∞
i
i
λ
n
λ
1 −
n
!n−i
= ... =
λi − λ
e .
i!
Otrzymujemy ostatecznie rozkÃlad noszacy
nazwe, rozkÃladu Poissona:
,
P (X = i|λ) =
λi − λ
e , i = 0, 1, . . . .
i!
RozkÃlad ten jest opisywany w nastepnej
podsekcji jako kolejny przykÃlad rozkÃladu
,
dyskretnego, którego nośnik zawiera nieskończenie wiele wartości.
PROB2 – Zmienne losowe dyskretne
2.5
6
RozkÃlad Poissona
Definicja. Zmienna losowa X ma rozkÃlad Poissona, jeśli przyjmuje wartości
i = 0, 1, 2, ... z prawdopodobieństwami pi wyznaczonymi nastepuj
acym
wzorem:
,
,
pi = P (X = i|λ) =
λi − λ
e , i = 0, 1, . . . .
i!
Wartość λ > 0 jest parametrem rozkÃladu.
P∞
P∞ λi − λ
Oczywiście
≡ 1.
i=0 pi =
i=0 i! e
Wartość oczekiwana i wariancja zmiennej o rozkÃladzie Poissona wynosza, odpowiednio:
E(XP oisson ) = λ, V ar(XP oisson ) = λ.
Rysunek 2.3: RozkÃlad prawdopodobieństwa (lewa) i jego wartości skumulowane (prawa)
dla rozkÃladu Poissona z parametrami λ = 2.5 i λ = 5.0. NaÃlożono również aproksymacje,
rozkÃladem normalnym
i
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
lambda = 2.5
lambda = 5.0
prob[x=i] prob[x<=i] prob[x>i]
i prob[x=i] prob[x<=i] prob[x>i]
0.08208
0.08208
0.91792 0
0.00674
0.00674
0.99326
0.20521
0.28730
0.71270 1
0.03369
0.04043
0.95957
0.25652
0.54381
0.45619 2
0.08422
0.12465
0.87535
0.21376
0.75758
0.24242 3
0.14037
0.26503
0.73497
0.13360
0.89118
0.10882 4
0.17547
0.44049
0.55951
0.06680
0.95798
0.04202 5
0.17547
0.61596
0.38404
0.02783
0.98581
0.01419 6
0.14622
0.76218
0.23782
0.00994
0.99575
0.00425 7
0.10444
0.86663
0.13337
0.00311
0.99886
0.00114 8
0.06528
0.93191
0.06809
0.00086
0.99972
0.00028 9
0.03627
0.96817
0.03183
0.00022
0.99994
0.00006 10
0.01813
0.98630
0.01370
0.00005
0.99999
0.00001 11
0.00824
0.99455
0.00545
0.00001
1.00000
0.00000 12
0.00343
0.99798
0.00202
0.00000
1.00000
0.00000 13
0.00132
0.99930
0.00070
0.00000
1.00000
0.00000 14
0.00047
0.99977
0.00023
PROB2 – Zmienne losowe dyskretne
7
Rysunek 2.3 pokazuje wykresy rozkÃladu Poissona dla parametrów λ = 2.5 i λ = 5.0
oraz odpowiednie wartości prawdopodobieństw.
RozkÃlad Poissona otrzymuje sie, jako rozkÃlad graniczny rozkÃladu dwumianowego, gdy
dÃlugość serii (n) jest duża, a prawdopodobieństwo sukcesu (p) maÃle. ’Duże n’ oznacza
wartości wieksze
niż 30, ’maÃle p’ oznacza wartości mniejsze niż 0.05. Pojecia
’duże’ i ’maÃle’
,
,
sa, pojeciami
rozmytymi
(’fuzzy’)
i
zależ
a
od
stopnia
przybliżenia
jaki
chcemy
osiagnć.
,
,
,
Z kolei, przy dużych wartościach λ, rozkÃlad Poissona może być aproksymowany rozkÃladem
normalnym N (µ = λ, σ 2 = λ). PrzykÃlad takiej aproksymacji jest pokazany na rysunku
3.3; nie jest ona jeszcze bardzo dokÃladna.
Zadania
Zadanie 2.4. Liczba bÃledów
popeÃlnianych przez studentów kursu jez.
angielskiego przy
,
,
dyktandzie pewnego testu opisuje sie, rozkÃladem Poissona z parametrem λ = 5.0.
Jakie jest prawdopodobieństwo, że osoba piszaca
dyktando a) nie popeÃlni żadnego
,
bÃledu,
b) popeÃlni 10 bÃledów
lub wiecej,
c) popeÃlni dokÃladnie 4 lub 5 bÃledów?
,
,
,
,
Zadanie 2.5. Producent twierdzi, że jego produkty (zapalniczki) nie zawieraja, wiecej,
,
niż 2,5 procent wadliwych sztuk. Zbadano karton zapalniczek zawierajacy
100 sztuk i znale,
ziono 5 wadliwych zapalniczek. Czy można mieć watpliwość
co do twierdzenia producenta,
,
że jego towar zawiera nie wiecej
niź 2,5 procent wadliwych sztuk?
,
Zadanie 2.6. Na podstawie przeprowadzonej wyrywkowej kontroli ocenia sie, wadliwość
masowo produkowanych wkretów
na 2,5 %. Wkrety
pakuje sie, w pudeÃleczka po 50 sztuk.
,
,
Obliczyć prawdopodobieństwo, że w pudeÃleczku nie bedzie
wadliwej sztuki. Rachunek
,
można przeprowadzić w oparciu o rozkÃlad Poissona lub rozkÃlad dwumianowy (dlaczego?).
Porównaj wyniki.
Literatura
[1] Bobrowski D., Elementy rachunku prawdopodobieństwa z elementami statystyki matematycznej. Wydawnictwo Naukowe WSNHID, Poznań 2002. s. X+159.
[2] Pakiet winstats http://math.exeter.edu/rparris
Dodatek. Inne przykÃladowe wykresy i tablice wartości zmiennych losowych o
rozkÃladzie binomialnym
PROB2 – Zmienne losowe dyskretne
i
0
1
2
3
4
5
6
7
8
prob[x=i] prob[x<=i] prob[i<x]
BINOMIAL b[12, 0.25]
0.03168
0.03168
0.96832
0.12671
0.15838
0.84162
0.23229
0.39068
0.60932
0.25810
0.64878
0.35122
0.19358
0.84236
0.15764
0.10324
0.94560
0.05440
0.04015
0.98575
0.01425
0.01147
0.99722
0.00278
0.00239
0.99961
0.00039
0
1
2
3
4
5
6
7
8
9
10
BINOMIAL b[16, 0.25]
0.01002
0.01002
0.98998
0.05345
0.06348
0.93652
0.13363
0.19711
0.80289
0.20788
0.40499
0.59501
0.22520
0.63019
0.36981
0.18016
0.81035
0.18965
0.11010
0.92044
0.07956
0.05243
0.97287
0.02713
0.01966
0.99253
0.00747
0.00583
0.99836
0.00164
0.00136
0.99971
0.00029
i
4
5
6
7
8
9
10
11
12
prob[x=i] prob[x<=i] prob[i<x]
BINOMIAL b[12, 0.75]
0.00239
0.00278
0.99722
0.01147
0.01425
0.98575
0.04015
0.05440
0.94560
0.10324
0.15764
0.84236
0.19358
0.35122
0.64878
0.25810
0.60932
0.39068
0.23229
0.84162
0.15838
0.12671
0.96832
0.03168
0.03168
1.00000
0.00000
6
7
8
9
10
11
12
13
14
15
16
BINOMIAL b[16, 0.75]
0.00136
0.00164
0.99836
0.00583
0.00747
0.99253
0.01966
0.02713
0.97287
0.05243
0.07956
0.92044
0.11010
0.18965
0.81035
0.18016
0.36981
0.63019
0.22520
0.59501
0.40499
0.20788
0.80289
0.19711
0.13363
0.93652
0.06348
0.05345
0.98998
0.01002
0.01002
1.00000
0.00000
8

Podobne dokumenty