2 Zmienne losowe dyskretne

Transkrypt

PROB2 – Zmienne losowe dyskretne
1
plik dyskretne.tex 9 grudnia 2005, ELEMENTY PROBABILISTYKI R.2
2
2.1
Zmienne losowe dyskretne
Ogólne definicje i wÃlasności
Zmienna losowa X jest zmienna, losowa, dyskretna,, jeśli przyjmuje tylko skończona, (lub przeliczalna)
, liczbe, wartości x0 , x1 , . . . , xk z określonymi prawdopodobieństwami p0 , p2 , . . . , pk .
Tak wiec
, mamy:
x0 , x1 , . . . , xk – możliwe wartości zmiennej losowej,
p0 , p1 , . . . , pk – p-stwa wystapienia
poszczególnych wartości.
,
Liczba k może oznaczać dowolnie duża, liczbe, caÃlkowita,, w szczególności możliwych
wartości xi może być nieskończenie wiele. Piszemy wtedy x0 , x1 , . . . , ∞.
Zbiór wszystkich możliwych wartości zmiennej losowej X bedziemy
oznaczać symbolem
,
H i nazywać nośnikiem rozkÃladu zmiennej X.
Prawdopodobieństwa pi , i = 0, . . . , k (lub i = 0, . . . , ∞) musza, speÃlniać warunki:
P
1) 0 ≤ pi ≤ 1,
2) i∈H pi = 1.
Równoważne oznaczenia prawdopodobieństw pi : pi = P (X = xi ), lub pi = P (X = i).
PrzykÃlad. Zmienna losowa przyjmujaca
4 wartości. Zmienna losowa X określona w
,
tabelce poniżej przyjmuje tylko 4 wartości, podane w pierwszym wierszu tabelki.
Drugi wiersz tabelki zawiera odpowiednie prawdopodobieństwa.
W trzecim wierszu tabelki (cum pi ) zsumowano kolejne prawdopodobieństwa. Jak widać,
sumuja, sie, one do jedności.
xi
pi
sum pi
0
2
3
5
0.1 0.3 0.4 0.2
0.1 0.4 0.8 1.0
zbiór H, nośnik rozkÃladu
kolejne prawdopodobieństwa
skumulowane p-stwa
Tak wiec,
rozkÃlad prawdopodobieństwa zmiennej losowej X jest określony za po,
moca, par {xi , pi }. Dla omawianego przykÃladu rozkÃlad ten jest przedstawiony graficznie na
rys. 2.1, lewy wykres:
Cumulative p.d.f.
1
0.4
0.8
0.3
0.6
F(x)
p(x)
Discrete probabilities
0.5
0.2
0.4
0.1
0.2
0
0
2
3
x
5
0
−2
0
2
4
6
x
Rysunek 2.1: PrzykÃladowy rozkÃlad dyskretnej zmiennej losowej X (lewa strona) oraz jego
skumulowane wartości (prawy strona).
2
Na tym samym rysunku (2.1), na wykresie z prawej strony, jest przedstawiony wykres
skumulowanych wartości dla omawianego rozkÃladu. Jak widzimy, dla zmiennej losowej dyskretnej wykres ten przedstawia niemalejac
Funkcja ta ma
, a, funkcje, schodkowa.
,
punkty nieciagÃ
, lości dla wartości x1 , x2 , . . . , xk ; wielkości skoków sa, równe wartościom pi
przyjmowanym przez X w tych punktach.
Funkcja F(x) przedstawiajaca
skumulowane wartości zostaÃla w tym przypadku zdefi,
niowana jako
X
F (x) = P (X ≤ x) =
P (X = xi )
(2.1)
xi ≤x
Typowymi przykÃladami zmiennych losowych dyskretnych sa:,
1.
2.
3.
4.
5.
2.2
rozkÃlad
rozkÃlad
rozkÃlad
rozkÃlad
rozkÃlad
binarny, czyli zerojedynkowy
dwumianowy, rozkÃlad Poissona
Pascala, czyli ujemny dwumianowy
geometryczny
hipergeometryczny
Wartość oczekiwana i wariancja zmiennej losowej dyskretnej
Zanim przejdziemy do omówienie niektórych z wymienionych rozkÃladów, Wprowadzimy
bardzo ważne określenia charakteryzujace
rozkÃlady zmiennych losowych. Sa, nimi wartość
,
oczekiwana i wariancja zmiennej losowej X. Deficje te podajemy dla zmiennych losowych
dyskretnych.
Wartość oczekiwana µ wskazuje na wartość średnia, rozkÃladu, natomiast odchylenie standardowe σ na rozproszenie wartości xi wokóÃl średniej µ.
Definicja. Wartościa, oczekiwana, dyskretnej zmiennej losowej X nazywa sie, wyrażenie
(H oznacza nośnik wartości zmiennej losowej X):
Sumowanie możemy również zapisać z wyszczególnieniem elementów sumowanych, np.
Pk
P∞
i=0 .
i=1 , lub
E(X) =
P
xi ∈H
xi pi .
Wartość oczekiwana, oznacza sie, czesto
symbolem µ. Mamy wiec:
µ = E(X).
,
,
Definicja. Wariancja, dyskretnej zmiennej losowej X nazywa sie, wyrażenie:
V ar(X) = E[(X − µ)2 ] =
P
xi ∈H
(xi − µ)2 pi .
Wariancja jest oznaczana również symbolem σ 2 .
Pierwiastek z wariancji nazywa sie, odchyleniem standardowym.
Przyklad z poprzedniej sekcji, kontynuacja. Obliczamy E(X) i V ar(X)
Wartość oczekiwana:
E(X) = 0 × 0.1 + 2 × 0.3 + 3 × 0.4 + 5 × 0.2 = 2.8.
Wariancja:
V ar(X) = (−2.8)2 × 0.1 + 0.82 × 0.3 + 0.22 × 0.4 + 2.22 × 0.2 =
0.784 + 0.192 + 0.016
q + 0.968 =√1.960.
Odchylenie standardowe: σ = V ar(X) = 1.960 = 1.4.
3
Obliczenia najlepiej zorganizować w tabelce, wtedy trudniej o omyÃlke:
,
xi
pi xi × pi (xi − µ) (xi − µ)2 (xi − µ)2 × pi
0 0.1
0.0
-2.8
7.84
0.784
2 0.3
0.6
-0.8
0.64
0.192
3 0.4
1.2
0.2
0.02
0.016
5 0.2
1.0
2.2
4.84
0.968
suma
2.8
1.960
Otrzymamy wtedy: E(X) ≡ µ = 2.8, V ar(X) ≡ σ 2 = 1.96,
czyli te same wyniki co poprzednio.
Zadania
Zadanie 2.1. Loteria zawiera 1 los wygrywajacy
1000 $, dwa losy wygrywajace
500 $, 5
,
,
losów wygrywajacych
100 $, oraz 50 losów wygrywajacych
5 $. Poza tym sa, losy puste,
,
,
czyli nie wygrywajace
nic.
,
Jaka jest oczekiwana wygrana? Ile powinien kosztować los, aby organizatorzy nie stracili na loterii?
Zadanie 2.2. W urnie znajduja, sie:
4 kule czerwone, 3 biaÃle i 1 czarna. Grajacy
,
,
otrzymuje 10 centów, gdy wyciagnie
kul
e
czerwon
a,, nie otrzymuje nic, gdy wyciagnie
kule,
,
,
,
biaÃla,, i pÃlaci 50 centów, gdy wyciagnie
kule, czarna.,
,
Jaka jest oczekiwana wygrana?
Zadanie 2.3. W zakladzie opracowano nowy produkt. Jest on wart (można go sprzedać)
za 1000 $. Wylansowanie i wprowadzenie na rynek produktu kosztuje 1500 $.
Cze, ść A. Produkt wprowadzony na rynek może
a) odnieść duży sukces – z p-stwem =.2,
b) odnieść umiarkowany sukces – z p-stwem 0.5,
c) nie spotkać sie, z żadnym zainteresowaniem – z p-stwem 0.3.
Ocena zysków:
w przypadku a): 10000 $,
w przypadku b): 4000 $,
w przypadku c): –6000 $.
Cze, ść B. Postanowiono przed ostateczna, decyzja, (sprzedać produkt czy lansować go
samodzielnie) przeprowadzić odpowiednie badania rynkowe. Badania takie kosztuja, 500 $.
Badania rynkowe moga, być pozytywne (że rynek jest zainteresowany produktem) lub
negatywne (że rynek nie jest zainteresowany produktem).
Niezależnie od opinii z badań rynkowych zakÃlad może chcieć mimo wszystko wprowadzić
swój produkt na rynek. Wtedy p-stwa dużego sukcesu, umiarkowanego sukcesu i porażki,
oceniane osobno dla przypadków pozytywnej i negatywnej opinii badań, przedstawiaja, sie,
nastepuj
aco:
,
,
Gdy badania rynkowe pozytywne
Gdy badania rynkowe negatywne
Projekt może odnieść
Duży sukces Umiarkowany sukces MaÃly sukces
0.6
0.2
0.2
0.1
0.3
0.6
Jakie sa, oczekiwane zyski w obu przypadkach? Czy zaklad powinien wprowadzać swój
produkt na rynek, czy też sprzedać go?
2.3
4
RozkÃlad binomialny (dwumianowy lub Bernoulliego)
Mamy serie, n niezależnych doświadczeń. Wynikiem każdego doświadczenia jest ’sukces’ lub
’porażka’ (np. orzeÃl lub reszka). Prawdopodobieństwo sukcesu jest takie samo w każdym
doświadczeniu i wynosi p, gdzie 0 < p < 1.
Określamy zmienna, losowa, X jako liczbe, sukcesów w opisanej serii n doświadczeń.
Zmienna losowe X może przyjmować wartości 0, 1, . . . n z prawdopodobieństwami p0 , p1 , . . . , pn
określonymi nastepuj
aco:
,
,
Ã !
pi = P (X = i) =
n i
p (1 − p)n−i , i = 0, 1, . . . , n.
i
Parametrami rozkÃladu binomialnego sa:, n – dÃlugość serii, oraz p – prawdopodobieństwo
sukcesu w jednym doświadczeniu, dlatego też zmienna, o rozkÃladzie binomialnym oznacza
sie, jako funkcje, b(i; n, p).
Chcac
, zaznaczyć wyraźnie, że zmienna losowa X ma rozkÃlad binomialny, dajemy literke,
b jako wskaźnik dolny symbolu oznaczajacego
te, zmienna, i piszemy Xb jako oznaczenie tej
,
zmiennej losowej
Xb ∼ b(n, p).
Dla przykÃladu pokazujemy rozkÃlad binomialny b(i; 24, 0.75) i jego dystrybuante.
, Argumenty obu funkcji sa, oznaczone symbolem ’x’. L
Ã atwo sprawdzić, że wartość oczekiwana
tego rozkÃladu wynosi np = 24 · 0.75 = 18.00, a wariancja np(1 − p) = 24 · 0.75 · 0.25 = 4.50.
Rysunek 2.2. RozkÃlad prawdopodobieństwa (góra) i skumulowane prawdopodobieństwa (dóÃl) dla rozkÃladu binomialnego z parametrami n = 24,
p = 0.75, czyli rozkÃladu b(i; 24, 0.75).
i prob[x=i]
0
0.00000
1
0.00000
2
0.00000
3
0.00000
4
0.00000
5
0.00000
6
0.00000
7
0.00000
8
0.00002
9
0.00009
10
0.00041
11
0.00157
12
0.00511
13
0.01414
14
0.03333
15
0.06665
16
0.11248
17
0.15879
18
0.18526
19
0.17551
20
0.13163
21
0.07522
22
0.03077
23
0.00803
24
0.00100
prob[x<=i] prob[x>i]
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00000
1.00000
0.00002
0.99998
0.00011
0.99989
0.00052
0.99948
0.00209
0.99791
0.00720
0.99280
0.02134
0.97866
0.05466
0.94534
0.12132
0.87868
0.23380
0.76620
0.39259
0.60741
0.57784
0.42216
0.75335
0.24665
0.88498
0.11502
0.96020
0.03980
0.99097
0.00903
0.99900
0.00100
1.00000
0.00000
5
Rysunki i tabele otrzymano za pomoca, pakietu WINSTATS.
Pokazuje sie,
, że wartość oczekiwana zmiennej X o rozkÃladzie b(n,p) wynosi µ = np,
2
a wariancja σ = np(1 − p). Podstawiajac
, q = 1 − p otrzymujemy:
E(Xb ) = np,
V ar(Xb ) = npq.
Można pokazać, że rozkÃlad binomialny jest rozkÃladem symetrycznym.
W przypadku n parzystego rozkÃlad binomialny posiada dwie takie same wartości modalne, natomiast w przypadku n nieparzystego — dokÃladnie jedna, wartośc modalna.,
2.4
RozkÃlady graniczne rozkÃladu binomialnego przy n −→ +∞
Co sie, dzieje z rozkÃladem binomialnym, gdy liczba doświadczeń n rośnie nieograniczenie,
czyli staje sie, bardzo duża? W zależności od p, prawdopodobieństwa sukcesu, wyróżniamy
tu dwa przypadki:
A. Parametr p wykazuje wartośc umiarkowana,, tj. ani bardzo maÃla,, ani bardzo duża., Na
ogóÃl oznacza to, że 0.05 < p < 0.95.
Wtedy można wykazać, że rozkÃlad binomialny daży
asymptotycznie do rozkÃladu
,
normalnego (Gaussa–Laplace’a) o parametrach µ = np i σ 2 = npq, gdzie q = 1 − p.
Oznacza to, że dla dużego n prawdopodobieństwa z rozkÃladu binomialnego b(n, p)
moga, być wyznaczane za pomoca, prawdopodobieństw w rozkÃladzie normalnym
N (µ = np, σ 2 = npq) {rozkÃladem tym bedziemy
sie, zajmować w rozdziale 4}.
,
PrzykÃladowo na rysunku 2.2 (góra) można zobaczyć, że dla n = 24, p = 0.75 przedstawiony rozkÃlad binomialny jest już dość dobrze aproksymowany rozkÃladem normalnym.
Dalsze przykÃlady rozkÃladu binomialnego sa, pokazane na końcu tego rozdziaÃlu.
B. Parametr p jest maÃly, czyli wystapienie
sukcesu jest zjawiskiem rzadkim. PoÃlóżmy:
,
np = λ i obliczmy granice,
, gdy n → ∞ (odpowiada to sytuacji, gdy do partii
towaru zawierajacego
pewien
procent braków bedziemy
dodawać coraz to wiecej
sztuk
,
,
,
dobrych). Otrzymujemy wtedy
Ã !
lim
n→∞
Ã ! Ã !i Ã
n i
n
p (1 − p)n−i = lim
n→∞
i
i
λ
n
λ
1 −
n
!n−i
= ... =
λi − λ
e .
i!
Otrzymujemy ostatecznie rozkÃlad noszacy
nazwe, rozkÃladu Poissona:
,
P (X = i|λ) =
λi − λ
e , i = 0, 1, . . . .
i!
RozkÃlad ten jest opisywany w nastepnej
podsekcji jako kolejny przykÃlad rozkÃladu
,
dyskretnego, którego nośnik zawiera nieskończenie wiele wartości.
2.5
6
RozkÃlad Poissona
Definicja. Zmienna losowa X ma rozkÃlad Poissona, jeśli przyjmuje wartości
i = 0, 1, 2, ... z prawdopodobieństwami pi wyznaczonymi nastepuj
acym
wzorem:
,
,
pi = P (X = i|λ) =
λi − λ
e , i = 0, 1, . . . .
i!
Wartość λ > 0 jest parametrem rozkÃladu.
P∞
P∞ λi − λ
Oczywiście
≡ 1.
i=0 pi =
i=0 i! e
Wartość oczekiwana i wariancja zmiennej o rozkÃladzie Poissona wynosza, odpowiednio:
E(XP oisson ) = λ, V ar(XP oisson ) = λ.
Rysunek 2.3: RozkÃlad prawdopodobieństwa (lewa) i jego wartości skumulowane (prawa)
dla rozkÃladu Poissona z parametrami λ = 2.5 i λ = 5.0. NaÃlożono również aproksymacje,
rozkÃladem normalnym
i
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
lambda = 2.5
lambda = 5.0
prob[x=i] prob[x<=i] prob[x>i]
i prob[x=i] prob[x<=i] prob[x>i]
0.08208
0.08208
0.91792 0
0.00674
0.00674
0.99326
0.20521
0.28730
0.71270 1
0.03369
0.04043
0.95957
0.25652
0.54381
0.45619 2
0.08422
0.12465
0.87535
0.21376
0.75758
0.24242 3
0.14037
0.26503
0.73497
0.13360
0.89118
0.10882 4
0.17547
0.44049
0.55951
0.06680
0.95798
0.04202 5
0.17547
0.61596
0.38404
0.02783
0.98581
0.01419 6
0.14622
0.76218
0.23782
0.00994
0.99575
0.00425 7
0.10444
0.86663
0.13337
0.00311
0.99886
0.00114 8
0.06528
0.93191
0.06809
0.00086
0.99972
0.00028 9
0.03627
0.96817
0.03183
0.00022
0.99994
0.00006 10
0.01813
0.98630
0.01370
0.00005
0.99999
0.00001 11
0.00824
0.99455
0.00545
0.00001
1.00000
0.00000 12
0.00343
0.99798
0.00202
0.00000
1.00000
0.00000 13
0.00132
0.99930
0.00070
0.00000
1.00000
0.00000 14
0.00047
0.99977
0.00023
7
Rysunek 2.3 pokazuje wykresy rozkÃladu Poissona dla parametrów λ = 2.5 i λ = 5.0
oraz odpowiednie wartości prawdopodobieństw.
RozkÃlad Poissona otrzymuje sie, jako rozkÃlad graniczny rozkÃladu dwumianowego, gdy
dÃlugość serii (n) jest duża, a prawdopodobieństwo sukcesu (p) maÃle. ’Duże n’ oznacza
wartości wieksze
niż 30, ’maÃle p’ oznacza wartości mniejsze niż 0.05. Pojecia
’duże’ i ’maÃle’
,
,
sa, pojeciami
rozmytymi
(’fuzzy’)
i
zależ
a
od
stopnia
przybliżenia
jaki
chcemy
osiagnć.
,
,
,
Z kolei, przy dużych wartościach λ, rozkÃlad Poissona może być aproksymowany rozkÃladem
normalnym N (µ = λ, σ 2 = λ). PrzykÃlad takiej aproksymacji jest pokazany na rysunku
3.3; nie jest ona jeszcze bardzo dokÃladna.
Zadania
Zadanie 2.4. Liczba bÃledów
popeÃlnianych przez studentów kursu jez.
angielskiego przy
,
,
dyktandzie pewnego testu opisuje sie, rozkÃladem Poissona z parametrem λ = 5.0.
Jakie jest prawdopodobieństwo, że osoba piszaca
dyktando a) nie popeÃlni żadnego
,
bÃledu,
b) popeÃlni 10 bÃledów
lub wiecej,
c) popeÃlni dokÃladnie 4 lub 5 bÃledów?
,
,
,
,
Zadanie 2.5. Producent twierdzi, że jego produkty (zapalniczki) nie zawieraja, wiecej,
,
niż 2,5 procent wadliwych sztuk. Zbadano karton zapalniczek zawierajacy
100 sztuk i znale,
ziono 5 wadliwych zapalniczek. Czy można mieć watpliwość
co do twierdzenia producenta,
,
że jego towar zawiera nie wiecej
niź 2,5 procent wadliwych sztuk?
,
Zadanie 2.6. Na podstawie przeprowadzonej wyrywkowej kontroli ocenia sie, wadliwość
masowo produkowanych wkretów
na 2,5 %. Wkrety
pakuje sie, w pudeÃleczka po 50 sztuk.
,
,
Obliczyć prawdopodobieństwo, że w pudeÃleczku nie bedzie
wadliwej sztuki. Rachunek
,
można przeprowadzić w oparciu o rozkÃlad Poissona lub rozkÃlad dwumianowy (dlaczego?).
Porównaj wyniki.
Literatura
[1] Bobrowski D., Elementy rachunku prawdopodobieństwa z elementami statystyki matematycznej. Wydawnictwo Naukowe WSNHID, Poznań 2002. s. X+159.
[2] Pakiet winstats http://math.exeter.edu/rparris
Dodatek. Inne przykÃladowe wykresy i tablice wartości zmiennych losowych o
rozkÃladzie binomialnym
i
0
1
2
3
4
5
6
7
8
prob[x=i] prob[x<=i] prob[i<x]
BINOMIAL b[12, 0.25]
0.03168
0.03168
0.96832
0.12671
0.15838
0.84162
0.23229
0.39068
0.60932
0.25810
0.64878
0.35122
0.19358
0.84236
0.15764
0.10324
0.94560
0.05440
0.04015
0.98575
0.01425
0.01147
0.99722
0.00278
0.00239
0.99961
0.00039
0
1
2
3
4
5
6
7
8
9
10
0.01002
0.01002
0.98998
0.05345
0.06348
0.93652
0.13363
0.19711
0.80289
0.20788
0.40499
0.59501
0.22520
0.63019
0.36981
0.18016
0.81035
0.18965
0.11010
0.92044
0.07956
0.05243
0.97287
0.02713
0.01966
0.99253
0.00747
0.00583
0.99836
0.00164
0.00136
0.99971
0.00029
i
4
5
6
7
8
9
10
11
12
prob[x=i] prob[x<=i] prob[i<x]
0.00239
0.00278
0.99722
0.01147
0.01425
0.98575
0.04015
0.05440
0.94560
0.10324
0.15764
0.84236
0.19358
0.35122
0.64878
0.25810
0.60932
0.39068
0.23229
0.84162
0.15838
0.12671
0.96832
0.03168
0.03168
1.00000
0.00000
6
7
8
9
10
11
12
13
14
15
16
0.00136
0.00164
0.99836
0.00583
0.00747
0.99253
0.01966
0.02713
0.97287
0.05243
0.07956
0.92044
0.11010
0.18965
0.81035
0.18016
0.36981
0.63019
0.22520
0.59501
0.40499
0.20788
0.80289
0.19711
0.13363
0.93652
0.06348
0.05345
0.98998
0.01002
0.01002
1.00000
0.00000
8

2 Zmienne losowe dyskretne

Transkrypt

Podobne dokumenty

ZADANIA Z J˛EZYKA C DLA GRUP 7. I 9. Zestaw II

Kodowanie i kompresja 1 Kompresja stratna

To nie jest gra planszowa! - Związek Pracodawców Gospodarki

popularyzatorski opis rezultatów projektu

przypadek znanego odchylenia standardowego

STATYSTYKA STOSOWANA Lista 4

Ekonometria Praca domowa nr 2 Termin oddania: 5 stycznia 2017

1 + z2, y