2. INNE ROZKŁADY DYSKRETNE 2.1. Rozkład dwumianowy

Transkrypt

2. INNE ROZKŁADY DYSKRETNE 2.1. Rozkład dwumianowy
Inne rozkłady dyskretne 2
29
2. INNE ROZKŁADY DYSKRETNE
2.1. Rozkład dwumianowy - kontynuacja
Przypomnijmy sobie pojęcie rozkładu dwumianowego prawdopodobieństwa k
sukcesów w n próbach Bernoulli’ego:
n
Pk =   p k q n − k
k 
m = np σ 2 = npq .
(2.1)
Te doświadczenia losowe można tutaj interpretować, jak na przykład próby przechodzenia
przez jezdnię, gdy mamy na uwadze przejście jednego potoku ruchu pojazdów w jednym
kierunku, na jednym pasie ruchu. Jest to bardzo popularny model przejścia dla pieszych, do
którego będziemy wracać niejednokrotnie. Tak wydawałoby się prosty przykład zagadnienia
inżynierii ruchu wywołuje wiele problemów natury modelowej: czy pieszy wybiera cały
odstęp czasu, czy tylko lukę akceptowalną? Inny przykład, który można traktować jak
doświadczenia Bernoullie’go, to jest strzelanie do
tarczy na strzelnicy, z określonej
odległości i broni. „sukcesem” będzie strzał „w dziesiątkę”, to znaczy w środek tarczy.
Natomiast „porażką” jest każdy inny wynik strzelania w ustalonej konkurencji strzeleckiej. Z
naszych praktycznych doświadczeń strzeleckich wynika, gdy istotnie zwiększymy odległość
do tarczy, to również zmniejszamy prawdopodobieństwo
„sukcesu”. Podobnie można
interpretować próby uzyskania połączenia w przeciążonej centrali telefonicznej, bez
możliwości oczekiwania na połączenie. Tak więc, bardzo wiele różnych zagadnień inżynierii
ruchu można interpretować jako ciągi Bernoulli’ego, opisane przez odpowiednie rozkłady
dwumianowe. Jest to jeden z najprostszych sposobów modelowania zjawisk losowych.
Niestety życie jest bardziej złożone, niż takie modele. Na zakończenie tej tematyki
prześledźmy poniższe przykłady.
Inne rozkłady dyskretne 2
30
Przykład 2.1 (Plucińscy,1990).
Energia pochodząca z jednego źródła ma być z przerwami zużywana przez 5
robotników (n = 5). Zakładamy, że
1o w danej chwili prawdopodobieństwo p zapotrzebowania na energię jest takie samo dla
każdego robotnika,
2 o robotnicy pracują niezależnie od siebie,
3o każdy z robotników korzysta z energii przez 12 minut w ciągu godziny.
X ma rozkład dwumianowy n = 5
p=
12
= 0.2 .
60
P( X = 0) = 0.8 5 ≅ 0.33
P( X = 1) = 5 ⋅ 0.8 4 ⋅ 0.2 ≅ 0.41
P( X = 2) = 10 ⋅ 0.8 3 ⋅ 0.2 ≅ 0.20
P( X = 3) = 10 ⋅ 0.8 2 ⋅ 0.2 3 ≅ 0.05
P( X = 4) = 5 ⋅ 0.8 ⋅ 0.2 4 ≅ 0.01
P( X = 5) =
0.2 5
≅ 0.00
Prawdopodobieństwo tego, że liczba robotników, zapotrzebowujących energię w danym
momencie jest nie większa niż 2, jest równa sumie prawdopodobieństw:
P( X = 0) + P( X = 1) + P( X = 2) ≅ 0.94
(2.2)
2.2. Rozkład Poissona
Mówimy, że X ma rozkład Poissona, jeżeli Χ = {0,1,2 , ...} ma następujący rozkład
prawdopodobieństwa
Pk = P( X = k ) =
e −λ λk
k!
,
k = 0,1, ...
. (2.3)
Inne rozkłady dyskretne 2
31
Przykład 2.2 (Plucińscy,1990)
Przeprowadzono n = 2608 niezależnych doświadczeń, z których każde trwało 7.5 sek i
polegało na rejestracji przez licznik liczby dochodzących do niego cząstek w wyniku rozpadu
substancji radioaktywnej. Dane w poniższej tablicy, gdzie np = 3.85 jest to
1 10
∑ k ⋅ nk (czyli
n k =0
średnia arytmetyczna, obliczana za pomocą innego niż zwykle wzoru - dla danych
pogrupowanych!!!)
liczba
liczba doświadczeń
cząstek
Prawdopodobieństwo Pk w
nk
nk
n
0
57
0.022
0.021
1
203
0.078
0.081
2
383
0.147
0.156
3
525
0.201
0.201
4
532
0.204
0.195
5
408
0.156
0.151
6
273
0.105
0.097
7
139
0.053
0.054
8
45
0.017
0.026
9
27
0.010
0.014
10
16
0.006
0.007
Razem
2608
0.999
1.000
rozkładzie Poissona
k
Rozkład Poissona przy pewnych założeniach jest granicznym rozkładem dla rozkładu
dwumianowego, co wyraża poniższe twierdzenie.
Inne rozkłady dyskretne 2
32
Twierdzenie Poissona
Niech zmienne losowe X n mają rozkład dwumianowy określony wzorem
 n
P( X n = k ) =   p k q n − k
 k
k = 0,1,2 , ...
,
. (2.4)
Jeżeli prawdopodobieństwo p = p( n) maleje do zera w taki sposób , że dla pewnego n > n 0
spełniony jest związek
np = λ
,
(2.5)
gdzie λ > 0 jest stałą, to
lim P( X n = k ) =
n→∞
e −λ λk
k!
.
(2.6)
Rozkład Poissona ma bardzo duże znaczenie teoretyczne, jako „najbardziej losowy”
rozkład prawdopodobieństwa zmiennych dyskretnych, nazywany również „rozkładem
rzadkich zdarzeń”. Jest to rozkład dobrze opisujący zjawiska liczby zgłoszeń do centrali
telefonicznej, czy liczby awarii złożonych systemów technicznych. Natomiast nie jest to
właściwy rozkład liczby przybyć pojazdów na jednopasowej i jednokierunkowej drodze,
ponieważ w takim pojedynczym potoku ruchu występuje odstęp bezpieczny „przerywający”
gotowość zgłoszeń pojazdów na dość długi czas.
Z praktycznego punktu widzenia, tam gdzie mamy do czynienia z dużą liczbą
doświadczeń Bernoullie’go i małym prawdopodobieństwem sukcesu, to rozkład Poissona jest
wygodnym rachunkowo przybliżeniem opisu zjawiska, ponieważ ma tylko jeden parametr λ ,
będący oczekiwaną liczbą sukcesów.
Przykład 2.3 (Plucińscy,1990)
W skład złożonej radioaparatury wchodzi między innymi n = 1000 elementów
określonego rodzaju. Prawdopodobieństwo uszkodzenia w ciągu roku każdego z tych
elementów jest p = 0.001 i nie zależy od stanu pozostałych elementów.
Inne rozkłady dyskretne 2
33
Obliczyć prawdopodobieństwo uszkodzenia w ciągu roku:
a) dokładnie dwóch elementów,
b) nie mniej niż dwóch elementów.
Zmienna losowa ma rozkład dwumianowy, przy czym
n = 1000,
p = 0.001.
Przeprowadzenie obliczeń dla rozkładu dwumianowego dla tak dużej liczby n byłoby
uciążliwe, a z drugiej strony spełnione są warunki zbieżności do rozkładu Poissona, a więc:
Przyjmiemy λ = np = 1000 ⋅ 0.001 = 1. Z tablicy rozkładu Poissona odczytujemy:
a) P( X = 2) = 0.184 ,
b) P( X ≥ 2) = 1 − ( P( X = 0) + P( X = 1)) = 0.264 .
2.3. Wartość oczekiwana i wariancja w rozkładzie Poissona są równe λ .
Fakt równości wartości oczekiwanej i wariancji w rozkładzie Poissona może być
wykorzystywany do sprawdzenia, czy obserwacje statystyczne można opisać rozkładem
Poissona. Średnia arytmetyczna oraz odchylenie standardowe są przybliżeniami wartości
oczekiwanej i wariancji.
Przykład 2.4.
W poszczególnych minutach zaobserwowano na skrzyżowaniu następujące liczby
pojazdów skręcających w prawo:
0, 3, 0 ,1 ,2, 1, 0, 0, 2, ,1, 1, 0, 2, 1, 2, 0, 1, 1, 0, 2
Hipoteza statystyczna: czy próbka statystyczna potwierdza hipotezę o rozkładzie
Poissona tych liczb?
x=
s2 =
=
1 n
20
xi =
=1 →
∑
n i =1
20
m
1 n
1 n 2
2
x
−
x
=
xi − x 2 =
(
)
∑
∑
i
n i =1
n i =1
7 ⋅ 12 + 5 ⋅ 2 2 + 1 ⋅ 32 + 7 ⋅ 0 2
36
− 12 =
− 1 = 0.8 → σ 2 .
20
20
Inne rozkłady dyskretne 2
34
A więc próbka nie potwierdza hipotezy o rozkładzie Poissona.
Należy zwrócić uwagę na bardzo specyficzny język statystyki matematycznej, który
zazwyczaj na początku trochę wydaje się dziwny. Wydawałoby się, oczywiste stwierdzenia
wypowiadamy w trochę dziwnym języku statystyki matematycznej. Z drugiej strony ten język
pozwala nam uświadomić sobie, że w gruncie rzeczy nie mamy pewności, gdy wypowiadamy
ogólną tezę, na podstawie pewnej liczby doświadczeń statystycznych. A więc na przykład: nie
mówimy, że „liczba pojazdów skręcających w prawo w obserwowanym potoku ruchu nie ma
rozkładu Poissona”, tylko, że „próbka nie potwierdza hipotezy o rozkładzie Poissona”. Jak już
stwierdzono, trochę dziwi na początku ten język, później jednak uświadamiamy sobie jego
właściwy sens. Chodzi o wielką niepewność, jaka powinna charakteryzować tezy statystyczne.
W miarę przyzwyczajania się do języka statystyki matematycznej wyrabiamy sobie
właściwą postawę podczas badań statystycznych - powinna to być postawa maksymalnej
bezstronności, to znaczy obiektywizmu w stwierdzeniach statystycznych. Bardzo często
badający ma swoje hipotezy na temat badanego zjawiska, jednak nie powinno to zniekształcać
badań statystycznych. Chodzi nam o obiektywną prawdę, a nie o potwierdzenie przypuszczeń
badacza. Tak więc bezstronny badacz powinien równie często odrzucać badane hipotezy, jak
przyjmować, nie traktując odrzucenia jako osobistej porażki. Jest to, wydawałoby się, bardzo
oczywiste stwierdzenie, jednak, jak wiadomo z historii, nie zawsze przestrzegane w ekonomii
czy w nauce.
Zbudujmy histogram częstości l j , określających ile razy w naszych obserwacjach
pojawiła się wartość w j dla powyższego przykładu.
Inne rozkłady dyskretne 2
35
lj
7
5
1
0
1
3
2
wj
Rys. 2.1 Histogram częstości.
Tab. 2.1 Histogram a tablica obliczeń statystycznych
wj
lj
wj ⋅ l j
w 2j ⋅ l j
0
7
0
0
1
7
7
7
2
5
10
20
3
1
3
9
Histogram jest graficznym przedstawieniem szeregu rozdzielczego, a więc dla każdej
wartości w j częstości występowania l j . Pozwala to wprowadzić pewną uporządkowaną
formę obliczeń statystycznych, nazywaną tablicą obliczeń statystycznych, aby łatwo
kontrolować przebieg obliczeń. W obszernych obliczeniach statystycznych kontrola
poprawności obliczeń jest najważniejszym problemem praktycznym.
3
∑w l
j j
j =0
20
= ∑ xi
i =1
3
,
∑w
j =0
20
l = ∑ x i2 .
2
j j
i =1
(2.7)
Inne rozkłady dyskretne 2
36
W tablicy obliczeń statystycznych przeprowadza się obliczenia według wzorów (2.7),
które, jak widać w (2.7), są równoważne obliczeniom średniej i odchylenia kwadratowego,
zdefiniowanym w poprzednim rozdziale. Innymi słowy, tablica obliczeń statystycznych
pozwala na uporządkowanie tych obliczeń, co ułatwia kontrolę procesu przetwarzania danych.
W masowych obliczeniach statystycznych powinno się zawsze szczególnie uważnie
kontrolować proces przetwarzania danych statystycznych. Tablica obliczeń statystycznych jest
taką formą kontroli.
Hipotezy statystyczne, jakie formułuje się w praktyce, mogą dotyczyć dwóch sytuacji:
kiedy znamy z wcześniejszych badań rozkład prawdopodobieństwa i chcemy określić
parametry tego rozkładu, mówimy wtedy o hipotezach parametrycznych. Drugi przypadek
dotyczy sytuacji zupełnie nieznanych procesów losowych, które wymagają określenia
rozkładu prawdopodobieństwa, mówimy wtedy o hipotezie rozkładu prawdopodobieństwa.
Na przykład, bardzo często stawiana jest hipoteza o rozkładzie Poissona liczby pojazdów w
minucie obserwowanego potoku ruchu i otrzymywany jest negatywny rezultat takiego
badania. Natomiast pozytywnym wynikiem kończy się na ogół podobne badanie, dotyczące
liczby zgłoszeń do centrali telefonicznej w godzinie szczytowej. Postawmy więc taką hipotezę
dla zbadania znanym nam dotychczas sposobem:
czy następujący rozkład liczby zgłoszeń podczas kolejnych minut do centrali telefonicznej
może być rozkładem Poissona?
0 57
1 203
2 383
3 525
4 532
5 408
6 273
7 139
8 45
9 27
10 16
Inne rozkłady dyskretne 2
Problemy rozdziału 2
1. Dlaczego rozkład dwumianowy jest zastępowany rozkładem Poissona?
2. Dlaczego rozkład Poissona nazywany jest rozkładem rzadkich zdarzeń?
3. Czy zapotrzebowanie na energię ma rozkład dwumianowy?
4. Czy uszkodzenia złożonego systemu mają rozkład dwumianowy?
5. Czy rozkład Poissona jest właściwy do opisu potoku ruchu transportowego?
6. Czy rozkład Poissona jest właściwy do opisu potoku ruchu telefonicznego?
7. Czy rozkład Poissona jest właściwy do opisu potoku pieszych?
8. Czy rozkład Poissona jest właściwy dla strumienia wejściowego stacji benzynowej?
9. Tablica obliczeń statystycznych a wartość średnia.
10. Tablica obliczeń statystycznych a odchylenie kwadratowe.
11. Po co stawiamy hipotezy statystyczne?
12. Czy język statystyki matematycznej pozwala nam uzyskać obiektywną prawdę?
37