2. INNE ROZKŁADY DYSKRETNE 2.1. Rozkład dwumianowy
Transkrypt
2. INNE ROZKŁADY DYSKRETNE 2.1. Rozkład dwumianowy
Inne rozkłady dyskretne 2 29 2. INNE ROZKŁADY DYSKRETNE 2.1. Rozkład dwumianowy - kontynuacja Przypomnijmy sobie pojęcie rozkładu dwumianowego prawdopodobieństwa k sukcesów w n próbach Bernoulli’ego: n Pk = p k q n − k k m = np σ 2 = npq . (2.1) Te doświadczenia losowe można tutaj interpretować, jak na przykład próby przechodzenia przez jezdnię, gdy mamy na uwadze przejście jednego potoku ruchu pojazdów w jednym kierunku, na jednym pasie ruchu. Jest to bardzo popularny model przejścia dla pieszych, do którego będziemy wracać niejednokrotnie. Tak wydawałoby się prosty przykład zagadnienia inżynierii ruchu wywołuje wiele problemów natury modelowej: czy pieszy wybiera cały odstęp czasu, czy tylko lukę akceptowalną? Inny przykład, który można traktować jak doświadczenia Bernoullie’go, to jest strzelanie do tarczy na strzelnicy, z określonej odległości i broni. „sukcesem” będzie strzał „w dziesiątkę”, to znaczy w środek tarczy. Natomiast „porażką” jest każdy inny wynik strzelania w ustalonej konkurencji strzeleckiej. Z naszych praktycznych doświadczeń strzeleckich wynika, gdy istotnie zwiększymy odległość do tarczy, to również zmniejszamy prawdopodobieństwo „sukcesu”. Podobnie można interpretować próby uzyskania połączenia w przeciążonej centrali telefonicznej, bez możliwości oczekiwania na połączenie. Tak więc, bardzo wiele różnych zagadnień inżynierii ruchu można interpretować jako ciągi Bernoulli’ego, opisane przez odpowiednie rozkłady dwumianowe. Jest to jeden z najprostszych sposobów modelowania zjawisk losowych. Niestety życie jest bardziej złożone, niż takie modele. Na zakończenie tej tematyki prześledźmy poniższe przykłady. Inne rozkłady dyskretne 2 30 Przykład 2.1 (Plucińscy,1990). Energia pochodząca z jednego źródła ma być z przerwami zużywana przez 5 robotników (n = 5). Zakładamy, że 1o w danej chwili prawdopodobieństwo p zapotrzebowania na energię jest takie samo dla każdego robotnika, 2 o robotnicy pracują niezależnie od siebie, 3o każdy z robotników korzysta z energii przez 12 minut w ciągu godziny. X ma rozkład dwumianowy n = 5 p= 12 = 0.2 . 60 P( X = 0) = 0.8 5 ≅ 0.33 P( X = 1) = 5 ⋅ 0.8 4 ⋅ 0.2 ≅ 0.41 P( X = 2) = 10 ⋅ 0.8 3 ⋅ 0.2 ≅ 0.20 P( X = 3) = 10 ⋅ 0.8 2 ⋅ 0.2 3 ≅ 0.05 P( X = 4) = 5 ⋅ 0.8 ⋅ 0.2 4 ≅ 0.01 P( X = 5) = 0.2 5 ≅ 0.00 Prawdopodobieństwo tego, że liczba robotników, zapotrzebowujących energię w danym momencie jest nie większa niż 2, jest równa sumie prawdopodobieństw: P( X = 0) + P( X = 1) + P( X = 2) ≅ 0.94 (2.2) 2.2. Rozkład Poissona Mówimy, że X ma rozkład Poissona, jeżeli Χ = {0,1,2 , ...} ma następujący rozkład prawdopodobieństwa Pk = P( X = k ) = e −λ λk k! , k = 0,1, ... . (2.3) Inne rozkłady dyskretne 2 31 Przykład 2.2 (Plucińscy,1990) Przeprowadzono n = 2608 niezależnych doświadczeń, z których każde trwało 7.5 sek i polegało na rejestracji przez licznik liczby dochodzących do niego cząstek w wyniku rozpadu substancji radioaktywnej. Dane w poniższej tablicy, gdzie np = 3.85 jest to 1 10 ∑ k ⋅ nk (czyli n k =0 średnia arytmetyczna, obliczana za pomocą innego niż zwykle wzoru - dla danych pogrupowanych!!!) liczba liczba doświadczeń cząstek Prawdopodobieństwo Pk w nk nk n 0 57 0.022 0.021 1 203 0.078 0.081 2 383 0.147 0.156 3 525 0.201 0.201 4 532 0.204 0.195 5 408 0.156 0.151 6 273 0.105 0.097 7 139 0.053 0.054 8 45 0.017 0.026 9 27 0.010 0.014 10 16 0.006 0.007 Razem 2608 0.999 1.000 rozkładzie Poissona k Rozkład Poissona przy pewnych założeniach jest granicznym rozkładem dla rozkładu dwumianowego, co wyraża poniższe twierdzenie. Inne rozkłady dyskretne 2 32 Twierdzenie Poissona Niech zmienne losowe X n mają rozkład dwumianowy określony wzorem n P( X n = k ) = p k q n − k k k = 0,1,2 , ... , . (2.4) Jeżeli prawdopodobieństwo p = p( n) maleje do zera w taki sposób , że dla pewnego n > n 0 spełniony jest związek np = λ , (2.5) gdzie λ > 0 jest stałą, to lim P( X n = k ) = n→∞ e −λ λk k! . (2.6) Rozkład Poissona ma bardzo duże znaczenie teoretyczne, jako „najbardziej losowy” rozkład prawdopodobieństwa zmiennych dyskretnych, nazywany również „rozkładem rzadkich zdarzeń”. Jest to rozkład dobrze opisujący zjawiska liczby zgłoszeń do centrali telefonicznej, czy liczby awarii złożonych systemów technicznych. Natomiast nie jest to właściwy rozkład liczby przybyć pojazdów na jednopasowej i jednokierunkowej drodze, ponieważ w takim pojedynczym potoku ruchu występuje odstęp bezpieczny „przerywający” gotowość zgłoszeń pojazdów na dość długi czas. Z praktycznego punktu widzenia, tam gdzie mamy do czynienia z dużą liczbą doświadczeń Bernoullie’go i małym prawdopodobieństwem sukcesu, to rozkład Poissona jest wygodnym rachunkowo przybliżeniem opisu zjawiska, ponieważ ma tylko jeden parametr λ , będący oczekiwaną liczbą sukcesów. Przykład 2.3 (Plucińscy,1990) W skład złożonej radioaparatury wchodzi między innymi n = 1000 elementów określonego rodzaju. Prawdopodobieństwo uszkodzenia w ciągu roku każdego z tych elementów jest p = 0.001 i nie zależy od stanu pozostałych elementów. Inne rozkłady dyskretne 2 33 Obliczyć prawdopodobieństwo uszkodzenia w ciągu roku: a) dokładnie dwóch elementów, b) nie mniej niż dwóch elementów. Zmienna losowa ma rozkład dwumianowy, przy czym n = 1000, p = 0.001. Przeprowadzenie obliczeń dla rozkładu dwumianowego dla tak dużej liczby n byłoby uciążliwe, a z drugiej strony spełnione są warunki zbieżności do rozkładu Poissona, a więc: Przyjmiemy λ = np = 1000 ⋅ 0.001 = 1. Z tablicy rozkładu Poissona odczytujemy: a) P( X = 2) = 0.184 , b) P( X ≥ 2) = 1 − ( P( X = 0) + P( X = 1)) = 0.264 . 2.3. Wartość oczekiwana i wariancja w rozkładzie Poissona są równe λ . Fakt równości wartości oczekiwanej i wariancji w rozkładzie Poissona może być wykorzystywany do sprawdzenia, czy obserwacje statystyczne można opisać rozkładem Poissona. Średnia arytmetyczna oraz odchylenie standardowe są przybliżeniami wartości oczekiwanej i wariancji. Przykład 2.4. W poszczególnych minutach zaobserwowano na skrzyżowaniu następujące liczby pojazdów skręcających w prawo: 0, 3, 0 ,1 ,2, 1, 0, 0, 2, ,1, 1, 0, 2, 1, 2, 0, 1, 1, 0, 2 Hipoteza statystyczna: czy próbka statystyczna potwierdza hipotezę o rozkładzie Poissona tych liczb? x= s2 = = 1 n 20 xi = =1 → ∑ n i =1 20 m 1 n 1 n 2 2 x − x = xi − x 2 = ( ) ∑ ∑ i n i =1 n i =1 7 ⋅ 12 + 5 ⋅ 2 2 + 1 ⋅ 32 + 7 ⋅ 0 2 36 − 12 = − 1 = 0.8 → σ 2 . 20 20 Inne rozkłady dyskretne 2 34 A więc próbka nie potwierdza hipotezy o rozkładzie Poissona. Należy zwrócić uwagę na bardzo specyficzny język statystyki matematycznej, który zazwyczaj na początku trochę wydaje się dziwny. Wydawałoby się, oczywiste stwierdzenia wypowiadamy w trochę dziwnym języku statystyki matematycznej. Z drugiej strony ten język pozwala nam uświadomić sobie, że w gruncie rzeczy nie mamy pewności, gdy wypowiadamy ogólną tezę, na podstawie pewnej liczby doświadczeń statystycznych. A więc na przykład: nie mówimy, że „liczba pojazdów skręcających w prawo w obserwowanym potoku ruchu nie ma rozkładu Poissona”, tylko, że „próbka nie potwierdza hipotezy o rozkładzie Poissona”. Jak już stwierdzono, trochę dziwi na początku ten język, później jednak uświadamiamy sobie jego właściwy sens. Chodzi o wielką niepewność, jaka powinna charakteryzować tezy statystyczne. W miarę przyzwyczajania się do języka statystyki matematycznej wyrabiamy sobie właściwą postawę podczas badań statystycznych - powinna to być postawa maksymalnej bezstronności, to znaczy obiektywizmu w stwierdzeniach statystycznych. Bardzo często badający ma swoje hipotezy na temat badanego zjawiska, jednak nie powinno to zniekształcać badań statystycznych. Chodzi nam o obiektywną prawdę, a nie o potwierdzenie przypuszczeń badacza. Tak więc bezstronny badacz powinien równie często odrzucać badane hipotezy, jak przyjmować, nie traktując odrzucenia jako osobistej porażki. Jest to, wydawałoby się, bardzo oczywiste stwierdzenie, jednak, jak wiadomo z historii, nie zawsze przestrzegane w ekonomii czy w nauce. Zbudujmy histogram częstości l j , określających ile razy w naszych obserwacjach pojawiła się wartość w j dla powyższego przykładu. Inne rozkłady dyskretne 2 35 lj 7 5 1 0 1 3 2 wj Rys. 2.1 Histogram częstości. Tab. 2.1 Histogram a tablica obliczeń statystycznych wj lj wj ⋅ l j w 2j ⋅ l j 0 7 0 0 1 7 7 7 2 5 10 20 3 1 3 9 Histogram jest graficznym przedstawieniem szeregu rozdzielczego, a więc dla każdej wartości w j częstości występowania l j . Pozwala to wprowadzić pewną uporządkowaną formę obliczeń statystycznych, nazywaną tablicą obliczeń statystycznych, aby łatwo kontrolować przebieg obliczeń. W obszernych obliczeniach statystycznych kontrola poprawności obliczeń jest najważniejszym problemem praktycznym. 3 ∑w l j j j =0 20 = ∑ xi i =1 3 , ∑w j =0 20 l = ∑ x i2 . 2 j j i =1 (2.7) Inne rozkłady dyskretne 2 36 W tablicy obliczeń statystycznych przeprowadza się obliczenia według wzorów (2.7), które, jak widać w (2.7), są równoważne obliczeniom średniej i odchylenia kwadratowego, zdefiniowanym w poprzednim rozdziale. Innymi słowy, tablica obliczeń statystycznych pozwala na uporządkowanie tych obliczeń, co ułatwia kontrolę procesu przetwarzania danych. W masowych obliczeniach statystycznych powinno się zawsze szczególnie uważnie kontrolować proces przetwarzania danych statystycznych. Tablica obliczeń statystycznych jest taką formą kontroli. Hipotezy statystyczne, jakie formułuje się w praktyce, mogą dotyczyć dwóch sytuacji: kiedy znamy z wcześniejszych badań rozkład prawdopodobieństwa i chcemy określić parametry tego rozkładu, mówimy wtedy o hipotezach parametrycznych. Drugi przypadek dotyczy sytuacji zupełnie nieznanych procesów losowych, które wymagają określenia rozkładu prawdopodobieństwa, mówimy wtedy o hipotezie rozkładu prawdopodobieństwa. Na przykład, bardzo często stawiana jest hipoteza o rozkładzie Poissona liczby pojazdów w minucie obserwowanego potoku ruchu i otrzymywany jest negatywny rezultat takiego badania. Natomiast pozytywnym wynikiem kończy się na ogół podobne badanie, dotyczące liczby zgłoszeń do centrali telefonicznej w godzinie szczytowej. Postawmy więc taką hipotezę dla zbadania znanym nam dotychczas sposobem: czy następujący rozkład liczby zgłoszeń podczas kolejnych minut do centrali telefonicznej może być rozkładem Poissona? 0 57 1 203 2 383 3 525 4 532 5 408 6 273 7 139 8 45 9 27 10 16 Inne rozkłady dyskretne 2 Problemy rozdziału 2 1. Dlaczego rozkład dwumianowy jest zastępowany rozkładem Poissona? 2. Dlaczego rozkład Poissona nazywany jest rozkładem rzadkich zdarzeń? 3. Czy zapotrzebowanie na energię ma rozkład dwumianowy? 4. Czy uszkodzenia złożonego systemu mają rozkład dwumianowy? 5. Czy rozkład Poissona jest właściwy do opisu potoku ruchu transportowego? 6. Czy rozkład Poissona jest właściwy do opisu potoku ruchu telefonicznego? 7. Czy rozkład Poissona jest właściwy do opisu potoku pieszych? 8. Czy rozkład Poissona jest właściwy dla strumienia wejściowego stacji benzynowej? 9. Tablica obliczeń statystycznych a wartość średnia. 10. Tablica obliczeń statystycznych a odchylenie kwadratowe. 11. Po co stawiamy hipotezy statystyczne? 12. Czy język statystyki matematycznej pozwala nam uzyskać obiektywną prawdę? 37