Zapisz jako PDF

Transkrypt

Zapisz jako PDF
Wnioskowanie_Statystyczne_-_wykład
Spis treści
1 Rozkład równomierny
2 Rozkład dwumianowy
2.1 Dowód
2.2 Przykład: rozkład dwumianowy
2.3 Przykład: trzy dziewczynki
2.4 Przykład:
3 Rozkład Poissona
3.1 Dowód
3.2 Wartość oczekiwana i wariancja
3.2.1 Dowód
4 Rozkład Gaussa
Rozkład równomierny
... zwany też jednostajnym, prostokątnym lub płaskim, przyjmuje jednakowe wartości dla wszystkich
liczb z jakiegoś odcinka (na przykład między zero a jeden), a poza tym odcinkiem ma wartość zero:
Rozkład równomierny określony na
odcinku od zera do jedynki.
Wartość oczekiwana
Wariancja
Oczywiście rozkład jednostajny może być określony na dowolnym odcinku
przeskalować opisaną powyżej kanoniczną postać:
— wystarczy
Proste modyfikacje przytoczonych powyżej całek wykażą, że jego wartość oczekiwana wynosi
a wariancja
.
Rozkład dwumianowy
Powtarzamy razy doświadczenie o dwóch możliwych wynikach i oraz prawdopodobieństwach
odpowiednio i , przy czym
. Wynik nazywamy sukcesem i pytamy, jakie jest
prawdopodobieństwo sukcesów?
Liczba -elementowych podciągów ciągu -elementowego wynosi
, czyli
; na pierwszym miejscu każdego z ciągów możemy ustawić każdy z
elementów, po jego ustaleniu na drugim miejscu każdy z
elementów itd. Jeśli ponadto nie
rozróżniamy podciągów o różnej kolejności elementów, to liczbę tę podzielić należy przez ilość
permutacji (przestawień) zbioru -elementowego, czyli . W rezultacie dostajemy
Niech
serii
oznacza prawdopodobieństwo wystąpienia
powtórzeń. Prawdopodobieństwo jednej serii
razy zdarzenia o prawdopodobieństwie
zdarzeń
i
zdarzeń
w
wynosi
. Zgodnie z powyższymi rozważaniami, takich serii, które różnią się kolejnością wystąpienia
zdarzeń
i , będzie
. Ostatecznie rozkład dwumianowy możemy opisać następującym wzorem:
Rysunek %i 3 przedstawia rozkłady dwumianowe dla różnych wartości i . Wartość oczekiwana
wariancja
rozkładu dwumianowego wyrażają się następującymi wzorami:
i
Dowód
Bezpośrednie rachunki są w tym przypadku żmudne, więc dla znalezienia wartości oczekiwanej i
wariancji rozkładu dwumianowego posłużymy się zmienną losową , opisującą wynik pojedynczego
doświadczenia. Przyjmuje ona wartość 1, jeśli zaszło zdarzenie (sukces) i 0 w przypadku porażki.
Rozkład liczby sukcesów w serii
Wartość oczekiwana zmiennej
powtórzeń opisuje zmienna będąca ich sumą
.
, czyli wyniku pojedynczego doświadczenia, wynosi
Wartość oczekiwana sumy zmiennych , dającej wartość zmiennej opisywanej rozkładem
dwumianowym, będzie (z liniowości wartości oczekiwanej) sumą wartości oczekiwanych — stąd
wartość oczekiwana rozkładu dwumianowego wyniesie
. Z kolei wariancja wynosi
Wariancja rozkładu dwumianowego będzie równa wariancji sumy
te są niezależne,
Dwumianowe rozkłady prawdopodobieństwa
zmiennych
. Ponieważ zmienne
dla
,
oraz
Przykład: rozkład dwumianowy
Obliczmy rozkład prawdopodobieństwa wyrzucenia
szóstek w pięciu rzutach kostką (symulowany
w rozdziale o metodzie Monte Carlo):
,
0
1
2
3
,
4
,
i tak dalej.
5
0,4019 0,4019 0,1608 0,0322 0,0032 0,0001
Wartości te przedstawione są na wykresie w lewym górnym rogu rysunku %i 3. Prawdopodobieństwo
wyrzucenia przynajmniej dwóch (czyli od dwóch do pięciu) szóstek wynosi
.
Z kolei rozkład liczby sukcesów w stu takich grach, przybliżany numerycznie na rysunku, będzie
odpowiadał
dla
. Suma tego rozkładu dla
wynosi
.
Przykład: trzy dziewczynki
Obliczmy prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki —
zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
"Co najmniej trzy dziewczynki" można zasymulować jako cztery lub trzy "sukcesy" w czterech
"losowaniach płci" o prawdopodobieństwie sukcesu , czyli
zgodnie z wynikiem symulacji z zadania.
Przykład:
W rzutach do kosza uzyskiwaliśmy średnio 6 trafień na 10 rzutów. Po zmianie techniki w pierwszych
10 rzutach uzyskaliśmy 9 trafień. Czy należy wnioskować, że nowa technika rzutów poprawia średnią
trafień?
Jeśli zmiana techniki nie wpłynęła na skuteczność, to prawdopodobieństwo uzyskania 9 lub więcej
trafień na 10 rzutów odpowiada 9 lub 10 sukcesom w 10 losowaniach o prawdopodobieństwie 0,6,
czyli:
Czyli mniej niż 5% — zgodnie z wynikiem symulacji.
Rozkład Poissona
W granicy dużej liczby zdarzeń o niskim prawdopodobieństwie , tj.
otrzymujemy z rozkładu dwumianowego rozkład Poissona:
Dowód
Ponieważ
, oraz
,
dostajemy (2).
Sprawdźmy warunek
Przestrzeń wszystkich możliwych zdarzeń wyczerpują tu liczby sukcesów
czyli
gdyż
Wartość oczekiwana i wariancja
wynoszą:
od zera do
,
Dowód
z (4)
Jeśli wariancja rozkładu Poissona jest równa jego wartości oczekiwanej ( ), to odchylenie
standardowe (czyli pierwiastek z wariancji) wyniesie
Wynik ten przytaczany bywa jako "prawo" określające błąd liczby zliczeń jako jej pierwiastek.
Rozkłady Poissona dla różnych wartości
parametru .
Rozkład Gaussa
Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od parametrów
. Jego gęstość prawdopodobieństwa określona jest wzorem:
Parametry te są tak dobrane, że wartość oczekiwana wynosi , a wariancja
wstawiając (6) do wzorów na wartość oczekiwaną i wariancję.
i
, co można sprawdzić
, czyli standardowy rozkład Gaussa o
zerowej średniej (
) i jednostkowej
wariancji (
).
Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej wariancji (
) zwiemy
standardowym rozkładem Gaussa i oznaczamy zwykle
. Przedstawia go rysunek %i 4.
Zaznaczono na nim m. in. wartość całki od
do
, czyli prawdopodobieństwo, że wylosowana z
tego rozkładu liczba będzie mniejsza niż
. Jak widać, wynosi ono ok. 16%, a jeśli weźmiemy pod
uwagę również wartości większe od 1, będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z
tego rozkładu prawie dwie spośród pięciu mogą znaleźć się w odległości większej niż od wartości
oczekiwanej. Warto o tym pamiętać, gdyż odchylenie standardowe bywa czasami nazywane
"błędem". Stwierdzenie "w granicach błędu" może odnosić się raczej np.do wartości 3 :
prawdopodobieństwo wylosowania wartości oddalonej od średniej o więcej niż
dla rozkładu
Gaussa wynosi zaledwie 0,3 wartości prawdopodobieństw odchyleń większych niż
dla
zmiennych z rozkładu normalnego:
Należy jednak pamiętać, że gęstość prawdopodobieństwa dana równaniem (6) zanika w
nieskończoności tylko asymptotycznie, i dlatego w świetle tego rozkładu prawdopodobieństwo
wylosowania dowolnej wartości będzie niezerowe (choć dla większości niezmiernie małe). Prowadzi
to czasem do paradoksów, jak np. niezerowe prawdopodobieństwo ujemnej masy.[1] Jest to cena za
korzystanie ze zwięzłej i eleganckiej postaci analitycznej rozkładu.
1. ↑ Gaussowski rozkład pomiarów jakiejkolwiek masy, określony dodatnimi wartościami i ,
będzie wykazywał nieujemne — choć zapewne bardzo małe — prawdopodobieństwo również
dla ujemnych wartości zmiennej losowej, którą w tym przypadku będzie mierzona masa.