Przegląd ważniejszych rozkładów prawdopodobieństwa
Transkrypt
Przegląd ważniejszych rozkładów prawdopodobieństwa
Przegląd ważniejszych rozkładów prawdopodobieństwa - rozkłady dyskretne a) rozkład jednopunktowy Zmienna losowa X ma rozkład jednopunktowy, jeśli dla pewnego a ∈ R P (X = a) = 1. Wtedy µ x = δa natomiast dystrybuanta jest funkcją postaci 0 gdy x < a, F (x) = 1 gdy x ≥ a. b) rozkład dwupunktowy Jest to rozkład zmiennej losowej X przyjmującej tylko dwie wartości a, b, przy czym P (X = a) = p, P (X = b) = 1 − p, p ∈ (0, 1). Wtedy µx = pδa + (1 − p)δb natomiast dystrybuanta wyraża się wzorem F (x) = p1[a,∞) (x) + (1 − p)1[b,∞) (x), gdzie 1A (x) = 1 gdy x ∈ A, 0 gdy x ∈ / A. W przypadku, gdy a = 1, b = 0 mówimy o rozkładzie zero-jedynkowym. c) rozkład Bernoulliego (dwumianowy) Zmienna losowa X ma rozkład Bernoulliego z parametrami n ∈ N i p ∈ [0, 1] (X ∼ Bernoullie(n, p)), jeśli n k P (X = k) = p (1 − p)n−k , k = 0, 1, . . . , n. k Jest to rozkład łącznej liczby sukcesów w n próbach Bernoulliego. d) rozkład Poissona Zmienna losowa X ma rozkład Poissona z parametrem λ > 0 (X ∼ P oisson(λ)), jeśli P (X = k) = λk −λ e , k! k = 0, 1, 2, . . . . Rozwinięcie funkcji ex w szerego Maclaurena ma postać ex = ∞ P n=1 sprawdzić, że ∞ X k=0 P (X = k) = ∞ X λk k=0 k! e −λ −λ =e ∞ X λk k! | {z } k=0 =eλ 1 xn . n! = 1. Nietrudno jest zatem e) rozkład geometryczny Zmienna losowa X ma rozkład geometryczny z parametrem p ∈ (0, 1), jeśli P (X = k) = (1 − p)k−1 p, k = 1, 2, . . . Korzystając ze wzoru na sumę nieskończonego ciągu geometrycznego nietrudno sprawdzić, że ∞ X 1 = 1. (1 − p)k−1 p = p · 1 − (1 − p) k=1 Jest to rozkład czasu oczekiwania na pierwszy sukces w ciągu doświadczeń Bernoulliego, rozumianego jako liczba doświadczeń, które należy wykonać, by doczekać się sukcesu. e’) rozkład geometryczny - konwencja alternatywna Zmienna losowa Y ma rozkład wykładniczy z parametrem p ∈ (0, 1), jeśli P (X = k) = (1 − p)k p, k = 0, 1, 2, . . . Jest to rozkład liczby doświadczeń Bernoulliego wykonanych przed otrzymaniem pierwszego sukcesu. Oczywiście Y = X − 1. f) rozkład ujemny dwumianowy Zmienna losowa X ma ujemny rozkład dwumianowy z parametrami α > 0, p ∈ (0, 1), jeśli α+k−1 P (X = k) = (1 − p)k pα , k = 0, 1, 2, . . . k Jeśli parametr α jest całkowity, to jest to rozkład czasu oczekiwania na α-ty sukces w ciągu prób Bernoulliego, czyli jest to tzw. rozkład Pascala. Dla α = 1 otrzymujemy rozkład geometryczny opisany w e). g) rozkład hipergeometryczny Zmienna losowa X ma rozkład hipergeometryczny z parametrami M, N, n ∈ N, n ≤ N, n ≤ M , jeśli P (X = k) = N M k n−k N +M n , k = 0, 1, . . . , n. Łatwo jest podać przykład takiej zmiennej losowej. Rozważmy doświadczenie polegające na wylosowaniu 10 kart z talli 52 kart. Jeśli zmienna losowa X przyjmuje wartości równe liczbie wylosowanych pików, to ma ona rozkład hipergeometryczny z parametrami N = 13, M = 39, n = 10. - rozkłady ciągłe a) rozkład jednostajny na odcinku Zmienna losowa X ma rozkład jednostajny na odcinku [a, b] (X ∼ U [a, b]), jeśli gęstość ma postać 1 gdy x ∈ [a, b], b−a f (x) = 0 gdy x ∈ / [a, b]. Dystrybuanta tego rozkładu ma postać gdy x < a, 0 x−a gdy x ∈ [a, b), F (x) = b−a 1 gdy x ≥ b. 2 a’) rozkład jednostajny na A ⊂ R Niech A będzie borelowskim podzbiorem w R o dodatniej i skończonej mierze Lebesque’a λ1 . Jeśli zmienna losowa X ma rozkład jednostajny na zbiorze A, to jej gęstość ma postać 1 gdy x ∈ A, λ1 (A) f (x) = 0 gdy x ∈ /A b) rozkład wykładniczy Zmienna losowa X ma rozkład wykładniczy z parametrem λ > 0 (X ∼ Exp(λ)), jeśli gęstość ma postać −λx λe gdy x > 0, f (x) = (1) 0 gdy x ≤ 0 Uwaga: w niektórych podręcznikach i zbiorach zadań stosuje się inną konwencję, tzn. przyjmuje się, że gęstość ma postać 1 −1x e λ gdy x > 0, λ f (x) = (2) 0 gdy x ≤ 0 Nietrudno sprawdzić, że Z ∞ ∞ Z λe−λx dx = 1. f (x)dx = −∞ 0 Dystrybuanta rozkładu wykładniczego ma postać 0 gdy x < 0, F (x) = −λx 1−e gdy x ≥ 0. c) rozkład normalny Zmienna losowa X ∼ N (m, σ), gdzie m ∈ R oraz σ > 0, jeśli gęstość ma postać f (x) = √ (x−m)2 1 e− 2σ2 2πσ w przypadku standardowego rozkładu normalnego N (0, 1) gęstość ma postać x2 1 f (x) = √ e− 2 2π R∞ Wykazanie, że −∞ f (x)dx = 1 nie jest proste, ponieważ funkcja pierwotna Φ(x) funkcji f (x) nie jest funkcją elementarną. Najłatwiej jest w tym celu rozważyć całkę podwójną x2 +y 2 funkcji e− 2 po obszarze R2 , wtedy z uwagi na to, że jest to funkcja o rozdzielonych zmiennych mamy Z ∞Z ∞ Z ∞ Z ∞ 2 2 2 y2 − x +y − x2 2 e e dx · e− 2 dy dxdy = −∞ −∞ −∞ Z−∞∞ 2 x = ( e− 2 dx)2 −∞ z drugiej strony przechodząc na współrzędne biegunowe, tj. stosując podstawienie x = r cos ϕ, y = r sin ϕ możemy tę całkę obliczyć Z ∞Z ∞ Z ∞ Z 2π 2 2 r2 − x +y e 2 dxdy = e− 2 rdϕdr −∞ −∞ 0 0 h i r2 ∞ = 2π − e− 2 0 = 2π. 3 Stąd Z ∞ x2 e− 2 dx = √ 2π. −∞ Stosując podstawienie y = Z ∞ −∞ x−m σ sprawdzamy, że (x−m)2 1 1 √ e− 2σ2 dx = √ 2πσ 2π Z ∞ x2 e− 2 dx = 1. | −∞ {z } √ = 2π Niech Φ oznacza dystrybuantę rozkładu N (0, 1), z uwagi na to, że gęstość tego rozkładu jest funkcją parzystą zachodzi równość Φ(−t) = 1 − Φ(t). Ponadto jeśli FN (m,σ) jest dystrybuantą rozkładu normalnego N (m, σ), to t − m . FN (m,σ) (t) = Φ σ d) rozkład gamma Zmienna losowa X ma rozkład gamma z parametrami a, b > 0 (X ∼ Γ(a, b)), jeśli jej gęstość ma postać ba a−1 −bx x e gdy x > 0, Γ(a) γa,b (x) = 0 gdy x ≤ 0 Przypomnijmy, że funkcja gamma zdefiniowana jest wzorem Z ∞ ta−1 e−t dt, a > 0. Γ(a) = (3) 0 Zauważmy, że stosując podstawienie bx = t mamy Z ∞ Z ∞ 1 γa,b (x)dx = ta−1 e−t dt = 1 Γ(a) 0 |0 {z } =Γ(a) Ponieważ Γ(1) = 1 zatem dla a = 1 otrzymujemy rozkład wykładniczy z parametrem b. e) rozkład beta Zmienna losowa X ma rozkład beta z parametrami a, b > 0, jeśli jej gęstość ma postać 1 a−1 x (1 − x)b−1 gdy x ∈ [0, 1], B(a,b) βa,b (x) = 0 gdy x ∈ / [0, 1], gdzie B(a, b) oznacza funkcję specjalną beta, tj. funkcję zadaną wzorem Z ∞ B(a, b) = ta−1 (1 − t)b−1 dt. 0 f) rozkład Cauchy’ego Zmienna losowa X ma rozkład Cauchy’ego z parametrami a > 0 oraz m ∈ R, jesli jej gęstość zadana jest wzorem a f (x) = . 2 π(a + (x − m)2 ) 4 Z uwagi na to, że prosta x = m stanowi oś symetrii wykresu gęstości otrzymujemy równość 1 P (X > m) = P (X < m) = . 2 W przypadku, gdy a = 1 oraz m = 1, tj. w przypadku standardowej postaci rozkładu Cauchy’ego dystrybuanta ma postać F (x) = 1 1 + arctan x. 2 π g) rozkład Pareto Zmienna losowa X ma rozkład Pareto z parametrami c > 0 i α > 0, jeśli jej gęstość zadana jest wzorem 0 gdy x < c, f (x) = cα α xα+1 gdy x ≥ c. Parametr c nazywamy parametrem położenia, natomiast α - kształtu. h) rozkład logarytmiczno-normalny (lognormalny) Zmienna losowa Y ma rozkład lognormalny z parametrami m, σ > 0, jeśli jej gęstość ma postać ( ln x−m 1 √ gdy x > 0, e− 2σ2 xσ 2π f (x) = 0 gdy x ≤ 0. Jest to rozkład zmiennej losowej Y = eX , gdzie X ∼ N (m, σ). i) rozkład Weibulla Zmienna losowa X ma rozkład Weibulla z parametrami α, β > 0, jeśli jej gęstość ma postać x α αβ −α xα−1 e−( β ) gdy x > 0, f (x) = 0 gdy x ≤ 0. Nietrudno policzyć, że dystrybuanta wyraża się wtedy wzorem x α 1 − e−( β ) gdy x > 0, F (x) = 0 gdy x ≤ 0. Zauważmy, że dla α = 1 rozkład Weilbulla jest w szczególności rozkładem wykładniczym z parametrem λ = β1 . j) rozkład t-Studenta Zmienna losowa X ma rozkład t-Studenta o n ∈ N stopniach swobody, jeśli jej gęstość ma postać Γ( n+1 ) 1 x2 − 12 (n+1) 2 f (x) = √ · 1+ n nπ Γ( n2 ) Uwaga 1: Rozkład t-Studenta o n stopniach swobody jest rozkładem zmiennej losowej √ nX √ , Yn gdzie zmienne losowe X, Yn są niezależne oraz X ∼ N (0, 1), Yn ∼ χ2n . 5 k) rozkład χ2 (n) Zmienna losowa X ma rozkład chi-kwadrat o n ∈ N stopniach swobody (X ∼ χ2n ), jeśli jej gęstość ma postać ( 1 n 1 x 2 −1 e− 2 x gdy x > 0, n 2 Γ( n ) 2 γ n , 1 (x) = 2 2 2 0 gdy x ≤ 0. Uwaga 1: Rozkład chi-kwadrat o n stopniach swobody jest rozkładem sumy X12 + . . . + Xn2 , gdzie X1 , . . . , Xn są niezależnymi zmiennymi losowymi o rozkładzie N (0, 1). Uwaga 2: Rozkład chi-kwadrat o n stopniach swobody jest rozkładem Γ( n2 , 12 ). 6