Przegląd ważniejszych rozkładów prawdopodobieństwa

Transkrypt

Przegląd ważniejszych rozkładów prawdopodobieństwa
Przegląd ważniejszych rozkładów prawdopodobieństwa
- rozkłady dyskretne
a) rozkład jednopunktowy
Zmienna losowa X ma rozkład jednopunktowy, jeśli dla pewnego a ∈ R
P (X = a) = 1.
Wtedy
µ x = δa
natomiast dystrybuanta jest funkcją postaci
0 gdy x < a,
F (x) =
1 gdy x ≥ a.
b) rozkład dwupunktowy
Jest to rozkład zmiennej losowej X przyjmującej tylko dwie wartości a, b, przy czym
P (X = a) = p, P (X = b) = 1 − p,
p ∈ (0, 1).
Wtedy
µx = pδa + (1 − p)δb
natomiast dystrybuanta wyraża się wzorem
F (x) = p1[a,∞) (x) + (1 − p)1[b,∞) (x),
gdzie
1A (x) =
1 gdy x ∈ A,
0 gdy x ∈
/ A.
W przypadku, gdy a = 1, b = 0 mówimy o rozkładzie zero-jedynkowym.
c) rozkład Bernoulliego (dwumianowy)
Zmienna losowa X ma rozkład Bernoulliego z parametrami n ∈ N i p ∈ [0, 1] (X ∼
Bernoullie(n, p)), jeśli
n k
P (X = k) =
p (1 − p)n−k , k = 0, 1, . . . , n.
k
Jest to rozkład łącznej liczby sukcesów w n próbach Bernoulliego.
d) rozkład Poissona
Zmienna losowa X ma rozkład Poissona z parametrem λ > 0 (X ∼ P oisson(λ)), jeśli
P (X = k) =
λk −λ
e ,
k!
k = 0, 1, 2, . . . .
Rozwinięcie funkcji ex w szerego Maclaurena ma postać ex =
∞
P
n=1
sprawdzić, że
∞
X
k=0
P (X = k) =
∞
X
λk
k=0
k!
e
−λ
−λ
=e
∞
X
λk
k!
| {z }
k=0
=eλ
1
xn
.
n!
= 1.
Nietrudno jest zatem
e) rozkład geometryczny
Zmienna losowa X ma rozkład geometryczny z parametrem p ∈ (0, 1), jeśli
P (X = k) = (1 − p)k−1 p,
k = 1, 2, . . .
Korzystając ze wzoru na sumę nieskończonego ciągu geometrycznego nietrudno sprawdzić,
że
∞
X
1
= 1.
(1 − p)k−1 p = p ·
1 − (1 − p)
k=1
Jest to rozkład czasu oczekiwania na pierwszy sukces w ciągu doświadczeń Bernoulliego,
rozumianego jako liczba doświadczeń, które należy wykonać, by doczekać się sukcesu.
e’) rozkład geometryczny - konwencja alternatywna
Zmienna losowa Y ma rozkład wykładniczy z parametrem p ∈ (0, 1), jeśli
P (X = k) = (1 − p)k p,
k = 0, 1, 2, . . .
Jest to rozkład liczby doświadczeń Bernoulliego wykonanych przed otrzymaniem pierwszego
sukcesu. Oczywiście Y = X − 1.
f) rozkład ujemny dwumianowy
Zmienna losowa X ma ujemny rozkład dwumianowy z parametrami α > 0, p ∈ (0, 1), jeśli
α+k−1
P (X = k) =
(1 − p)k pα , k = 0, 1, 2, . . .
k
Jeśli parametr α jest całkowity, to jest to rozkład czasu oczekiwania na α-ty sukces w ciągu
prób Bernoulliego, czyli jest to tzw. rozkład Pascala. Dla α = 1 otrzymujemy rozkład
geometryczny opisany w e).
g) rozkład hipergeometryczny
Zmienna losowa X ma rozkład hipergeometryczny z parametrami M, N, n ∈ N, n ≤ N, n ≤
M , jeśli
P (X = k) =
N
M
k
n−k
N +M
n
,
k = 0, 1, . . . , n.
Łatwo jest podać przykład takiej zmiennej losowej. Rozważmy doświadczenie polegające
na wylosowaniu 10 kart z talli 52 kart. Jeśli zmienna losowa X przyjmuje wartości równe
liczbie wylosowanych pików, to ma ona rozkład hipergeometryczny z parametrami N =
13, M = 39, n = 10.
- rozkłady ciągłe
a) rozkład jednostajny na odcinku
Zmienna losowa X ma rozkład jednostajny na odcinku [a, b] (X ∼ U [a, b]), jeśli gęstość ma
postać
1
gdy x ∈ [a, b],
b−a
f (x) =
0
gdy x ∈
/ [a, b].
Dystrybuanta tego rozkładu ma postać

gdy x < a,
 0
x−a
gdy x ∈ [a, b),
F (x) =
 b−a
1
gdy x ≥ b.
2
a’) rozkład jednostajny na A ⊂ R Niech A będzie borelowskim podzbiorem w R o dodatniej
i skończonej mierze Lebesque’a λ1 . Jeśli zmienna losowa X ma rozkład jednostajny na
zbiorze A, to jej gęstość ma postać
1
gdy x ∈ A,
λ1 (A)
f (x) =
0
gdy x ∈
/A
b) rozkład wykładniczy
Zmienna losowa X ma rozkład wykładniczy z parametrem λ > 0 (X ∼ Exp(λ)), jeśli
gęstość ma postać
−λx
λe
gdy x > 0,
f (x) =
(1)
0
gdy x ≤ 0
Uwaga: w niektórych podręcznikach i zbiorach zadań stosuje się inną konwencję, tzn. przyjmuje się, że gęstość ma postać
1 −1x
e λ gdy x > 0,
λ
f (x) =
(2)
0
gdy x ≤ 0
Nietrudno sprawdzić, że
Z
∞
∞
Z
λe−λx dx = 1.
f (x)dx =
−∞
0
Dystrybuanta rozkładu wykładniczego ma postać
0
gdy x < 0,
F (x) =
−λx
1−e
gdy x ≥ 0.
c) rozkład normalny
Zmienna losowa X ∼ N (m, σ), gdzie m ∈ R oraz σ > 0, jeśli gęstość ma postać
f (x) = √
(x−m)2
1
e− 2σ2
2πσ
w przypadku standardowego rozkładu normalnego N (0, 1) gęstość ma postać
x2
1
f (x) = √ e− 2
2π
R∞
Wykazanie, że −∞ f (x)dx = 1 nie jest proste, ponieważ funkcja pierwotna Φ(x) funkcji
f (x) nie jest funkcją elementarną. Najłatwiej jest w tym celu rozważyć całkę podwójną
x2 +y 2
funkcji e− 2 po obszarze R2 , wtedy z uwagi na to, że jest to funkcja o rozdzielonych
zmiennych mamy
Z ∞Z ∞
Z ∞
Z ∞
2
2
2
y2
− x +y
− x2
2
e
e dx ·
e− 2 dy
dxdy =
−∞ −∞
−∞
Z−∞∞
2
x
= (
e− 2 dx)2
−∞
z drugiej strony przechodząc na współrzędne biegunowe, tj. stosując podstawienie x =
r cos ϕ, y = r sin ϕ możemy tę całkę obliczyć
Z ∞Z ∞
Z ∞ Z 2π
2
2
r2
− x +y
e 2 dxdy =
e− 2 rdϕdr
−∞ −∞
0
0
h
i
r2 ∞
= 2π − e− 2
0
= 2π.
3
Stąd
Z
∞
x2
e− 2 dx =
√
2π.
−∞
Stosując podstawienie y =
Z ∞
−∞
x−m
σ
sprawdzamy, że
(x−m)2
1
1
√
e− 2σ2 dx = √
2πσ
2π
Z
∞
x2
e− 2 dx = 1.
| −∞ {z
}
√
= 2π
Niech Φ oznacza dystrybuantę rozkładu N (0, 1), z uwagi na to, że gęstość tego rozkładu
jest funkcją parzystą zachodzi równość
Φ(−t) = 1 − Φ(t).
Ponadto jeśli FN (m,σ) jest dystrybuantą rozkładu normalnego N (m, σ), to
t − m
.
FN (m,σ) (t) = Φ
σ
d) rozkład gamma
Zmienna losowa X ma rozkład gamma z parametrami a, b > 0 (X ∼ Γ(a, b)), jeśli jej gęstość
ma postać
ba a−1 −bx
x e
gdy x > 0,
Γ(a)
γa,b (x) =
0
gdy x ≤ 0
Przypomnijmy, że funkcja gamma zdefiniowana jest wzorem
Z ∞
ta−1 e−t dt, a > 0.
Γ(a) =
(3)
0
Zauważmy, że stosując podstawienie bx = t mamy
Z ∞
Z ∞
1
γa,b (x)dx =
ta−1 e−t dt = 1
Γ(a)
0
|0
{z
}
=Γ(a)
Ponieważ Γ(1) = 1 zatem dla a = 1 otrzymujemy rozkład wykładniczy z parametrem b.
e) rozkład beta
Zmienna losowa X ma rozkład beta z parametrami a, b > 0, jeśli jej gęstość ma postać
1 a−1
x (1 − x)b−1 gdy x ∈ [0, 1],
B(a,b)
βa,b (x) =
0
gdy x ∈
/ [0, 1],
gdzie B(a, b) oznacza funkcję specjalną beta, tj. funkcję zadaną wzorem
Z ∞
B(a, b) =
ta−1 (1 − t)b−1 dt.
0
f) rozkład Cauchy’ego
Zmienna losowa X ma rozkład Cauchy’ego z parametrami a > 0 oraz m ∈ R, jesli jej
gęstość zadana jest wzorem
a
f (x) =
.
2
π(a + (x − m)2 )
4
Z uwagi na to, że prosta x = m stanowi oś symetrii wykresu gęstości otrzymujemy równość
1
P (X > m) = P (X < m) = .
2
W przypadku, gdy a = 1 oraz m = 1, tj. w przypadku standardowej postaci rozkładu
Cauchy’ego dystrybuanta ma postać
F (x) =
1 1
+ arctan x.
2 π
g) rozkład Pareto
Zmienna losowa X ma rozkład Pareto z parametrami c > 0 i α > 0, jeśli jej gęstość zadana
jest wzorem
0
gdy x < c,
f (x) =
cα
α xα+1
gdy x ≥ c.
Parametr c nazywamy parametrem położenia, natomiast α - kształtu.
h) rozkład logarytmiczno-normalny (lognormalny)
Zmienna losowa Y ma rozkład lognormalny z parametrami m, σ > 0, jeśli jej gęstość ma
postać
(
ln x−m
1
√
gdy x > 0,
e− 2σ2
xσ
2π
f (x) =
0
gdy x ≤ 0.
Jest to rozkład zmiennej losowej Y = eX , gdzie X ∼ N (m, σ).
i) rozkład Weibulla
Zmienna losowa X ma rozkład Weibulla z parametrami α, β > 0, jeśli jej gęstość ma postać
x α
αβ −α xα−1 e−( β ) gdy x > 0,
f (x) =
0
gdy x ≤ 0.
Nietrudno policzyć, że dystrybuanta wyraża się wtedy wzorem
x α
1 − e−( β ) gdy x > 0,
F (x) =
0
gdy x ≤ 0.
Zauważmy, że dla α = 1 rozkład Weilbulla jest w szczególności rozkładem wykładniczym z
parametrem λ = β1 .
j) rozkład t-Studenta
Zmienna losowa X ma rozkład t-Studenta o n ∈ N stopniach swobody, jeśli jej gęstość ma
postać
Γ( n+1
)
1
x2 − 12 (n+1)
2
f (x) = √ ·
1+
n
nπ Γ( n2 )
Uwaga 1: Rozkład t-Studenta o n stopniach swobody jest rozkładem zmiennej losowej
√
nX
√ ,
Yn
gdzie zmienne losowe X, Yn są niezależne oraz X ∼ N (0, 1), Yn ∼ χ2n .
5
k) rozkład χ2 (n)
Zmienna losowa X ma rozkład chi-kwadrat o n ∈ N stopniach swobody (X ∼ χ2n ), jeśli jej
gęstość ma postać
(
1
n
1
x 2 −1 e− 2 x gdy x > 0,
n
2 Γ( n )
2
γ n , 1 (x) =
2
2 2
0
gdy x ≤ 0.
Uwaga 1: Rozkład chi-kwadrat o n stopniach swobody jest rozkładem sumy
X12 + . . . + Xn2 ,
gdzie X1 , . . . , Xn są niezależnymi zmiennymi losowymi o rozkładzie N (0, 1).
Uwaga 2: Rozkład chi-kwadrat o n stopniach swobody jest rozkładem Γ( n2 , 12 ).
6