Rachunek pstwa w5-2012

Transkrypt

Rachunek pstwa w5-2012
RACHUNEK
PRAWDOPODOBIEŃSTWA
WYKŁAD 5.
PODSTAWOWE ROZKŁADY
PRAWDOPODOBIEŃSTWA
Rozkłady skokowe
Rozkład jednopunktowy
Określamy:
P(X = c) = 1
gdzie c ustalona liczba.
1
EX = c,
D2X = 0
(tylko ten rozkład ma zerową wariancję !!!)
2
Rozkład dwupunktowy (zerojedynkowy)
Niech p ∈(0, 1) będzie ustaloną liczbą.
Określamy:
P(X = 0) = q, P(X = 1) = p ; gdzie q = 1 – p.
Umowa:
0 - porażka
1 - sukces
3
EX = p,
D2X = pq
4
Rozkład dwumianowy
Dla danych p ∈(0, 1) , n ∈ N określamy funkcję
prawdopodobieństwa
 n k n − k
P( X = k ) =   p q
(wzór Bernoulliego)
 k
gdzie q = 1 – p
k = 0, 1, 2, ... , n.
5
6
Jakub Bernoulli (1654 - 1705) - szwajcarski matematyk i fizyk.
7
Jeśli przyjmiemy, że n oznacza liczbę
niezależnych doświadczeń z których każde
kończy się jednym z dwóch wyników:
„sukcesem"
(z
prawdopodobieństwem
p w każdym doświadczeniu) lub „porażką”
i zmienna losowa X oznacza liczbę
„sukcesów” to powyższy wzór wyznacza
prawdopodobieństwo uzyskania dokładnie
k sukcesów w n doświadczeniach (próbach).
8
Sprawdzenie
 n  k n−k
n


(
)
P
(
X
=
k
)
=
p
q
=
p
+
q
=1
∑
∑
k 
k =0
k =0  
n
n
9
EX = np,
D2X = npq
10
Przykład
Prawdopodobieństwo uszkodzenia kserokopiarki przed upływem gwarancji wynosi 0,2.
Firma zakupiła 6 kserokopiarek. Obliczyć
prawdopodobieństwo, że przed upływem
gwarancji 2 kserokopiarki ulegną uszkodzeniu.
Jaka jest najbardziej prawdopodobna liczba
uszkodzonych kserokopiarek przed upływem
gwarancji.
X – liczba uszkodzonych kserokopiarek przed
upływem gwarancji,
11
 6 2 4
P ( X = 2) =   0,2 0,8 = 15 ⋅ 0,04 ⋅ 0,4096 = 0,24576
 2
12
Uwaga
xk 0
pk 0,2621
1
2
3
4
5
6
0,3932 0,2458 0,0819 0,0154 0,0015 0,0001
13
Przykład
Rzucamy 4 razy kostką sześcienną. Jakie jest
prawdopodobieństwo, że w co najmniej 3 rzutach
liczba oczek będzie podzielna przez 3?.
14
Szukane prawdopodobieństwo to
P(X ≥ 3) = P(X = 3) + P(X = 4),
gdzie „sukcesem” jest uzyskanie 3 lub 6
oczek, więc p = 1/3.
15
Zatem
3
1
 4  1   2 
2
8
P( X = 3) =      = 4 ⋅ =
81 81
 3  3   3 
4
0
 4  1   2 
1
1
P( X = 4) =      = 1 ⋅ =
81 81
 4  3   3 
P ( X ≥ 3) = P ( X = 3) + P ( X = 4) =
16
8 1 1
+ =
81 81 9
Przykład
Obliczymy wartość oczekiwaną rozkładu
dwumianowego.
n
 n  k n−k
n!
EX = ∑ k   p q = ∑ k
p k q n−k =
k!(n − k )!
k =0  k 
k =1
n
(n − 1)!
= np ∑
p k −1q n −k = np ( p + q ) n −1 = np
k =1 ( k − 1)!( n − k )!
n
17
Rozkład geometryczny
X - liczba prób Bernoulliego poprzedzających
pierwszy sukces
P ( X = k ) = pq k
q=1-p
k = 0, 1, 2, ...
18
Sprawdzenie
∞
∞
k =0
k =0
k
P
(
X
=
k
)
=
pq
∑
∑ =
19
p
=1
1− q
2
EX = q/p;
D X = q/p
20
2
Rozkład Poissona
Dla λ > 0 określamy funkcję
prawdopodobieństwa
λ k −λ
P (X = k ) =
e
k = 0, 1, 2, ...
k!
21
Siméon Denis Poisson (1781–1840), francuski
mechanik teoretyk, fizyk i matematyk. W matematyce
zajmował się całkami oznaczonymi, równaniami
różnicowymi
i różniczkowymi
oraz
teorią
prawdopodobieństwa.
22
Sprawdzenie
∞
∞
k =0
k =0
∑ P( X = k ) = ∑
=e
−λ
∞
λ
k
∑ k! = e
λ
k
k!
−λ λ
e −λ =
e =1
k =0
23
EX = λ
D2X = λ
24
Przykład
Obliczymy wartość oczekiwaną rozkładu
Poissona.
∞
∞
λk −λ
λk −1
−λ
EX = ∑ k e = λe ∑
= λ e −λ e λ = λ
k =0
k!
k =1
25
(k − 1)!
Rozkład Poissona (możliwość odczytu
w tablicy) może dla dużych n (praktycznie
n ≥ 30) i małych p (praktycznie p ≤ 0,2)
przybliżać rozkład dwumianowy
(przybliżenie Poissona)
 n  k n − k λk − λ
  p q ≈
e
gdzie λ = n ⋅ p
k!
k 
26
Przykład
W pudełku jest 400 żarówek. Jakie jest
prawdopodobieństwo, że wśród nich jest
5 żarówek wadliwych, jeśli wadliwość
produkcji takich żarówek wynosi 0,5%?
Jaka jest najbardziej prawdopodobna liczba
uszkodzonych żarówek w tym pudełku?
27
Zastosujemy
przybliżenie
Poissona,
λ = n ⋅ p = 400 ⋅ 0,005 = 2 .
W tablicy rozkładu Poissona (tablica I)
odczytamy, że:
P(X = 5) = 0,0361
Również w tablicy rozkładu Poissona
odczytamy, że najbardziej prawdopodobna
liczba uszkodzonych żarówek w tym pudełku
to 1 lub 2 (dla obu tych liczb
prawdopodobieństwo jest równe 0,2707).
28
Rozkłady ciągłe
Rozkład jednostajny
Rozkład którego gęstość jest stała w pewnym
przedziale nazywamy jednostajnym.
Gęstość rozkładu jednostajnego w (a, b)
 1
x ∈ (a; b)
f ( x) = b − a
 0
x ∉ ( a ; b)
29
Ponieważ gęstość ta ma oś symetrii w punkcie
x = (a + b)/2 to
EX = (a+b)/2
30
Pokażemy, że
D2X = (b – a)2/12
31
Przykład
Najpierw obliczymy EX2
3 b
b
1
1 x
EX = ∫ x
dx =
b−a
b−a 3
a
2
2
=
a
1  b 3 a 3  a 2 + 2ab + b 2
 −  =
=
b−a 3 3 
3
Zatem
(b − a )
a 2 + 2ab + b 2  a + b 
2
2
2
D X = EX − ( EX ) =
−
 =
3
12
 2 
2
32
2
Rozkład wykładniczy
Rozkład ten występuje często w zagadnieniach
rozkładu
czasu
między
zgłoszeniami
(awariami) lub czasu oczekiwania na obsługę
w systemach kolejkowych.
Gęstość rozkładu wykładniczego o parametrze
a > 0 ma postać
ae − ax
f ( x) = 
0
33
x>0
x≤0
dystrybuantą tego rozkładu jest funkcja
1 − e − ax
F ( x) = 
0
(uzasadnienie: F'(x) = f(x))
34
x>0
x≤0
Przykład
Obliczymy EX
∞
∞
1
1


EX = ∫ xae − ax dx =  − xe − ax − e − ax  =
a

0 a
0
1
D2 X = 2
a
35
Własność.
1) Jeśli liczba zgłoszeń w systemie kolejkowym w przedziale
czasu (t, t + T) ma rozkład Poissona o parametrze λT, oraz
liczby zgłoszeń przychodzące w rozłącznych przedziałach
czasu są niezależne to czas X między kolejnymi
zgłoszeniami ma rozkład wykładniczy o parametrze a = 1/λ.
2) Dla dowolnych t, T > 0 mamy
P( X ≥ t + T | X ≥ t ) = P( X ≥ T )
(własność braku pamięci)
P( X ≥ t + T | X ≥ t ) =
P( X ≥ t + T ∧ X ≥ t ) P( X ≥ t + T )
=
=
P( X ≥ t )
P( X ≥ t )
e − ( t +T ) a
= −ta = e −Ta = P( X ≥ T )
e
Jest to jedyny rozkład ciągły o tej
własności.
36
Rozkład normalny (Gaussa) N (m,σ )
m ∈ R , σ ∈(0, + ∞)
Dla
Określamy gęstość rozkładu
f ( x) =
1
σ 2π
e
( x−m )2
−
2σ 2
37
x∈R
Carl Friedrich Gauss (1777 - 1855) – niemiecki matematyk i fizyk.
Jego badania związane z teorią błędów doprowadziły do odkrycia
rozkładu normalnego zmiennej losowej (nazywany także rozkładem
Gaussa), który jest najważniejszym rozkładem w teorii
prawdopodobieństwa.
38
39
Uwaga
Jeśli X ma rozkład N(m, σ) to zmienna losowa
Y = (X – m)/σ ma rozkład N(0, 1)
(takie przekształcenie nazywamy
standaryzacją).
40
Wartości dystrybuanty dla argumentów
ujemnych
wyznaczamy
na
podstawie
zależności
Φ(– x) = 1 – Φ(x)
41
Przykład
Dochód miesięczny (zł) w pewnej populacji
osób ma rozkład normalny N(1600; 300).
Jaki procent osób w tej populacji ma dochód
miesięczny poniżej 1000 zł?
X – wysokość miesięcznego dochodu
 X − 1600 1000 − 1600 
P ( X < 1000) = P
<
 = P(Y < −2 ) =
300
300


= Φ (−2) = 1 − Φ(2) = 1 − 0,9772 = 0,0228 = 2,28%
42
Przykład
Czas wykonania pewnego detalu (min.) jest
zmienną losową o rozkładzie normalnym
N(m; σ). Wiadomo, że 80% robotników
wykonuje ten detal dłużej niż 10 minut a 60%
robotników dłużej niż 12 minut.
a)wyznacz
parametry
rozkładu
czasu
wykonania detalu m i σ,
b) jaki odsetek robotników wykonuje ten detal
w czasie krótszym niż 6 minut?
X – czas wykonania detalu.
43
P( X > 10) = 0,8 stąd
m − 10
σ
= 0,84
m − 12
P( X > 12) = 0,6
stąd σ = 0,25
Rozwiązując powyższy układ równań
otrzymamy m = 12,85; σ = 3,39.
 X −12,85 6 −12,85
 = P(Y < −2,02) =
P(X < 6) = P
<
3,39 
 3,39
= Φ(−2,02) =1−Φ(2,02) = 0,0217= 2,17%
44
Prawo trzech sigm
Jeśli X ma rozkład N(m, σ) to
P(m − σ < X < m + σ ) = 0,683 ,
P (m − 2σ < X < m + 2σ ) = 0,955 ,
P(m − 3σ < X < m + 3σ ) = 0,997
Ostatnia równość świadczy o tym, że chociaż
rozkład normalny ma gęstość różną od zera na
całej prostej to praktycznie niemal wszystkie
realizacje skupiają się w przedziale
( m − 3σ , m + 3σ )
własność tą nazywamy prawem trzech sigm.
45
Interpretacja graficzna parametrów
rozkładu N(m, σ)
46
Trzy rozkłady ciągłe, które mają duże
znaczenie w statystyce matematycznej:
– Rozkład chi kwadrat,
– Rozkład Studenta,
– Rozkład F – Snedecora
Rozkłady te są stablicowane.
47
Rozkład chi kwadrat (χ2) Yn
n – liczba stopni swobody
Yn = X 12 + .... + X n2
X1 , ..., Xn - niezależne, o rozkładzie N(0, 1)
EX = n;
D2X = 2n
48
Odczyt z tablicy dla rozkładu chi kwadrat.
(podobnie interpretujemy graficznie odczyt
z tablicy F – Snedecora.)
P (Yn ≥ k ) = α
49
Uwaga.
1) Dla n = 1, 2 wykres gęstości rozkładu chi kwadrat jest inny
(tylko część malejąca wykresu)
2) dla n > 30 stosujemy przybliżenie rozkładem normalnym.
2Yn ~ N ( 2n − 1;1)
50
Rozkład Studenta Tn
n – liczba stopni swobody
X
Tn =
Yn
X, Yn - niezależne
X o rozkładzie N(0, 1);
Yn o rozkładzie chi kwadrat z n stopniami swobody
EX = 0 ; dla n > 1
D2X = n/(n-2) dla n > 2
Uwaga.
Tn n→∞

→ N (0,1)
51
Odczyt z tablicy (tablica IV) dla rozkładu Studenta.
P ( Tn ≥ k ) = α
52