STATYSTYKA

Transkrypt

STATYSTYKA
STATYSTYKA
Rafał Kucharski
Uniwersytet Ekonomiczny w Katowicach 2015/16
ROND, Finanse i Rachunkowość, rok 2
Wybrane litery alfabetu greckiego
Γ
∆
Θ
Λ
α
β
γ
δ
, ε
η
θ
κ
λ
µ
alfa
beta
gamma
delta
epsilon
eta
theta
kappa
lambda
mi
Φ
Ψ
Ω
ν
ξ
π
ρ, %
σ
τ
φ, ϕ
χ
ψ
ω
ni
ksi
pi
ro
sigma
tau
fi
chi
psi
omega
Oznaczenia
N – zbiór liczb naturalnych: 0, 1, 2, 3, . . .
R – zbiór liczb rzeczywistych: (−∞, ∞)
∧ – iloczyn logiczny, koniunkcja, „i”
∨ – suma logiczna, alternatywa, „lub”
⇒ – implikacja, wynikanie, p ⇒ q – jeśli p, to q
⇐⇒ – równoważność, „wtedy i tylko wtedy”
¬ – negacja, zaprzeczenie, „nie”
n
X
i=1
n
Y
i=1
ai := a1 + a2 + · · · + an
ai := a1 · a2 · · · an
Operacje mnogościowe (na zbiorach)
∈ – „należy do”, np. x ∈ A
6∈ – „nie należy do”, np. x 6∈ A
∅ – zbiór pusty
A ∩ B – iloczyn (część wspólna, przekrój) zbiorów A i B:
A
B
x ∈ A ∩ B ⇐⇒ x ∈ A ∧ x ∈ B
A ∪ B – suma zbiorów A i B:
A
B
x ∈ A ∪ B ⇐⇒ x ∈ A ∨ x ∈ B
A \ B – różnica zbiorów A i B:
A
B
x ∈ A \ B ⇐⇒ x ∈ A ∧ x 6∈ B
Operacje mnogościowe c.d.
n
[
i=1
n
\
Ai := A1 ∪ A2 ∪ · · · ∪ An
Ai := A1 ∩ A2 ∩ · · · ∩ An
i=1
A
A ⊂ B – A jest podzbiorem B,
B zawiera A,
A zawiera się w B:
B
A ⊂ B ⇐⇒ (x ∈ A ⇒ x ∈ B)
A
B
A ∩ B = ∅ – zbiory A i B są rozłączne
2A , P(A) – rodzina wszystkich podzbiorów zbioru A, potęga zbioru A
Prawa de Morgana
I
W logice:
¬(p ∧ q) ⇐⇒ (¬p ∨ ¬q)
¬(p ∨ q) ⇐⇒ (¬p ∧ ¬q)
I
Dla zbiorów A, B ⊂ Ω:
Ω \ (A ∩ B) = (Ω \ A) ∪ (Ω \ B),
Ω \ (A ∪ B) = (Ω \ A) ∩ (Ω \ B).
I
Dla ciągów zbiorów A1 , A2 , . . . ⊂ Ω:
Ω\
\
i
Ai =
[
i
(Ω \ Ai ),
Ω\
[
i
Ai =
\
i
(Ω \ Ai ).
a
Przestrzeń probabilistyczna: (Ω, F, P)
ω – zdarzenie elementarne
Ω – zbiór (wszystkich) zdarzeń elementarnych, przestrzeń
zdarzeń elementarnych
A ⊂ Ω, A ∈ F – zdarzenie losowe
F – σ-ciało zdarzeń: rodzina podzbiorów Ω „zamknięta” na
„przeliczalne” operacje mnogościowe:
I Ω∈F
I A, B ∈ F ⇒ A \ B ∈ F
S
I A1 , A2 , · · · ∈ F ⇒ ∞ Ai ∈ F
i=1
P – prawdopodobieństwo, miara probabilistyczna
„przeliczalnie addytywna, nieujemna miara unormowana”:
I P : F → [0, 1], P(Ω) = 1
I Jeżeli A1 , A2 , · · · ∈ F, jest ciągiem zdarzeń parami
rozłącznych: Ai ∩ Aj = ∅ dla i 6= j, to
(Kołmogorow, 1933)
P
∞
[
i=1
!
Ai
=
∞
X
i=1
P(Ai )
Przykład (Rzut monetą)
I
,
Ω=
I
,
,
,
F = ∅,
,
= p, P
,
= 1 − p, P(Ω) = 1.
I
P(∅) = 0, P
I
p ∈ [0, 1], a monetę nazywamy „sprawiedliwą”, jeśli p = 0.5.
Przykład (Rzut kością do gry)
I
q q qq qq q
Ω = { q , q, qq, q q, qqq, q q}, F = 2Ω (26 = 64 podzbiory),
1
q
q
qq
qq
qq
P({ q }) = P({ q}) = P({ qq}) = P({ q q}) = P({ qqq}) = P({ q q}) = .
6
Klasyczna definicja prawdopodobieństwa
I
Jeśli zbiór Ω jest przeliczalny: Ω = {ω1 , ω2 , . . . }, F = 2Ω , to
P(A) =
X
pi ,
gdzie
pi = P({ωi }).
i∈A
I
Jeśli zbiór Ω jest skończony: Ω = {ω1 , ω2 , . . . , ωn }, F = 2Ω , oraz
wszystkie zdarzenia elementarne są jednakowo prawdopodobne, to
P(A) =
#A
,
#Ω
gdzie #A oznacza liczbę elementów zbioru A
(liczba zdarzeń elementarnych sprzyjających zdarzeniu A).
Elementy kombinatoryki – zasada mnożenia
I
Zasada mnożenia: jeśli #A1 = n1 , #A2 = n2 , . . . , #Ak = nk , to
#(A1 × · · · × Ak ) = n1 · n2 · . . . · nk ,
gdzie A1 × · · · × Ak = {(x1 , . . . , xk ) : x1 ∈ A1 , . . . , xk ∈ Ak }.
Przykład
Mamy do dyspozycji 3 rodzaje wafli, 8 smaków lodów oraz 5 sosów. Ile
różnych zestawów można stworzyć, jeśli każdy zestaw ma składać się z
jednego wafla, jednej porcji lodów oraz jednego sosu.
Rozwiązanie
Mamy #A1 = 3, #A2 = 8, #A3 = 5, więc różnych zestawów jest
#(A1 × A2 × A3 ) = 3 · 8 · 5 = 120.
Elementy kombinatoryki – wariacje z powtórzeniami
I
I
I
k-wyrazową wariacją z powtórzeniami zbioru Y nazywamy każdą
funkcję f : {1, 2, . . . , k} → Y .
Wariację z powtórzeniami z n elementów po k można interpretować
jako próbę k-elementową pobraną ze zwracaniem z populacji
n-elementowej.
Liczba wszystkich różnych k-elementowych wariacji z
powtórzeniami zbioru n-elementowego jest równa
V̄nk = nk ,
I
I
n ­ 1, k ­ 0.
Każda funkcja f określona na zbiorze {1, 2, . . . , k} wyznacza
jednoznacznie ciąg (f (1), f (2), . . . , f (k)), i na odwrót: każdy
k-wyrazowy ciąg elementów zbioru Y wyznacza pewną funkcję
f : {1, 2, . . . , k} → Y . Zamiast o funkcjach możemy zatem mówić o
ciągach.
Wariacje uznajemy za różne, jeśli różne są odpowiednie funkcje,
zatem np. wariacje z powtórzeniami aab i aba są różne.
Elementy kombinatoryki – wariacje bez powtórzeń
I
k-wyrazową wariacją bez powtórzeń zbioru Y złożonego z n
elementów, gdzie 0 ¬ k ¬ n, nazywamy każdą funkcję
różnowartościową f : {1, 2, . . . , k} → Y .
I
Wariację bez powtórzeń z n elementów po k można interpretować
jako próbę k-elementową pobraną bez zwracania z populacji
n-elementowej.
I
Liczba wszystkich różnych k-elementowych wariacji bez powtórzeń
zbioru n-elementowego jest równa
Vnk = n · (n − 1) · . . . · (n − k + 1) =
n!
,
(n − k)!
0 ¬ k ¬ n.
n! = (n − 1)! · n = 1 · 2 · . . . · n.
I
Przypomnienie: 0! = 1,
I
Wariacje uznajemy za różne, jeśli różne są odpowiednie funkcje,
zatem np. wariacje bez powtórzeń: ab i ba sa różnymi wariacjami.
Elementy kombinatoryki c.d.
Przykład
W 10-piętrowym budynku windą jedzie 7 osób. Jaka jest szansa, że
każda wysiądzie na innym piętrze?
Rozwiązanie
Zdarzeniami elementarnymi są wszystkie 7-elementowe ciągi o
wyrazach ze zbioru 10-elementowego. Zdarzenia sprzyjające to ciągi o
różnych wyrazach. Zatem szukane prawdopodobieństwo wynosi:
7
V10
=
7
V̄10
10!
(10−7)!
107
=
10 · 9 · 8 · 7 · 6 · 5 · 4
= 0.06048.
107
Elementy kombinatoryki – permutacje, kombinacje
I
Permutacją bez powtórzeń (permutacją) n-elementowego zbioru Y
nazywamy każdą funkcję f odwzorowującą zbiór {1, 2, . . . , n} na
zbiór Y .
I
Liczba permutacji zbioru n-elementowego jest równa
Pn = n!,
n ­ 0.
I
k-elementową kombinacją (bez powtórzeń) zbioru Y , złożonego z n
elementów, nazywamy dowolny k-elementowy podzbiór zbioru Y .
I
Liczba k-elementowych kombinacji zbioru n-elementowego jest
równa
!
n!
n
Cnk =
=
,
0 ¬ k ¬ n,
k
k!(n − k)!
(symbol Newtona, współczynnik dwumianowy).
Elementy kombinatoryki
Przykład
Z talii 24 kart wybieramy 5. Jakie jest prawdopodobieństwo, że
otrzymamy dokładnie dwie pary (nie fulla i nie karetę)?
Rozwiązanie
Wszystkich możliwych wyborów kart jest 24
5 . Obliczamy ilość zdarzeń
sprzyjających.
Wybieramy
dwie
wartości
kart
spośród sześciu (np. as i
6
król) na 2 sposobów. Z czterech kart o danej wartości wybieramy dwa
kolory, co dla każdej wartości robimy na 42 sposobów. Piątą kartę
wybieramy dowolnie z pozostałych 16 kart. Ostateczne
prawdopodobieństwo wynosi:
6
2
·
4
4
2 · 2
24
5
· 16
6·5 4·3 4·3
2·3·4·5
·
·
· 16 ·
=
2
2
2
24 · 23 · 22 · 21 · 20
9·8·5
360
=
=
= 0.203275.
23 · 11 · 7
1771
=
Własności prawdopodobieństwa
I
A
Jeśli A i B wykluczają się (są rozłączne):
B
A∩B =∅
I
⇒
P(A ∪ B) = P(A) + P(B)
(Addytywność) Dla A1 , A2 , . . . , An , parami rozłącznych:
(i 6= j ⇒ Ai ∩ Aj = ∅)
=⇒
P
n
[
!
Ai
i=1
I
=
n
X
P(Ai )
i=1
Dla dowolnych zbiorów mamy
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
A\B
A∪B
=
B \A
A∩B
+
+
A
=
B
+
A∩B
−
Wzór włączeń i wyłączeń
I
Dla trzech zbiorów mamy
P(A ∪ B ∪ C ) = P(A) + P(B) + P(C )−
− P(A ∩ B) − P(A ∩ C ) − P(B ∩ C )+
+ P(A ∩ B ∩ C ).
+
++−
++−
+++
−−−
+
+
I
++−
+
Dla n ∈ N zdarzeń prawdziwy jest wzór
P(A1 ∪ · · · ∪ An ) =
X
1¬i¬n
+
X
P(Ai ) −
X
P(Ai1 ∩ Ai2 )+
1¬i1 ¬i2 ¬n
P(Ai1 ∩ Ai2 ∩ Ai3 ) + · · · + (−1)n+1 P(A1 ∩ · · · ∩ An ).
1¬i1 ¬i2 ¬i3 ¬n
Własności prawdopodobieństwa, c.d.
Ω
I
I
Zdarzenie pewne:
P(Ω) = 1
I
Zdarzenie niemożliwe:
P(∅) = 0
Jeśli A ⊂ B, to P(B \ A) = P(B) − P(A).
B \A
=
B
−
A
A ∩ (B \ A) = ∅, B = A ∪ (B \ A), więc P(B) = P(A) + P(B \ A)
I
Jeśli A ⊂ B, to P(A) ¬ P(B). Dla każdego A, 0 ¬ P(A) ¬ 1.
I
A0
A
Zdarzenie przeciwne do A:
A0 = A := Ω \ A
P(A0 ) = P(Ω \ A) = P(Ω) − P(A) = 1 − P(A)
Prawdopodobieństwo warunkowe, niezależność zdarzeń
I
Jeśli P(B) > 0, to prawdopodobieństwem warunkowym zdarzenia A
pod warunkiem (zajścia) zdarzenia B nazywamy liczbę
P(A|B) =
P(A ∩ B)
.
P(B)
I
Zauważmy, że P(A ∩ B) = P(A|B) · P(B).
I
Zdarzenia A i B nazywamy niezależnymi, jeżeli
P(A ∩ B) = P(A) · P(B).
I
Jeśli zdarzenia A i B są niezależne oraz P(B) > 0, to
P(A|B) = P(A).
Prawdopodobieństwo warunkowe, c.d.
Przykład
Wybieramy jedną rodzinę spośród rodzin z dwojgiem dzieci. Obliczyć
prawdopodobieństwo zdarzenia, że wybierzemy rodzinę z dwoma
chłopcami, jeśli wiemy, że w tej rodzinie: a) starsze dziecko jest
chłopcem, b) jest co najmniej jeden chłopiec?
Rozwiązanie
Ω = {(c, c), (d, d), (c, d), (d, c)} jest zbiorem równo prawdopodobnych
par, gdzie pierwszy element oznacza płać młodszego dziecka, drugi –
starszego.
1
4
1
2
1
= ,
2
W punkcie a)
P({(c, c)}|{(c, c), (d, c)}) =
w punkcie b)
P({(c, c)}|{(c, c), (d, c), (c, d)}) =
1
4
3
4
1
= .
3
Niezależność zadarzeń, c.d.
I
Zdarzenia A1 , . . . , An nazywamy niezależnymi (zespołowo), jeżeli
P(Ai1 ∩ Ai2 ∩ · · · ∩ Aik ) = P(Ai1 )P(Ai2 ) . . . P(Aik )
dla wszystkich ciągów 1 ¬ i1 < i2 < · · · < ik ¬ n, k = 2, 3, . . . , n.
I
Uwaga: w powyższej definicji należy sprawdzić 2n − n − 1 równości!
I
Jeśli A1 , . . . , An są niezależne, to niezależne są również zdarzenia
B1 , . . . , Bn , gdzie Bi = Ai lub Bi = A0i , i = 1, . . . , n.
I
Zastosowanie: gdy A1 , . . . , An są zdarzeniami niezależnymi, to
P
[
n
Ai
=1−P
i=1
n
[
Ai
0
!
=1−P
i=1
=1−
n
Y
i=1
P(A0i ) = 1 −
n
\
A0i =
i=1
n
Y
i=1
(1 − P(Ai )) .
Wzór na prawdopodobieństwo całkowite
I
Jeśli zbiory B1 , . . . , Bn stanowią rozbicie zbioru Ω, to znaczy zbiory
te są parami rozłączne oraz Ω = B1 ∪ · · · ∪ Bn (zupełny układ
zdarzeń), to dla dowolnego zdarzenia A zachodzi równość
P(A) =
n
X
P(A|Bi ) · P(Bi ).
i=1
I
Uzasadnienie:
P(A) = P(A ∩ (B1 ∪ · · · ∪ Bn )) =
= P((A ∩ B1 ) ∪ · · · ∪ (A ∩ Bn )) =
= P(A ∩ B1 ) + · · · + P(A ∩ Bn ) =
= P(A|B1 )P(B1 ) + · · · + P(A|Bn )P(Bn ).
I
Przypadek n = 2: jeśli Ω = B1 ∪ B2 , B1 ∩ B2 = ∅, to
P(A) = P(A|B1 ) · P(B1 ) + P(A|B2 ) · P(B2 ).
Wzór na prawdopodobieństwo całkowite
Przykład
Mamy dwie urny. Pierwsza urna zawiera 2 kule białe i 8 kul czarnych.
Druga urna zawiera 8 kul białych i 2 kule czarne. Rzucamy kością do
gry i jeśli wypadnie 6 oczek, to losujemy kulę z urny pierwszej, a w
przeciwnym przypadku losujemy kulę z urny drugiej. Jakie jest
prawdopodobieństwo, że wylosowana kula jest biała?
Rozwiązanie
I
A – wylosowanie kuli białej
I
B1 – wypadło 6 oczek – losujemy z urny pierwszej
I
B2 – wypadła 5 lub mniej oczek – losujemy z urny drugiej
Mamy P(B1 ) = 61 , P(B2 ) = 56 , P(A|B1 ) =
2
10 ,
P(A) = P(A|B1 )P(B1 ) + P(A|B2 )P(B2 ) =
P(A|B2 ) =
8
10 ,
zatem
2 1
8 5
42
7
· +
· =
= .
10 6 10 6
60
10
Wzór Bayesa
I
Jeśli zbiory B1 , . . . , Bn stanowią rozbicie zbioru Ω oraz P(A) > 0,
to dla dowolnego j ∈ {1, . . . , n} mamy
P(Bj |A) =
P(A|Bj ) · P(Bj )
P(A|Bj ) · P(Bj )
= Pn
.
P(A)
i=1 P(A|Bi ) · P(Bi )
I
P(Bj ) nazywamy prawdopodobieństwami a priori
(z góry, z założenia, przed doświadczeniem),
I
P(Bj |A) nazywamy prawdopodobieństwami a posteriori
(po fakcie, po doświadczeniu).
Wzór Bayesa
Przykład
Mamy dwie urny. Pierwsza urna zawiera 2 kule białe i 8 kul czarnych.
Druga urna zawiera 8 kul białych i 2 kule czarne. Z „wybranej losowo”
urny wyciągamy kulę. Jakie jest prawdopodobieństwo, że losowaliśmy z
urny pierwszej, jeżeli wylosowana kula jest biała?
Rozwiązanie
I
A – wylosowanie kuli białej
I
B1 – losujemy z urny pierwszej, B2 – losujemy z urny drugiej
Mamy P(B1 ) =
P(B1 |A) =
1
2
= P(B2 ), P(A|B1 ) =
2
10 ,
P(A|B2 ) =
P(A|B1 )P(B1 )
=
P(A|B1 )P(B1 ) + P(A|B2 )P(B2 )
2
10
·
8
10 ,
2
10 ·
1
2 +
1
2
8
10
zatem
·
1
2
=
2
1
= .
10
5
Prawdopodobieństwo geometryczne
I
Jeśli na zbiorze Ω określona jest skończona miara µ (np. długość,
pole), to możemy określić prawdopodobieństwo wzorem:
P(A) =
µ(A)
.
µ(Ω)
Przykład
Ania i Basia umówiły się na spotkanie między 12.00 a 13.00. Osoba
która dojedzie na miejsce spotkania jako pierwsza, ma czekać na drugą
przez 20 minut, ale nie dłużej niż do 13.00. Jaka jest szansa, że dojdzie
do spotkania?
Prawdopodobieństwo geometryczne, c.d.
Rozwiązanie
I
Ω = [0, 1] × [0, 1], gdzie ω = (tA , tB ),
I
tA , tB ∈ [0, 1] oznaczają odpowiednio czas przybycia Ani i Basi,
liczony od 12:00, w godzinach,
I
Przyjmujemy jako miarę µ pole powierzchni, skąd
P(A) =
µ(A)
= µ(A).
µ(Ω)
I
Do spotkania dochodzi w zbiorze
A = {(t1 , t2 ) ∈ [0, 1] × [0, 1] : |t1 − t2 | ¬ 13 }.
I
Szukane prawdopodobieństwo wynosi
P(A) = 1 − 2 ·
1 2 2
· ·
2 3 3
=1−
4
5
= .
9
9