Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

Transkrypt

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A
Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A
Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz pierwszy, drugi i trzeci kwartyl rozkładu N (10, 52 ).
Rozwiązanie. Najpierw ogólny komentarz do WSZYSTKICH rozwiązań WSZYSTKICH kolokwiów (nie tylko z matematyki): Zadaniem Studenta jest przekonać Sprawdzającego, że Student
WIE, o czym pisze. W tym celu bardzo pomocne, powiem więcej, NIEZBĘDNE, są krótkie zdania
wyjaśniajace. Proszę sprawdzić poniżej, jak wyglądają takie zdania.
Teraz już rozwiązanie Zad. 1.: Pierwszy kwartyl rozkładu zmiennej X, to taka liczba q1 , dla
której P (X < q1 ) = 14 (jeden warunek wystarczy, bo rozpatrywany rozkład ma ciągłą i ściśle
rosnącą dystrybuantę). A ponieważ, gdy X ∼ N (10, 52 ), to X−10
∼ N (0, 1), więc
5
1
= P (X < q1 ) = P
4
X − 10
q1 − 10
q1 − 10
<
=P Z<
,
5
5
5
gdzie Z ∼ N (0, 1). Z tablic P (Z < 0, 674) = 34 , zatem P (Z < −0, 674) = 41 , skąd
q1 − 10
= −0, 674,
5
czyli q1 = 10 − 5 · 0, 674 = 6, 63.
Oczywiście z symetrii gęstości rozkładu względem prostej x = 10 mamy q2 = 10, a analogiczny
rachunek dla q3 daje
q3 = 10 + 5 · 0, 674 = 13, 37.
Opis najczęstszych błędów, jakie popełniali studenci rozwiązując to zadanie na drugim
kolokwium:
Najczęściej studenci nie mieli pojęcia, co to jest pierwszy (a zatem i inne) kwartyl i usiłowali
obliczyć P (Z < 14 ). Proszę chwilę zastanowić się nad definicją kwartyli (i mediany). Co ma być
równe 14 , 12 czy też 34 ? Oczywiście prawdopodobieństwo pewnego zdarzenia!
Za taki błąd w rozwiązaniu grozi komentarz KBZ (kompletny brak zrozumienia) i oczywiście
ZERO punktów. W II kolokwium było mnóstwo KBZ, ale nie wspomniałem o nich (poza dwoma)
przy ogłaszaniu wyników, bo nie miały one wpływu na zaliczenie (0-2 pkt z I kolokwium i KBZ z
II oznacza, że Student KOMPLETNIE NICZEGO nie umie).
Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce:
Y /X −1 0
1
−2 0, 2 0 0, 1
2
0, 2 0, 4 0, 1
Oblicz wariancje zmiennych X i Y i zbadaj, czy te zmienne są niezależne.
Rozwiązanie.
Liczę rozkłady brzegowe (oczywiście można je dopisać na brzegu tabelki, ale tu, dla Państwa
wygody, zapiszę je w oddzielnych tabelkach):
X
xi −1 0
1
,
pi 0, 4 0, 4 0, 2
Y
yi −2 2
,
pi 0, 3 0, 7
P
Wartość oczekiwaną liczymy ze wzoru E(X) = i xi pi natomiast na wariancję mamy dwa różne
P
wzory: V ar(X) = i (xi − E(X))2 pi lub V ar(X) = E(X 2 ) − (E(X))2 . Z tych wzorów
E(X) = (−1) · 0, 4 + 0 + 1 · 0, 2 = −0, 2,
E(Y ) = (−2) · 0, 3 + 2 · 0, 7 = 0, 8.
Wariancję łatwiej obliczyć, korzystając z drugiego wzoru:
E(X 2 ) = (−1)2 ·0, 4+0+(1)2 ·0, 2 = 1·0, 6 = 0, 6,
skąd V ar(X) = 0, 6−(−0, 2)2 = 0, 6−0, 04 = 0, 56.
Podobnie
E(Y 2 ) = (−2)2 · 0, 3 + (2)2 · 0, 7 = 4 · 1 = 4,
skąd
V ar(X) = 4 − (0, 8)2 = 4 − 0, 64 = 3, 36.
Zmienne X i Y są niezależne, gdy dla wszystkich par i, j zachodzi równość
(∗)
P ((X, Y ) = (xi , yj )) = P (X = xi ) · P (Y = yj ).
Jeśli więc nawet dla jednej pary taka równość nie jest spełniona, to zmienne są zależne.
Sprawdzamy:
P ((X, Y ) = (−1, −2)) = 0, 2,
natomiast
P (X = −1) · P (Y = −2) = 0, 4 · 0, 3 = 0, 12 6= 0, 2,
więc X i Y są zależne.
Opis najczęstszych błędów, jakie popełniali studenci rozwiązując to zadanie na drugim
kolokwium:
Najczęściej studenci nie potrafili zapisać warunku (∗). Pojawiały się napisy typu (cytuję) P (X, Y ) =
P (X)P (Y ), które nie mają sensu probabilistycznego. Aby pisać P (...) z sensem, w nawiasie musimy umieścić zdarzenie, zatem np. P (X = x1 ) lub P (Y > 3) itp. A co oznacza P (X)? Nie
definiowałem tego!
Wydaje mi się, że błąd pochodzi z pomieszania pojęć, bo w części prac pojawił sie warunek
E(X, Y ) = E(X)E(Y ), w którym lewa strona jest wektorem, jako wartość oczekiwana wektora
losowego, a prawa iloczynem dwóch liczb, czyli liczbą. Zatem ten warunek nie ma matematycznego
sensu! Wektor, zwłaszcza dwuwymiarowy, nie jest skalarem!
Jak uczyłem (wraz z dowodem podanym na wykładzie):
Gdy X i Y są niezależne i mają wartości oczekiwane, to E(X · Y ) = E(X)E(Y ), ale nie na odwrót,
więc tego warunku nie można przyjąć za defincję niezależności zmiennych (poza tym zmienne
mogą nie mieć wartości oczekiwanych).
Zatem napisy zacytowanego powyżej typu znów świadczą o KBZ ... W matematyce, jak i w innych
sprawach, diabeł zawsze siedzi w szczegółach!
Zad. 3. Mamy dodać 1200 liczb rzeczywistych, wybranych losowo i niezależnie. Każdą z nich zaokrąglamy najpierw do najbliższej całkowitej, popełniajac przy tym błąd o średniej zero i wariancji
1
, a potem dodajemy otrzymane liczby całkowite. Oszacuj prawdopodobieństwo zdarzenia: suma
12
zaokrągleń będzie różnić się od prawdziwej wartości sumy o więcej niż 20.
Wsk. Niech Xk oznacza błąd zaokrąglenia k−tej liczby. Zastosuj Centralne Twierdzenie Graniczne.
Rozwiązanie.
Zastosujmy się do wskazówki ←− To uwaga dla Państwa, tego nie trzeba pisać na kolokwium!
Niech Xk oznacza błąd zaokrąglenia k−tej liczby. Błąd sumy to suma błędów, więc musimy oszacować P (|X1 + .... + X1200 | > 20). UWAGA! Błąd może być dodatni lub ujemny! Niemal nikt
nie rozważał wartości bezwzględnej!
Na mocy CTG, gdy zmienne są niezależne i mają taki sam rozkład o skończonej wariancji (a więc
i wartości oczekiwanej), to dla dużych n mamy

P a <
X1 + ... + Xn − n · E(X1 )
q
U nas E(Xk ) = 0, a V ar(Xk ) =
1
,
12
n · V ar(X1 )

< b ≈ Φ(b) − Φ(a).
więc w naszym zadaniu
P (|X1 + .... + X1200 | > 20) =
P (X1 + .... + X1200 < −20) + P (X1 + .... + X1200 > 20) = 2P (X1 + .... + X1200 > 20) =

2P
X + ... + X1200 − 0
 1
q
1200 ·
1
12

20 − 0 
> √
≈ 2(1 − Φ(2)) = 2 · 0, 023 = 0, 046.
100
Najczęstsze błędy w tym zadaniu omówiłem powyżej.
Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1):
t
0
0, 5 0, 674
1
1, 5
2
2, 5
3
3, 5
4
Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997
Zestaw B miał zadania bardzo podobne do A, więc ich nie omawiam szczegółowo. Tylko w wielkim
skrócie:
Zad. 1. Zmienna X ma rozkład normalny N (6, 32 ). Korzystając z podanych poniżej mini-tablic,
oblicz: P (X > 0), P (−3 < X ¬ 3) oraz znajdź takie a, dla którego P (X > a) = 34 .
Komentarz: Tu trzeba skorzystać z własności: gdy X ∼ N (m, σ 2 ), to
X−m
σ
∼ N (0, 1).
Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce:
Y /X
−2
0
1
−2 2
0, 1 0, 3
0, 1 0, 1
0, 3 0, 1
Oblicz wariancje zmiennych X i Y i zbadaj, czy te zmienne są niezależne.
Komentarz: Dokładnie jak w zestawie A.
Zad. 3. Czas pracy (do chwili stępienia) noża pewnej obrabiarki ma rozkład o średniej 15 h i
wariancji 4 h2 . Gdy taki nóż stępi się, natychmiast jest zastępowany nowym i obrabiarka pracuje
dalej. Fabryka ma w zapasie łącznie 100 takich noży. Oszacuj prawdopodobieństwo zdarzenia: z
tym zapasem noży obrabiarka będzie pracować co najwyżej 1550 godzin.
Wskazówka: Niech Xk oznacza czas pracy noża numer k. Zastosuj Centralne Twierdzenie Graniczne.
Komentarz:
Początek dokładnie, jak w zestawie A, tyle że w tym przypadku m = E(X
q
q k ) = 15, a
σ = V ar(X) = 2 (a nie 4, jak pisało wiele osób!) W CTG w mianowniku mamy albo n · V ar(X)
√
√
√
albo σ n, co jest tym samym, ale nie wolno pisać ani n · σ, ani nV ar(X).
Potem
P (X1 + ... + X100 ¬ 1550) =
=P
X1 + ... + X100 − 15 · 100
1550 − 1500
√
√
¬
100 · 4
400
!
≈ Φ(2, 5) = 0, 994.
Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1):
t
0
0, 5 0, 674
1
1, 5
2
2, 5
3
3, 5
4
Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997
Zestaw C
Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz
a) trzeci kwartyl rozkładu N (1, 22 ); b) P (X ¬ 6), gdy X ma rozkład N (3, 1).
Rozwiązanie: Jak w zestawie A.
Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce:
Y /X −3 −1
1
3
0
0, 2 0, 2 0, 2 0, 2
1
0, 02 0, 04 0, 06 0, 08
a) Oblicz E(X) i V ar(X).
Rozwiązanie: Jak w zestawie A.
b) Wykaż, że zmienne X i Y są zależne, a następnie opisz taki sposób wypełnienia tabelki prawdopodobieństw, aby wektor (X, Y ) nie zmienił swoich rozkładów brzegowych, ale aby zmienne X
i Y były niezależne.
Rozwiązanie: Musi być spełniony warunek (∗) z zad. 2 zestaw A, więc pij = pi · pj . Na przykład
P ((X, Y ) = (−3, 1)) = P (X = −3)P (X = 1) = 0, 22 · 0, 8, analogicznie tworzymy wszystkie inne
liczby z tabelki.
Zad. 3. Oblicz wartość oczekiwaną liczby sukcesów w 4800 próbach Bernoulliego z parametrem
p = 41 .
Korzystając z twierdzenia de Moivre’a – Laplace’a oszacuj prawdopodobieństwo zdarzenia:
w 4800 próbach Bernoulliego z parametrem p = 1/4 liczba sukcesów odchyli się od wartości oczekiwanej o mniej niż 90.
Rozwiązanie: Tw. de Moivre’a–Laplace’a

Sn − np
P a < q
np(1 − p)

< b ≈ Φ(b) − Φ(a).
q
q
A tym zdaniu E(Sn ) = np = 4800 · 41 = 1200, natomiast np(1 − p) = 4800 · 41 ·
Stąd
P (|S4800 − 1200| < 90) = P (−90 < S4800 − 1200 < 90) =
S4800 − 1200
90
90
√
P − <
<
30
30
900
3
4
=
√
900 = 30.
!
≈ Φ(3) − Φ(−3) ≈ 0, 997.
Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1):
t
0
0, 5 0, 674
1
1, 5
2
2, 5
3
3, 5
4
Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997
Zestaw D analogiczny do zestawu C, więc podaję tylko końcowe obliczenie w zadaniu 3.
Zad. 1. Korzystając z podanych poniżej
mini-tablic, oblicz
√
a) pierwszy kwartyl rozkładu N (2, ( 3)2 ); b) P (2 < X < 10), gdy X ma rozkład N (8, 22 ).
Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce:
Y /X −3 −1
1
3
0
0, 1 0, 3 0, 3 0, 1
1
0, 05 0, 05 0, 05 0, 05
a) Oblicz E(X) i V ar(X).
b) Wykaż, że zmienne X i Y są zależne, a następnie opisz taki sposób wypełnienia tabelki prawdopodobieństw, aby wektor (X, Y ) nie zmienił swoich rozkładów brzegowych, ale aby zmienne X
i Y były niezależne.
Zad. 3. Oblicz wartość oczekiwaną liczby sukcesów w 1800 prób Bernoulliego z parametrem p = 23 .
Korzystając z twierdzenia de Moivre’a – Laplace’a oszacuj prawdopodobieństwo zdarzenia:
w 1800 próbach Bernoulliego z parametrem p = 32 liczba sukcesów będzie zawarta w przedziale
(wartość średnia−60, wartość średnia+40).
Rzowiązanie:
Jak w zestawie C, ale tutaj n = 1800, p = 32 , więc E(S1800 ) = np = 1800 · 32 = 1200
q
√
oraz np(1 − p) = 400 = 20. I dalej
P (1200 − 60 < S1800 < 1200 + 40) = P (−60 < S1800 − 1200 < 40) =
P
−60
S4800 − 1200
40
√
<
<
20
20
400
!
≈ Φ(2) − Φ(−3) ≈ 0, 977 − (1 − 0, 9986).
Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1):
t
0
0, 5 0, 674
1
1, 5
2
2, 5
3
3, 5
4
Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997