Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A
Transkrypt
Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A
Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz pierwszy, drugi i trzeci kwartyl rozkładu N (10, 52 ). Rozwiązanie. Najpierw ogólny komentarz do WSZYSTKICH rozwiązań WSZYSTKICH kolokwiów (nie tylko z matematyki): Zadaniem Studenta jest przekonać Sprawdzającego, że Student WIE, o czym pisze. W tym celu bardzo pomocne, powiem więcej, NIEZBĘDNE, są krótkie zdania wyjaśniajace. Proszę sprawdzić poniżej, jak wyglądają takie zdania. Teraz już rozwiązanie Zad. 1.: Pierwszy kwartyl rozkładu zmiennej X, to taka liczba q1 , dla której P (X < q1 ) = 14 (jeden warunek wystarczy, bo rozpatrywany rozkład ma ciągłą i ściśle rosnącą dystrybuantę). A ponieważ, gdy X ∼ N (10, 52 ), to X−10 ∼ N (0, 1), więc 5 1 = P (X < q1 ) = P 4 X − 10 q1 − 10 q1 − 10 < =P Z< , 5 5 5 gdzie Z ∼ N (0, 1). Z tablic P (Z < 0, 674) = 34 , zatem P (Z < −0, 674) = 41 , skąd q1 − 10 = −0, 674, 5 czyli q1 = 10 − 5 · 0, 674 = 6, 63. Oczywiście z symetrii gęstości rozkładu względem prostej x = 10 mamy q2 = 10, a analogiczny rachunek dla q3 daje q3 = 10 + 5 · 0, 674 = 13, 37. Opis najczęstszych błędów, jakie popełniali studenci rozwiązując to zadanie na drugim kolokwium: Najczęściej studenci nie mieli pojęcia, co to jest pierwszy (a zatem i inne) kwartyl i usiłowali obliczyć P (Z < 14 ). Proszę chwilę zastanowić się nad definicją kwartyli (i mediany). Co ma być równe 14 , 12 czy też 34 ? Oczywiście prawdopodobieństwo pewnego zdarzenia! Za taki błąd w rozwiązaniu grozi komentarz KBZ (kompletny brak zrozumienia) i oczywiście ZERO punktów. W II kolokwium było mnóstwo KBZ, ale nie wspomniałem o nich (poza dwoma) przy ogłaszaniu wyników, bo nie miały one wpływu na zaliczenie (0-2 pkt z I kolokwium i KBZ z II oznacza, że Student KOMPLETNIE NICZEGO nie umie). Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce: Y /X −1 0 1 −2 0, 2 0 0, 1 2 0, 2 0, 4 0, 1 Oblicz wariancje zmiennych X i Y i zbadaj, czy te zmienne są niezależne. Rozwiązanie. Liczę rozkłady brzegowe (oczywiście można je dopisać na brzegu tabelki, ale tu, dla Państwa wygody, zapiszę je w oddzielnych tabelkach): X xi −1 0 1 , pi 0, 4 0, 4 0, 2 Y yi −2 2 , pi 0, 3 0, 7 P Wartość oczekiwaną liczymy ze wzoru E(X) = i xi pi natomiast na wariancję mamy dwa różne P wzory: V ar(X) = i (xi − E(X))2 pi lub V ar(X) = E(X 2 ) − (E(X))2 . Z tych wzorów E(X) = (−1) · 0, 4 + 0 + 1 · 0, 2 = −0, 2, E(Y ) = (−2) · 0, 3 + 2 · 0, 7 = 0, 8. Wariancję łatwiej obliczyć, korzystając z drugiego wzoru: E(X 2 ) = (−1)2 ·0, 4+0+(1)2 ·0, 2 = 1·0, 6 = 0, 6, skąd V ar(X) = 0, 6−(−0, 2)2 = 0, 6−0, 04 = 0, 56. Podobnie E(Y 2 ) = (−2)2 · 0, 3 + (2)2 · 0, 7 = 4 · 1 = 4, skąd V ar(X) = 4 − (0, 8)2 = 4 − 0, 64 = 3, 36. Zmienne X i Y są niezależne, gdy dla wszystkich par i, j zachodzi równość (∗) P ((X, Y ) = (xi , yj )) = P (X = xi ) · P (Y = yj ). Jeśli więc nawet dla jednej pary taka równość nie jest spełniona, to zmienne są zależne. Sprawdzamy: P ((X, Y ) = (−1, −2)) = 0, 2, natomiast P (X = −1) · P (Y = −2) = 0, 4 · 0, 3 = 0, 12 6= 0, 2, więc X i Y są zależne. Opis najczęstszych błędów, jakie popełniali studenci rozwiązując to zadanie na drugim kolokwium: Najczęściej studenci nie potrafili zapisać warunku (∗). Pojawiały się napisy typu (cytuję) P (X, Y ) = P (X)P (Y ), które nie mają sensu probabilistycznego. Aby pisać P (...) z sensem, w nawiasie musimy umieścić zdarzenie, zatem np. P (X = x1 ) lub P (Y > 3) itp. A co oznacza P (X)? Nie definiowałem tego! Wydaje mi się, że błąd pochodzi z pomieszania pojęć, bo w części prac pojawił sie warunek E(X, Y ) = E(X)E(Y ), w którym lewa strona jest wektorem, jako wartość oczekiwana wektora losowego, a prawa iloczynem dwóch liczb, czyli liczbą. Zatem ten warunek nie ma matematycznego sensu! Wektor, zwłaszcza dwuwymiarowy, nie jest skalarem! Jak uczyłem (wraz z dowodem podanym na wykładzie): Gdy X i Y są niezależne i mają wartości oczekiwane, to E(X · Y ) = E(X)E(Y ), ale nie na odwrót, więc tego warunku nie można przyjąć za defincję niezależności zmiennych (poza tym zmienne mogą nie mieć wartości oczekiwanych). Zatem napisy zacytowanego powyżej typu znów świadczą o KBZ ... W matematyce, jak i w innych sprawach, diabeł zawsze siedzi w szczegółach! Zad. 3. Mamy dodać 1200 liczb rzeczywistych, wybranych losowo i niezależnie. Każdą z nich zaokrąglamy najpierw do najbliższej całkowitej, popełniajac przy tym błąd o średniej zero i wariancji 1 , a potem dodajemy otrzymane liczby całkowite. Oszacuj prawdopodobieństwo zdarzenia: suma 12 zaokrągleń będzie różnić się od prawdziwej wartości sumy o więcej niż 20. Wsk. Niech Xk oznacza błąd zaokrąglenia k−tej liczby. Zastosuj Centralne Twierdzenie Graniczne. Rozwiązanie. Zastosujmy się do wskazówki ←− To uwaga dla Państwa, tego nie trzeba pisać na kolokwium! Niech Xk oznacza błąd zaokrąglenia k−tej liczby. Błąd sumy to suma błędów, więc musimy oszacować P (|X1 + .... + X1200 | > 20). UWAGA! Błąd może być dodatni lub ujemny! Niemal nikt nie rozważał wartości bezwzględnej! Na mocy CTG, gdy zmienne są niezależne i mają taki sam rozkład o skończonej wariancji (a więc i wartości oczekiwanej), to dla dużych n mamy P a < X1 + ... + Xn − n · E(X1 ) q U nas E(Xk ) = 0, a V ar(Xk ) = 1 , 12 n · V ar(X1 ) < b ≈ Φ(b) − Φ(a). więc w naszym zadaniu P (|X1 + .... + X1200 | > 20) = P (X1 + .... + X1200 < −20) + P (X1 + .... + X1200 > 20) = 2P (X1 + .... + X1200 > 20) = 2P X + ... + X1200 − 0 1 q 1200 · 1 12 20 − 0 > √ ≈ 2(1 − Φ(2)) = 2 · 0, 023 = 0, 046. 100 Najczęstsze błędy w tym zadaniu omówiłem powyżej. Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1): t 0 0, 5 0, 674 1 1, 5 2 2, 5 3 3, 5 4 Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997 Zestaw B miał zadania bardzo podobne do A, więc ich nie omawiam szczegółowo. Tylko w wielkim skrócie: Zad. 1. Zmienna X ma rozkład normalny N (6, 32 ). Korzystając z podanych poniżej mini-tablic, oblicz: P (X > 0), P (−3 < X ¬ 3) oraz znajdź takie a, dla którego P (X > a) = 34 . Komentarz: Tu trzeba skorzystać z własności: gdy X ∼ N (m, σ 2 ), to X−m σ ∼ N (0, 1). Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce: Y /X −2 0 1 −2 2 0, 1 0, 3 0, 1 0, 1 0, 3 0, 1 Oblicz wariancje zmiennych X i Y i zbadaj, czy te zmienne są niezależne. Komentarz: Dokładnie jak w zestawie A. Zad. 3. Czas pracy (do chwili stępienia) noża pewnej obrabiarki ma rozkład o średniej 15 h i wariancji 4 h2 . Gdy taki nóż stępi się, natychmiast jest zastępowany nowym i obrabiarka pracuje dalej. Fabryka ma w zapasie łącznie 100 takich noży. Oszacuj prawdopodobieństwo zdarzenia: z tym zapasem noży obrabiarka będzie pracować co najwyżej 1550 godzin. Wskazówka: Niech Xk oznacza czas pracy noża numer k. Zastosuj Centralne Twierdzenie Graniczne. Komentarz: Początek dokładnie, jak w zestawie A, tyle że w tym przypadku m = E(X q q k ) = 15, a σ = V ar(X) = 2 (a nie 4, jak pisało wiele osób!) W CTG w mianowniku mamy albo n · V ar(X) √ √ √ albo σ n, co jest tym samym, ale nie wolno pisać ani n · σ, ani nV ar(X). Potem P (X1 + ... + X100 ¬ 1550) = =P X1 + ... + X100 − 15 · 100 1550 − 1500 √ √ ¬ 100 · 4 400 ! ≈ Φ(2, 5) = 0, 994. Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1): t 0 0, 5 0, 674 1 1, 5 2 2, 5 3 3, 5 4 Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997 Zestaw C Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz a) trzeci kwartyl rozkładu N (1, 22 ); b) P (X ¬ 6), gdy X ma rozkład N (3, 1). Rozwiązanie: Jak w zestawie A. Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce: Y /X −3 −1 1 3 0 0, 2 0, 2 0, 2 0, 2 1 0, 02 0, 04 0, 06 0, 08 a) Oblicz E(X) i V ar(X). Rozwiązanie: Jak w zestawie A. b) Wykaż, że zmienne X i Y są zależne, a następnie opisz taki sposób wypełnienia tabelki prawdopodobieństw, aby wektor (X, Y ) nie zmienił swoich rozkładów brzegowych, ale aby zmienne X i Y były niezależne. Rozwiązanie: Musi być spełniony warunek (∗) z zad. 2 zestaw A, więc pij = pi · pj . Na przykład P ((X, Y ) = (−3, 1)) = P (X = −3)P (X = 1) = 0, 22 · 0, 8, analogicznie tworzymy wszystkie inne liczby z tabelki. Zad. 3. Oblicz wartość oczekiwaną liczby sukcesów w 4800 próbach Bernoulliego z parametrem p = 41 . Korzystając z twierdzenia de Moivre’a – Laplace’a oszacuj prawdopodobieństwo zdarzenia: w 4800 próbach Bernoulliego z parametrem p = 1/4 liczba sukcesów odchyli się od wartości oczekiwanej o mniej niż 90. Rozwiązanie: Tw. de Moivre’a–Laplace’a Sn − np P a < q np(1 − p) < b ≈ Φ(b) − Φ(a). q q A tym zdaniu E(Sn ) = np = 4800 · 41 = 1200, natomiast np(1 − p) = 4800 · 41 · Stąd P (|S4800 − 1200| < 90) = P (−90 < S4800 − 1200 < 90) = S4800 − 1200 90 90 √ P − < < 30 30 900 3 4 = √ 900 = 30. ! ≈ Φ(3) − Φ(−3) ≈ 0, 997. Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1): t 0 0, 5 0, 674 1 1, 5 2 2, 5 3 3, 5 4 Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997 Zestaw D analogiczny do zestawu C, więc podaję tylko końcowe obliczenie w zadaniu 3. Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz √ a) pierwszy kwartyl rozkładu N (2, ( 3)2 ); b) P (2 < X < 10), gdy X ma rozkład N (8, 22 ). Zad. 2. Wektor losowy (X, Y ) ma rozkład podany w tabelce: Y /X −3 −1 1 3 0 0, 1 0, 3 0, 3 0, 1 1 0, 05 0, 05 0, 05 0, 05 a) Oblicz E(X) i V ar(X). b) Wykaż, że zmienne X i Y są zależne, a następnie opisz taki sposób wypełnienia tabelki prawdopodobieństw, aby wektor (X, Y ) nie zmienił swoich rozkładów brzegowych, ale aby zmienne X i Y były niezależne. Zad. 3. Oblicz wartość oczekiwaną liczby sukcesów w 1800 prób Bernoulliego z parametrem p = 23 . Korzystając z twierdzenia de Moivre’a – Laplace’a oszacuj prawdopodobieństwo zdarzenia: w 1800 próbach Bernoulliego z parametrem p = 32 liczba sukcesów będzie zawarta w przedziale (wartość średnia−60, wartość średnia+40). Rzowiązanie: Jak w zestawie C, ale tutaj n = 1800, p = 32 , więc E(S1800 ) = np = 1800 · 32 = 1200 q √ oraz np(1 − p) = 400 = 20. I dalej P (1200 − 60 < S1800 < 1200 + 40) = P (−60 < S1800 − 1200 < 40) = P −60 S4800 − 1200 40 √ < < 20 20 400 ! ≈ Φ(2) − Φ(−3) ≈ 0, 977 − (1 − 0, 9986). Kilka przydatnych wartości funkcji Φ(t), dystrybuanty rozkładu N (0, 1): t 0 0, 5 0, 674 1 1, 5 2 2, 5 3 3, 5 4 Φ(t) 0, 5 0, 691 0, 75 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997