X - Ath
Transkrypt
X - Ath
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 – krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek x1 x2 x3 x4 5 5 4 1 2 1 2 4 2 .... 3 1 5 6 Nr kolejny doświadczenia 1 wszystkie wyniki pierwszego rzutu kostką można traktować, jako realizację zmiennej losowej, którą oznaczmy przez X1 , drugiego X2 itd. Definicja. Próbą losową prostą jest ciąg n zmiennych losowych (X1, X2, ,..., Xn) niezależnych, mających jednakowe rozkłady. Definicja Statystyką z próby nazywamy zmienną losową Z, będącą funkcją zmiennych X1, X2, ,..., Xn stanowiących próbę losową. Statystykami są : średnia z próby, wariancja z próby, odchylenie standardowe z próby.. Liczba stopni swobody jest równa liczbie niezależnych obserwacji określających statystykę. Rozkład średniej arytmetycznej z próby dla populacji normalnej Założenia: Cecha X ma w populacji generalnej rozkład N(m, ). Z populacji tej pobieramy n- elementową próbę losową prostą (X1, X2, ,..., Xn). Teza: przy powyższych założeniach średnia arytmetyczna z próby 1 n X X n i 1 ma rozkład normalny i N (m , Błąd standardowy średniej n n ) Przykład. Waga brzoskwiń ma rozkład N(150,3). Pakowane są one po dziewięć sztuk, przy czym dobór ten jest losowy. 1. Określić rozkład średniej arytmetycznej brzoskwiń w pojedynczych opakowaniach. 2. Jakie jest prawdopodobieństwo tego, że średnia waga brzoskwiń w opakowaniu jest większa od 152 g? Rozwiązanie. Średnia arytmetyczna wag brzoskwiń ma rozkład normalny, ze średnią 150 g i odchyleniem standardowym 3 D(X) n 9 = 1 g. 2. X 150 152 150 P( X 152) P 1 1 P(U 2) 1 P(U 2) 1 (2) 1 0,97725 0,02275 Rozkład różnicy średnich arytmetycznych z prób Zakładamy, że z dwóch populacji normalnych N(m1, 1) i N(m2, 2) pobieramy niezależne próby liczące odpowiednio n1 i n2 elementów. Statystyka : X1 X2 ma rozkład normalny N(m1 m2 , 2 1 n1 2 2 n2 ) Rozkład t-Studenta. Jeżeli zmienne losowe X1,X2,...,Xn mają jednakowy rozkład prawdopodobieństwa, który jest rozkładem normalnym o średniej m i wariancji σ2, to zmienna t określona wzorem Xm t n s gdzie X - wartość średnia z próby, s – odchylenie standardowe obliczone z próby ma rozkład t-Studenta o v = n-1 stopniach swobody. Rozkład t-Studenta Zastosowanie: • w procedurach testowania hipotez statystycznych • przy ocenie błędów pomiaru, • szacowania przedziału, w którym leży, z określonym prawdopodobieństwem, rzeczywista wartość mierzona. Funkcja gęstości rozkładu t-Studenta. Dystrybuanta rozkładu t-Studenta. Tablice t-Studenta zawierają kwantyle rozkładu Studenta. Tablice są skonstruowane w taki sposób, że dla ustalonej wartości (0 < <1) i liczby stopni swobody podana jest wartość t, spełniająca relację P(|t| t, ) = . Tablice t Studenta. n 4 5 6 10 11 12 13 18 19 25 26 40 =0,1 2,132 2.015 1.943 1,812 1,796 1,782 1,771 1.734 1.729 1.708 1.706 1.684 = 0,05 2,776 2.571 2.447 2,228 2,201 1,179 2,160 2.552 2.093 2.060 2.056 2.021 = 0,02 3,747 3,365 3.143 2,764 2,718 2,681 2,650 2.878 2.539 2.485 2.479 2.423 =0,01 4,604 4.032 3.707 3,169 3,106 3,055 3,012 3.922 2.861 2.787 2.779 2.704 Funkcja gęstości prawdopodobieństwa y =student(x;10) Dy stry buanta p=1-istudent(x;10) 0.5 1.0 0.4 0.8 0.3 0.6 0.2 0.4 0.1 0.2 0.0 0.0 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 Twierdzenie graniczne Przy (dla > 30) rozkład t-Studenta jest zbieżny do standardowego rozkładu normalnego N(0, 1). Rozkład chi-kwadrat (2) Rozkład chi kwadrat χ² to rozkład zmiennej losowej która jest sumą k kwadratów niezależnych zmiennych losowych o standardowym rozkładzie normalnym. k Y (X i ) , i 1 2 Rozkład chi-kwadrat (2) Statystyka (n 1)s 2 2 stosowana przy wnioskowaniu o wariancji z próby dla populacji normalnej Funkcja gęstości rozkładu 2 Rozkład chi-kwadrat (2) • Rozkład 2 jest stablicowany w ten sposób, że dla ustalonej wartości i liczby stopni swobody tablice podają wartość 2, spełniającą relację P(2 2,) = . Rozkład 2 n 0,05 0,02 0,01 0,98 0,99 2 5.991 7.824 9.210 0.040 0.020 3 7.815 9.837 11.345 0.185 0.115 4 9.488 11.668 13.277 0.429 0.297 5 11.070 13.388 15.086 0.752 0.554 6 12.592 15.033 16.812 1.134 0.872 7 14.067 16.622 18.475 1.564 1.239 Rozkład F Fishera-Snedecora. Rozkład ilorazu wariancji dla dwóch populacji normalnych. Zakładamy, że z dwóch populacji normalnych N(m1, ) i N(m2, ) pobieramy niezależne próby liczące odpowiednio n1 i n2 elementów, z których wyznaczamy średnie i wariancje: 2 2 s1 , s 2 Rozkład F Fishera -Snedecora. • Budujemy statystykę 2 1 2 2 s F s • Rozkład dla tej statystyki nazywany jest rozkładem F-Snedecora o liczbie stopni swobody : licznika 1 = n1 –1 i mianownika 2 = n2 - 2. Funkcja gęstości rozkładu F- Fishera Twierdzenia graniczne i prawa wielkich liczb Definicja stochastycznej zbieżności Ciąg zmiennych losowych {Xn} jest - przy n zbieżny stochastycznie (wg prawdopodobieństwa ) do zmiennej losowej X, jeśli dla każdego > 0 spełniona jest następująca równość: lim P(| X n X | ) 1 n Prawo wielkich liczb Czebyszewa Jeśli dla ciągu zmiennych losowych {Xk}, z których każda ma skończoną wartość oczekiwaną E(Xk) oraz wariancję D2(Xk) jest spełniony warunek lim D 2 (X k ) 0 k to lim P(| X k E(X k ) | ) 1 k co oznacza, że ciąg {Xk} jest stochastycznie (wg prawdopodobieństwa) zbieżny do wartości oczekiwanej. Mocne prawo wielkich liczb (Chinczyna) to twierdzenie matematyczne, które mówi że n Xi ciąg zmiennych losowych S n i 1 n zbiega z prawdopodobieństwem równym 1 do wartości oczekiwanej m zmiennej losowej Xi. (Średnia z próby jest zbieżna do wartości oczekiwanej). Twierdzenia graniczne • Dotyczą zbieżności ciągu zmiennych losowych {Xn} do rozkładu jednopunktowego tzn. istnienia granicy stochastycznej tego ciągu. Przybliżenie Poissona • Zmienna losowa X o rozkładzie dwumianowym przy n zmierza do rozkładu Poissona. • Dystrybuanta rozkładu N(0,1) jest asymptotyczną (graniczną) dystrybuantą ciągu dystrybuant zestandaryzowanych zmiennych dwumianowych. Centralne twierdzenie graniczne Lindeberga-Levy’ego. Założenia: Dany jest ciąg X1, … , Xn niezależnych zmiennych losowych o jednakowym rozkładzie. czyli spełnione są warunki: E(X1) =m, E(X2) = …=E(Xn) = m D2(X1) = 2 D2(X2) = …= D2(Xn) = 2 Centralne twierdzenie graniczne Lindeberga-Levy’ego. Teza: Oznaczmy przez Z = X1+ … +Xn Jeśli n rozkład zmiennej losowej Zn można przybliżać rozkładem normalnym z wartością oczekiwaną nm i odchyleniem n czyli dla dużych n jest zbliżony do rozkładu N(nm, n ) E(Zn) = nm oraz D2(Zn) = n2 (Wynika to z własności wartości oczekiwanej i wariancji) Rozkład sumy, różnicy, średniej arytmetycznej zmiennych losowych Wiadomo, że waga dorosłego człowieka ma rozkład N(70,3). Samolot zabiera 80 pasażerów. Jakie jest prawdopodobieństwo, że łączna waga pasażerów przekroczy 5550 kg. Rozwiązanie Centralne twierdzenie graniczne Lindeberga-Levy’ego. Łączna waga pasażerów Y = X1 + X2 + ...+ Xn ma rozkład N nm, n czyli N(5600, N(80 * 70,3 80 3 80) 5550 5600 50 P Y 5550) P(U PU P(U 1,86) 26,8 3 80 1 P(U 1,86) 1 ( 1,86) 1 1 (1,86) (1,86) 0,969 Przykład. Rozkład chi-kwadrat . Zmienna losowa X ma rozkład 2 chi-kwadrat z pięcioma stopniami swobody. Oblicz P(X 11,070) P(X 11,070) = =1- P(X > 11,070) =1 - 0,05 = 0,95 • Rozkład 2 jest stablicowany w ten sposób, że dla ustalonej wartości i liczby stopni swobody n tablice podają wartość 2 ,n spełniającą relację P(2 2 ,n) = . P(X 11,070) P(X > 11,070) Zadania. 1. Zmienna losowa X ma rozkład chi-kwadrat o 6 stopniach swobody. Oblicz P(X > 1,610) 2. Zmienna losowa X ma rozkład chi-kwadrat z pięcioma stopniami swobody. Oblicz prawdopodobieństwo P(X > 1,145) oraz P(X 7,289) Przykład. 1. Wiedząc , że zmienna losowa X ma rozkład chikwadrat o 6 stopniach swobody , znajdź taką wartość x0, że a) P(X >x0) = 0,9 b) P(X < x0) = 0,05 a) P(X >x0) = 0,9 Odp.a) x0 = 2,204 b) P(X<x0) = 1- P(X x0) =0,1 stąd P(X x0) = 0,95 z tablic x0 = 1,635 Przykład. Rozkład t-Studenta Zmienna losowa ma rozkład t-Studenta o 15 stopniach swobody. Obliczyć a) P(|X|>0,128) b) P(X > 0,258) c) P(|X|0,39) P(|X|>0,128) Tablice: P(|t| t, ) = . P(|X|>0,128) – odczytujemy z tablic następująco: dla 15 stopni swobody znajdujemy wartość 0,128 i odczytujemy prawdopodobieństwo (czyli alfa) =0,9 P(|X|>0,128) (P(|t| t, ) = ) b) P(X > 0,258) P(X > 0,258) P(X > 0,258) =1/2* P(X > 0,258) =0,8/2 =0,4 P(|X|0,39) P(|X|0,39) = 1-P(|X|0,39)=1-0,7=0,3; P(|X|0,39) Przykład. Waga brzoskwiń ma rozkład N(150,3). Pakowane są one po dziewięć sztuk, przy czym dobór ten jest losowy. 1. Określić rozkład średniej arytmetycznej brzoskwiń w pojedynczych opakowaniach. 2. Jakie jest prawdopodobieństwo tego, że średnia waga brzoskwiń w opakowaniu jest większa od 152 g? Rozwiązanie. Średnia arytmetyczna wag brzoskwiń ma rozkład normalny, ze średnią 150 g i odchyleniem standardowym 3 D(X) n 9 = 1 g. 2. X 150 152 150 P( X 152) P 1 1 P(U 2) 1 P(U 2) 1 (2) 1 0,97725 0,02275 Przykład. Wzrost 15-letnich chłopców ma rozkład normalny N(170,5), natomiast wzrost piętnastoletnich dziewcząt ma rozkład N(166,4). Pobiera się niezależnie próby liczące 8 chłopców i 10 dziewcząt. Jakie jest prawdopodobieństwo, że obliczana na podstawie prób średnia arytmetyczna wzrostu dziewczyn będzie większa od średniej arytmetycznej wzrostu chłopców? Rozwiązanie Różnica średnich z obu prób - ma rozkład normalny ze średnią wynoszącą m1 m2 170-166 = 4 oraz odchyleniem standardowym 2 1 2 2 25 16 2 , 17 n1 n 2 8 10 czyli rozkład normalny N(4, 2,17). 2. P(X2 X1) P(X1 X2 ) 0) (X1 X2 ) 4 0 4 P 2,17 2,17 P( U 1,84) (1,84) 0,03288 Rozkład sumy, różnicy, średniej arytmetycznej zmiennych losowych Wiadomo, że waga dorosłego człowieka ma rozkład N(70,3). Samolot zabiera 80 pasażerów. Jakie jest prawdopodobieństwo, że łączna waga pasażerów przekroczy 5550 kg. Rozwiązanie Centralne twierdzenie graniczne Lindeberga-Levy’ego. Łączna waga pasażerów Y = X1 + X2 + ...+ Xn ma rozkład N nm, n 2 czyli N(5600, N(80 * 70,3 80 3 80) 5550 5600 50 P Y 5550) P(U PU P(U 1,86) 26,8 3 80 1 P(U 1,86) 1 ( 1,86) 1 1 (1,86) (1,86) 0,969 Przykład Błędy pomiarów dokonywanych pewnym przyrządem mają rozkład normalny z wariancją 2 = 0,25 (cm)2. Jakie jest prawdopodobieństwo, że wariancja błędów 10 niezależnych pomiarów nie przekroczy 0,16 (cm)2. Obliczyć: P(s2 0,16) Prawdopodobieństwo zdarzenia s2 0,16 obliczymy, gdy wykorzystamy fakt, że statystyka 2 (n 1)s 2 2 9s 0,25 ma rozkład 2 o 9 stopniach swobody. P(s2 0,16) = 9s 9 * 0,16 2 P( (9) 5,76) 0,236 P 0,25 0,25 2