Wykład 8. Przedziały ufności dla średniej 27 kwietnia 2007 Czym
Transkrypt
Wykład 8. Przedziały ufności dla średniej 27 kwietnia 2007 Czym
Wykład 8. Przedziały ufności dla średniej 27 kwietnia 2007 Czym jest statystyka? Statystyka to nauka rozumienia danych i podejmowania decyzji w obliczu losowości. Problem. Dana jest populacja pewnych elementów. Interesuje nas średnia tej populacji. Jak ją obliczyć dokładnie? Jak ją oszacować szybko i małym kosztem ze stosunkowo dużą dokładnością? I jaka jest ta dokładność? Przykłady Oto kilka konkretnych zadań, rozwiązywanych za pomocą statystyki. • Ile haseł jest w tej 1000-stronicowej encyklopedii? • Jaki jest średni czas bezawaryjnego działania urządzeń, które produkuje dana fabryka (np. żarówek)? • Ile czerwonych krwinek w 1 mm3 krwi zawiera badana próbka? • Gdyby dziś odbywały się wybory, to ilu ludzi głosowałoby na partię X? • Czy większość Polaków wypowiada się za przywróceniem kary śmierci? Liczba haseł w encyklopedii Rozważmy pierwszy przykład. Ile haseł omawia dana encyklopedia? • Jak liczbę haseł obliczyć dokładnie? • Kto chciałby to zrobić i czy warto wkładać tyle wysiłku w tę, w gruncie rzeczy, mało istotną informację? • Jak to zrobić, stosując statystykę? • Ile średnio haseł jest na jednej stronie? • Gdy to już wiemy, mnożymy średnią przez liczbę stron. • Jak dokładne są takie obliczenia? „Czas życia” żarówki Ile czasu średnio świecą żarówki, które produkujemy? • Tu nie można zbadać wszystkich żarówek! • Czy na podstawie jednej żarówki możemy szacować czas świecenia całej populacji? • Ile pomiarów trzeba przeprowadzić, aby ich średnia była dobrym odzwierciedleniem nieznanego średniego czasu świecenia? Czerwone krwinki • Jak je szybko policzyć? • Wynik wychodzi w milionach! Próba a populacja Przypomnijmy: 1 • Populacja to zbiór, z którego losujemy próbę i który chcemy opisać. • Próba to podzbiór populacji. • Próba powinna być reprezentatywna dla populacji. • Wnioskowanie statystyczne to wnioskowanie o populacji w oparciu o próbę. Próba prosta Prosta próba losowa: • Każdy element populacji może być wybrany z tym samym prawdopodobieństwem. • Wybory poszczególnych elementów są niezależne. Średnia z próby • Symbol x oznacza liczbę — arytmetyczną średnią z obserwacji. • Symbol X oznacza pojęcie średniej z próby. Parametry średniej Za chwilę wylosujemy z danej populacji (np. żarówki) n elementów. Czas świecenia (do przepalenia żarówki) jest zmienną losową o nieznanym nam rozkładzie. Nie znamy też żadnych parametrów tego rozkładu, a interesuje nas średnia. • Niech X1 , X2 , ..., Xn będą czasami świecenia wylosowanych żarówek. • X= X1 + X2 + ... + Xn n • Jaka jest wartość oczekiwana E(X)? • Jaka wariancja V ar(X)? Parametry X Ponieważ zmienne X1 , X2 , ..., Xn pochodzą z jednej populacji, więc ich rozkład jest jednakowy (czy naprawdę jest???). Oczywiście zarówno średnia, jak i wariancja są skończone. • E(X) = E • • • X1 + X2 + ... + Xn n = 1 (E(X1 ) + E(X2 ) + ... + E(Xn )) = E(X1 ) n X1 + X2 + ... + Xn V ar(X) = V ar n = 1 V ar(X1 ) (V ar(X1 ) + ... + V ar(Xn )) = 2 n n Parametry X Podsumujmy: w próbie prostej (tzn. gdy wszystkie zmienne są niezależne i mają jednakowy rozkład) 2 • E(X) = E(X1 ) • V ar(X) = V ar(X1 ) n • Wniosek: Im więcej prób, tym dokładniejszy wynik (wariancja maleje!). Przykład Dla próby n-elementowej z pewnej populacji V ar(X) = a. Jak dużą próbę należałoby wziąć, aby • ta wariancja zmalała dwukrotnie? • odchylenie standardowe zmalało dziesięciokrotnie? Rozwiązanie Wiemy, że V ar(X) = V ar(X1 ) n = a. • Jeśli chcemy zmniejszyć wariancję dwukrotnie, to musimy dzielić przez dwa razy większą liczbę, czyli należy dwukrotnie zwiększyć liczbę prób. • Odchylenie standardowe to pierwiastek z wariancji: s σX = V ar(X1 ) . n • Aby tę liczbę zmniejszyć dziesięciokrotnie, należy zwiększyć mianownik pod pierwiastkiem 100 razy. • Odpowiedź: Trzeba zwiększyć liczbę prób z n do 100n. Przedziały ufności Neymana Jerzy Spława-Neyman (1894-1981), polski statystyk, w latach 1924-38 w Londynie, od 1938 pracował w Berkeley. Opracował (między innymi) teorię przedziałów ufności. Definicja przedziału ufności Niech cecha X ma w populacji rozkład z nieznanym parametrem θ. Z populacji wybieramy próbę losową X1 , X2 , ..., Xn . Przedziałem ufności (θ1 , θ2 ) o poziomie ufności 1 − α nazywamy taki przedział, który spełnia warunek: P (θ1 < θ < θ2 ) = 1 − α, gdzie θ1 i θ2 są funkcjami wyznaczonymi na podstawie próby losowej. • Zazwyczaj poszukuje się przedziałów najkrótszych. • Poziom ufności 1−α to prawdopodobieństwo, że rzeczywista wartość parametru θ w populacji znajduje się w wyznaczonym przez nas przedziale ufności. • W praktyce przyjmuje się zazwyczaj następujące wartości poziomu 1 − α: 0,99, 0,95 lub (rzadziej) 0,90. Przedziały ufności dla wartości średniej Załóżmy, że chcemy oszacować nieznaną wartość średnią m zmiennej losowej (cechy) X, której wariancję σ 2 znamy. Przyjmujemy jedno z dwu założeń: 3 2 • Zmienna X ma rozkład N (m, σ 2 ), wtedy X ∼ N (m, σn ), • lub • zmienna X ma rozkład różny od normalnego, ale próba jest na tyle duża (n > 30? n > 50?), że średnia 2 X ma w przybliżeniu rozkład N (m, σn ). • Jeśli spełnione jest jedno z tych założeń, to • zmienna X − m√ n ma rozkład N (0, 1). σ Wyznaczanie przedziału ufności Wybierzmy odpowiedni poziom ufności, na przykład 0,95. • Skoro X − m√ n ma rozkład N (0, 1), σ • to z tablic rozkładu normalnego można wyznaczyć taką liczbę zα , dla której • P (−zα < X − m√ n < zα ) = 1 − α = 0, 95. σ • Przekształćmy wyrażenie w nawiasie tak, aby otrzymać nierówność dla nieznanej średniej m: Wyznaczanie przedziału ufności • • σ σ P (−zα √ < X − m < zα √ ) = 1 − α = 0, 95, n n skąd σ σ P (X − zα √ < m < X + zα √ ) = 1 − α = 0, 95. n n • Szukanym przedziałem ufności dla m na poziomie ufności 1 − α jest więc przedział • σ σ X − z α √ , X + zα √ . n n • Estymatorem nieznanej średniej m jest x, a margines błędu wynosi zα √σn . Trzy najważniejsze poziomy ufności Niech Z ∼ N (0, 1). Z tablic rozkładu normalnego N (0, 1) odczytujemy, że dla danego 1 − α, równego 0,9, 0,95 oraz 0,99: • dla 0,9 mamy P (Z < 1, 65) = 0, 95, więc z0,9 = 1, 65 • dla 0,95 mamy P (Z < 1, 96) = 0, 975, więc z0,95 = 1, 96, • dla 0,99 mamy P (Z < 2, 58) = 0, 995, więc z0,99 = 2, 58. Długość przedziału ufności Przy planowaniu eksperymentu (w tym liczebności próby) chcemy wiedzieć, z jaką dokładnością będziemy znać m (margines błędu). • Nieznana średnia m zawarta jest w przedziale 4 • σ σ X − zα √ , X + zα √ n n • o długości • zα σ 2∆ = 2 √ n • Znamy σ, dla wybranego α odczytujemy z tablic zα . √ • Szerokość przedziału zależy zatem od n. Długość przedziału ufności Jeśli zadana jest liczba ∆ (czyli połowa długości przedziału), to liczba prób, potrzebna do otrzymania przedziału danej długości, jest równa n = zα2 σ2 . ∆2 Przykład Próba pobrana z dużej partii lamp zawiera 100 lamp. Średnia z próby długości świecenia lampy wynosi 1000 godzin. Na poziomie ufności 1 − α = 0, 95 wyznacz przedział ufności dla średniej długości świecenia lampy z całej partii, jeśli wiadomo, że odchylenie standardowe wynosi σ = 40 godzin. Rozwiązanie Nie znamy rozkładu długości świecenia, ale próba n = 100 jest na tyle duża, że średnia X ma w przybliżeniu 2 402 rozkład N (m, σn ) czyli N (m, 100 ). • Zadany poziom ufności 1 − α = 0, 95. • Szukamy takiej liczby zα , dla której P (−zα < Z < zα ) = 0, 95, skąd zα = 1, 96. • Szukanym przedziałem ufności jest przedział 1000 − 1, 96 · 40 10 ; 1000 + 1, 96 · 40 10 , • czyli (992, 16; 1007, 84). A gdy nie znamy wariancji σ 2 ? W bardzo wielu przypadkach wartość σ nie jest znana. Jak wtedy szacować wartość średnią m? Przypomnijmy, że S2 = n 1 X (Xi − X)2 n − 1 i=1 Wtedy statystyka X − m√ n S ma rozkład t-Studenta o n − 1 stopniach swobody. Używać S czy Ŝ? Określiliśmy dwie, bardzo podobne statystyki: S=√ 1 n−1 v u n uX t (Xi − X)2 , i=1 5 v u n 1 uX Ŝ = √ t (Xi − X)2 . n i=1 X − m√ n − 1 też ma rozkład t-Studenta Ŝ o n − 1 stopniach swobody. Statystyka Uwaga: Oczywiście √ n − 1S = √ n Ŝ, więc X − m√ X − m√ n= n − 1. S Ŝ Kim był Student? Praca na temat tego rozkładu została opublikowana w czasopiśmie Biometrika w 1908 roku. • Dlaczego praca podpisana była pseudonimem? • Londyn — najważniejszy ośrodek statystyki na świecie. • Karl Pearson (1857 - 1936) wprowadził np. termin odchylenie standardowe, test χ2 -Pearsona itp. • Egon Pearson (1895-1980) współpracował z Jerzym Spławą-Neymanem, był synem Karla Pearsona. • William Gosset „Student”. Rozkład t-Studenta Rozkład Studenta jest (na pierwszy rzut oka) podobny do rozkładu normalnego, ma jednak „ciężkie ogony”. • Kształt jego gęstości zależy od liczby stopni swobody. • Dla n = 1 ma nieskończoną wartość oczekiwaną. • Gdy n → ∞, to rozkład Studenta zbliża się do rozkładu normalnego tak, że • dla n > 30 różnica pomiedzy tymi rozkładami jest niewielka. • Tablice rozkładu Studenta podają zwykle tylko wartości dla n ¬ 30 stopni swobody. Zadanie Znajdź dwie symetryczne wartości −tα i tα takie, że między nimi zawiera się 0,95 masy rozkładu Studenta z 11 stopniami swobody. • Rozwiązanie. • Niech Tk oznacza zmienną o rozkładzie studenta z k stopniami swobody. • Szukamy takiego t, dla którego • P (T11 < t) = 0, 975. • Z tablic t = 2, 2010. • Odpowiedź: −tα = −2, 2010, tα = 2, 2010. Zadanie Wytrzymałość pewnego materiału budowlanego ma rozkład normalny N (m, σ 2 ). Pięcioelementowa próba wylosowanych sztuk tego materiału dała wyniki: x̄ = 20, 8 N/cm2 , ŝ = 2, 8N/cm2 . Na poziomie ufności 0,99 zbuduj przedział ufności dla średniej m. Rozwiązanie Nie znamy wartości parametru σ, a próba ma liczebność n < 30, więc musimy użyć rozkładu t-Studenta. 6 • Wiemy, że X − m√ n−1 Ŝ • ma rozkład Studenta o 4 stopniach swobody. • Dla poziomu ufności 0,99 i 4 stopni swobody odczytujemy z tablic t = 4, 6041 • Zatem ! P X − m√ −4, 6041 < n − 1 < 4, 6041 Ŝ = 0, 99, • co daje przedział (14, 36; 27, 24). A jeśli przedział jest zbyt szeroki? Zwiększając liczbę pomiarów w próbie, możemy zmniejszyć długość przedziału ufności. Gdy stosujemy rozkład t-Studenta powinniśmy zwracać baczną uwagę na: • liczbę stopni swobody, • rodzaj statystyki, jaki stosujemy: S czy też Ŝ. • Jeśli jest więcej niż 30 obserwacji w próbie, to korzystamy z tablic rozkładu normalnego. 7