Wykład 8. Przedziały ufności dla średniej Średnia a mediana
Transkrypt
Wykład 8. Przedziały ufności dla średniej Średnia a mediana
Wykład 8. Przedziały ufności dla średniej Średnia a mediana • Mediana dzieli powierzchnię histogramu na połowy. • Jest odporna – nie mają na nią wpływu obserwacje „odstające”. • Obserwacje odstające mają duży wpływ na średnią – średnia nie jest odporna. • Jeżeli histogram jest w przybliżeniu symetryczny, to średnia i mediana są zbliżone. • Jeżeli histogram jest skośny na prawo, to średnia jest zwykle większa niż mediana. • Obie te miary położenia są jednakowo ważne. • Średnia jest częściej wykorzystywana do testowania i estymacji (o czym później). Miary położenia: kwartyle • Kwartyle dzielą zbiór danych na cztery grupy. • Drugi kwartyl (Q2) to mediana. • Pierwszy kwartyl (Q1) to mediana grupy obserwacji mniejszych niż Q2. • Trzeci kwartyl (Q3) to mediana grupy obserwacji większych niż Q2. Rozstęp międzykwartylowy IQR = Q3 − Q1 (inter-quartile range) Obserwacja odstająca Czasami jeden lub kilka wyników wyraźnie odstaje od pozostałej większości. Spowodowane to może być np. przez błąd w zapisie danych, błąd maszyny, zmianę warunków eksperymentu itp. • Jak ustalić, które wyniki odstają? • Dolna granica = Q1 − 1, 5 · IQR • Górna granica = Q3 + 1, 5 · IQR Wariancja z próby Miarą rozrzutu danych jest wariancja. Niestety, używa się dwóch bardzo podobnych statystyk. Przypuśćmy, że dane są wyniki pomiarów y1 , y2 , ..., yn . Wtedy • s2 = • ŝ2 = n 1X (yi − y)2 n i=1 n 1 X (yi − y)2 n − 1 i=1 • Odpowiednio definiujemy s oraz ŝ (jako pierwiastki). • Czym różnią się s2 i ŝ2 ? • Zasadniczą różnicę poznamy później, większą rolę w statystyce pełni ŝ2 . Wpływ przekształceń Jak zmieniają się: histogram, y, rozstęp, mediana, kwartyle i s2 , gdy zamiast y weźmiemy yi0 = ayi + c, gdzie a, c są stałymi rzeczywistymi? • Funkcja liniowa nie zmienia w zasadniczy sposób kształtu histogramu. Może go rozszerzyć (|a| > 1), ścieśnić (|a| < 1), przesunąć (c < 0 lub c > 0) i obrócić (a < 0). 1 • y 0 = ay + c • s2 0 = a2 s2 , więc s 0 = |a| s. • Funkcja liniowa zmienia: medianę i kwartyle tak, jak średnią, a rozstęp i IQR tak, jak odchylenie standardowe. Przekształcenia nieliniowe Funkcje nieliniowe (np. logarytm) zmieniają kształt histogramu i na ogół nie ma dla nich prostych formuł umożliwiających obliczenie nowej średniej i nowego odchylenia standardowego. Parametry te liczymy z definicji korzystając z „nowego” zbioru danych. Czasami używamy funkcji nieliniowych, aby przekształcić skośne dane w bardziej symetryczne. Próba a populacja • Populacja: • Zbiór, z którego losujemy próbę i który chcemy opisać. Czasami rzeczywista, czasami abstrakcyjna (np. „nieskończenie duża próba”) . • Próba: • Podzbiór populacji. • Próba powinna być reprezentatywna dla populacji. • Wnioskowanie statystyczne to wnioskowanie o populacji w oparciu o próbę. Próba prosta Prosta próba losowa: • Każdy osobnik z populacji może być wybrany z tym samym prawdopodobieństwem. • Wybory poszczególnych osobników są niezależne. Jak wybrać próbę losową prostą? Mechanizm losujący, np.: • Przyznajemy numer każdemu osobnikowi. • Zapisujemy numery na kulach. • Mieszamy kule w urnie. • Losujemy kule=numery=osobników, tyle razy, ile wynosi rozmiar próby. • Do losowania możemy również użyć komputera lub gotowej tablicy liczb (numerów) losowych. • Gdy rozmiar populacji nie jest ustalony lub nie mamy dostępu do wszystkich osobników, zadanie jest dużo trudniejsze. Przykład Przewidywanie wyników wyborów prezydenckich w USA, 1936: • Literary Digest wysłało kwestionariusze do 10 milionów ludzi (25% głosujących). • Odpowiedziało 2,4 miliona. • Przewidywanie: Landon 57%, Roosevelt 43%. • Wynik wyborów: Roosevelt 62%, Landon 38%. • Uwaga: F.D. Roosevelt, Partia Demokratyczna, prezydent w latach 1933-1945. 2 Przyczyny błędu • Złe (dyskryminujące) próbkowanie (użyto książek telefonicznych, list członkowskich klubów, listy zamówień pocztowych, listy właścicieli pojazdów). • Brak odpowiedzi. Tylko 24% odpowiedziało (niemal wyłącznie Republikanie). • Uwaga: George Gallup przewidział poprawnie na podstawie reprezentatywnej próbki 50 000 osób. Obciążenie w próbkowaniu Obciążenie w próbkowaniu występuje, gdy mamy do czynienia z systematycznym błędem faworyzującym pewną część populacji. W przypadku takiego obciążenia nie pomoże nawet duży rozmiar próby. Losowy wybór elementów do próby zwykle eliminuje takie obciążenie. Stratyfikacja Dzielimy populację na pod-populacje podobnych jednostek (warstwy) i oddzielnie próbkujemy w każdej warstwie. Przykłady warstw: • studentki i studenci • grupy zawodowe • regiony geograficzne Czym jest statystyka? Statystyka to nauka rozumienia danych i podejmowania decyzji w obliczu losowości. Problem. Dana jest populacja pewnych elementów. Interesuje nas średnia tej populacji. Jak ją obliczyć dokładnie? Jak ją oszacować szybko i małym kosztem ze stosunkowo dużą dokładnością? I jaka jest ta dokładność? Przykłady Oto kilka konkretnych zadań, rozwiązywanych za pomocą statystyki. • Ile haseł jest w tej 1000-stronicowej encyklopedii? • Jaki jest średni czas bezawaryjnego działania urządzeń, które produkuje dana fabryka (np. żarówek)? • Ile czerwonych krwinek w 1 mm3 krwi zawiera badana próbka? • Gdyby dziś odbywały się wybory, to ilu ludzi głosowałoby na partię X? • Czy większość Polaków wypowiada się za przywróceniem kary śmierci? Liczba haseł w encyklopedii Rozważmy pierwszy przykład. Ile haseł omawia dana encyklopedia? • Jak liczbę haseł obliczyć dokładnie? • Kto chciałby to zrobić i czy warto wkładać tyle wysiłku w tę, w gruncie rzeczy, mało istotną informację? • Jak to zrobić, stosując statystykę? • Ile średnio haseł jest na jednej stronie? • Gdy to już wiemy, mnożymy średnią przez liczbę stron. • Jak dokładne są takie obliczenia? „Czas życia” żarówki Ile czasu średnio świecą żarówki, które produkujemy? 3 • Tu nie można zbadać wszystkich żarówek! • Czy na podstawie jednej żarówki możemy szacować czas świecenia całej populacji? • Ile pomiarów trzeba przeprowadzić, aby ich średnia była dobrym odzwierciedleniem nieznanego średniego czasu świecenia? Czerwone krwinki • Jak je szybko policzyć? Wynik wychodzi w milionach! Średnia z próby • Symbol x oznacza liczbę — arytmetyczną średnią z obserwacji. • Symbol X oznacza pojęcie średniej z próby. Parametry średniej Za chwilę wylosujemy z danej populacji (np. żarówki) n elementów. Czas świecenia (do przepalenia żarówki) jest zmienną losową o nieznanym nam rozkładzie. Nie znamy też żadnych parametrów tego rozkładu, a interesuje nas średnia. • Niech X1 , X2 , ..., Xn będą czasami świecenia wylosowanych żarówek. • X= X1 + X2 + ... + Xn n • Jaka jest wartość oczekiwana E(X)? • Jaka wariancja V ar(X)? Parametry X Ponieważ zmienne X1 , X2 , ..., Xn pochodzą z jednej populacji, więc ich rozkład jest jednakowy (czy naprawdę jest???). Oczywiście zarówno średnia, jak i wariancja są skończone. • E(X) = E • • • X1 + X2 + ... + Xn n = 1 (E(X1 ) + E(X2 ) + ... + E(Xn )) = E(X1 ) n X1 + X2 + ... + Xn V ar(X) = V ar n = 1 V ar(X1 ) (V ar(X1 ) + ... + V ar(Xn )) = n2 n Parametry X Podsumujmy: w próbie prostej (tzn. gdy wszystkie zmienne są niezależne i mają jednakowy rozkład) • E(X) = E(X1 ) • V ar(X) = V ar(X1 ) n • Wniosek: Im więcej prób, tym dokładniejszy wynik (wariancja maleje!). 4 Przykład Dla próby n-elementowej z pewnej populacji V ar(X) = a. Jak dużą próbę należałoby wziąć, aby • ta wariancja zmalała dwukrotnie? • odchylenie standardowe zmalało dziesięciokrotnie? Rozwiązanie Wiemy, że V ar(X) = V ar(X1 ) n = a. • Jeśli chcemy zmniejszyć wariancję dwukrotnie, to musimy dzielić przez dwa razy większą liczbę, czyli należy dwukrotnie zwiększyć liczbę prób. • Odchylenie standardowe to pierwiastek z wariancji: s σX = V ar(X1 ) . n • Aby tę liczbę zmniejszyć dziesięciokrotnie, należy zwiększyć mianownik pod pierwiastkiem 100 razy. • Odpowiedź: Trzeba zwiększyć liczbę prób z n do 100n. Przedziały ufności Neymana Jerzy Spława-Neyman (1894-1981), polski statystyk, w latach 1924-38 w Londynie, od 1938 pracował w Berkeley. Opracował (między innymi) teorię przedziałów ufności. Definicja przedziału ufności Niech cecha X ma w populacji rozkład z nieznanym parametrem θ. Z populacji wybieramy próbę losową X1 , X2 , ..., Xn . Przedziałem ufności (θ1 , θ2 ) o poziomie ufności 1 − α nazywamy taki przedział, który spełnia warunek: P (θ1 < θ < θ2 ) = 1 − α, gdzie θ1 i θ2 są funkcjami wyznaczonymi na podstawie próby losowej. • Zazwyczaj poszukuje się przedziałów najkrótszych. • Poziom ufności 1−α to prawdopodobieństwo, że rzeczywista wartość parametru θ w populacji znajduje się w wyznaczonym przez nas przedziale ufności. • W praktyce przyjmuje się zazwyczaj następujące wartości poziomu 1 − α: 0,99, 0,95 lub (rzadziej) 0,90. Przedziały ufności dla wartości średniej Załóżmy, że chcemy oszacować nieznaną wartość średnią m zmiennej losowej (cechy) X, której wariancję σ 2 znamy. Przyjmujemy jedno z dwu założeń: 2 • Zmienna X ma rozkład N (m, σ 2 ), wtedy X ∼ N (m, σn ) lub • zmienna X ma rozkład różny od normalnego, ale próba jest na tyle duża (n > 30? n > 50?), że średnia 2 X ma w przybliżeniu rozkład N (m, σn ). • Jeśli spełnione jest jedno z tych założeń, to • zmienna X − m√ n ma rozkład N (0, 1). σ 5 Wyznaczanie przedziału ufności Wybierzmy odpowiedni poziom ufności, na przykład 0,95. • Skoro X − m√ n ma rozkład N (0, 1), σ • to z tablic rozkładu normalnego można wyznaczyć taką liczbę zα , dla której • P (−zα < X − m√ n < zα ) = 1 − α = 0, 95. σ • Przekształćmy wyrażenie w nawiasie tak, aby otrzymać nierówność dla nieznanej średniej m: Wyznaczanie przedziału ufności • • σ σ P (−zα √ < X − m < zα √ ) = 1 − α = 0, 95, n n skąd σ σ P (X − zα √ < m < X + zα √ ) = 1 − α = 0, 95. n n • Szukanym przedziałem ufności dla m na poziomie ufności 1 − α jest więc przedział • σ σ . X − zα √ , X + zα √ n n • Estymatorem nieznanej średniej m jest x, a margines błędu wynosi zα √σn . Trzy najważniejsze poziomy ufności Niech Z ∼ N (0, 1). Z tablic rozkładu normalnego N (0, 1) odczytujemy, że dla danego 1 − α, równego 0,9, 0,95 oraz 0,99: • dla 0,9 mamy P (Z < 1, 65) = 0, 95, więc z0,9 = 1, 65 • dla 0,95 mamy P (Z < 1, 96) = 0, 975, więc z0,95 = 1, 96, • dla 0,99 mamy P (Z < 2, 58) = 0, 995, więc z0,99 = 2, 58. Długość przedziału ufności Przy planowaniu eksperymentu (w tym liczebności próby) chcemy wiedzieć, z jaką dokładnością będziemy znać m (margines błędu). • Nieznana średnia m zawarta jest w przedziale • σ σ X − zα √ , X + zα √ n n • o długości • zα σ 2∆ = 2 √ n • Znamy σ, dla wybranego α odczytujemy z tablic zα . 6 • Szerokość przedziału zależy zatem od √ n. Długość przedziału ufności Jeśli zadana jest liczba ∆ (czyli połowa długości przedziału), to liczba prób, potrzebna do otrzymania przedziału danej długości, jest równa n = zα2 σ2 . ∆2 Przykład Próba pobrana z dużej partii lamp zawiera 100 lamp. Średnia z próby długości świecenia lampy wynosi 1000 godzin. Na poziomie ufności 1 − α = 0, 95 wyznacz przedział ufności dla średniej długości świecenia lampy z całej partii, jeśli wiadomo, że odchylenie standardowe wynosi σ = 40 godzin. Rozwiązanie Nie znamy rozkładu długości świecenia, ale próba n = 100 jest na tyle duża, że średnia X ma w przybliżeniu 2 402 ). rozkład N (m, σn ) czyli N (m, 100 • Zadany poziom ufności 1 − α = 0, 95. • Szukamy takiej liczby zα , dla której P (−zα < Z < zα ) = 0, 95, skąd zα = 1, 96. • Szukanym przedziałem ufności jest przedział 1000 − 1, 96 · • czyli (992, 16; 1007, 84). 7 40 10 ; 1000 + 1, 96 · 40 10 ,