Wykład 8. Przedziały ufności dla średniej Średnia a mediana

Transkrypt

Wykład 8. Przedziały ufności dla średniej Średnia a mediana
Wykład 8. Przedziały ufności dla średniej
Średnia a mediana
• Mediana dzieli powierzchnię histogramu na połowy.
• Jest odporna – nie mają na nią wpływu obserwacje „odstające”.
• Obserwacje odstające mają duży wpływ na średnią – średnia nie jest odporna.
• Jeżeli histogram jest w przybliżeniu symetryczny, to średnia i mediana są zbliżone.
• Jeżeli histogram jest skośny na prawo, to średnia jest zwykle większa niż mediana.
• Obie te miary położenia są jednakowo ważne.
• Średnia jest częściej wykorzystywana do testowania i estymacji (o czym później).
Miary położenia: kwartyle
• Kwartyle dzielą zbiór danych na cztery grupy.
• Drugi kwartyl (Q2) to mediana.
• Pierwszy kwartyl (Q1) to mediana grupy obserwacji mniejszych niż Q2.
• Trzeci kwartyl (Q3) to mediana grupy obserwacji większych niż Q2.
Rozstęp międzykwartylowy
IQR = Q3 − Q1 (inter-quartile range)
Obserwacja odstająca
Czasami jeden lub kilka wyników wyraźnie odstaje od pozostałej większości. Spowodowane to może być np.
przez błąd w zapisie danych, błąd maszyny, zmianę warunków eksperymentu itp.
• Jak ustalić, które wyniki odstają?
• Dolna granica = Q1 − 1, 5 · IQR
• Górna granica = Q3 + 1, 5 · IQR
Wariancja z próby
Miarą rozrzutu danych jest wariancja. Niestety, używa się dwóch bardzo podobnych statystyk.
Przypuśćmy, że dane są wyniki pomiarów y1 , y2 , ..., yn . Wtedy
•
s2 =
•
ŝ2 =
n
1X
(yi − y)2
n i=1
n
1 X
(yi − y)2
n − 1 i=1
• Odpowiednio definiujemy s oraz ŝ (jako pierwiastki).
• Czym różnią się s2 i ŝ2 ?
• Zasadniczą różnicę poznamy później, większą rolę w statystyce pełni ŝ2 .
Wpływ przekształceń
Jak zmieniają się: histogram, y, rozstęp, mediana, kwartyle i s2 , gdy zamiast y weźmiemy yi0 = ayi + c, gdzie
a, c są stałymi rzeczywistymi?
• Funkcja liniowa nie zmienia w zasadniczy sposób kształtu histogramu. Może go rozszerzyć (|a| > 1),
ścieśnić (|a| < 1), przesunąć (c < 0 lub c > 0) i obrócić (a < 0).
1
• y 0 = ay + c
• s2 0 = a2 s2 , więc s 0 = |a| s.
• Funkcja liniowa zmienia: medianę i kwartyle tak, jak średnią, a rozstęp i IQR tak, jak odchylenie
standardowe.
Przekształcenia nieliniowe
Funkcje nieliniowe (np. logarytm) zmieniają kształt histogramu i na ogół nie ma dla nich prostych formuł
umożliwiających obliczenie nowej średniej i nowego odchylenia standardowego.
Parametry te liczymy z definicji korzystając z „nowego” zbioru danych.
Czasami używamy funkcji nieliniowych, aby przekształcić skośne dane w bardziej symetryczne.
Próba a populacja
• Populacja:
• Zbiór, z którego losujemy próbę i który chcemy opisać. Czasami rzeczywista, czasami abstrakcyjna
(np. „nieskończenie duża próba”) .
• Próba:
• Podzbiór populacji.
• Próba powinna być reprezentatywna dla populacji.
• Wnioskowanie statystyczne to wnioskowanie o populacji w oparciu o próbę.
Próba prosta
Prosta próba losowa:
• Każdy osobnik z populacji może być wybrany z tym samym prawdopodobieństwem.
• Wybory poszczególnych osobników są niezależne.
Jak wybrać próbę losową prostą?
Mechanizm losujący, np.:
• Przyznajemy numer każdemu osobnikowi.
• Zapisujemy numery na kulach.
• Mieszamy kule w urnie.
• Losujemy kule=numery=osobników, tyle razy, ile wynosi rozmiar próby.
• Do losowania możemy również użyć komputera lub gotowej tablicy liczb (numerów) losowych.
• Gdy rozmiar populacji nie jest ustalony lub nie mamy dostępu do wszystkich osobników, zadanie jest
dużo trudniejsze.
Przykład
Przewidywanie wyników wyborów prezydenckich w USA, 1936:
• Literary Digest wysłało kwestionariusze do 10 milionów ludzi (25% głosujących).
• Odpowiedziało 2,4 miliona.
• Przewidywanie: Landon 57%, Roosevelt 43%.
• Wynik wyborów: Roosevelt 62%, Landon 38%.
• Uwaga: F.D. Roosevelt, Partia Demokratyczna, prezydent w latach 1933-1945.
2
Przyczyny błędu
• Złe (dyskryminujące) próbkowanie (użyto książek telefonicznych, list członkowskich klubów, listy zamówień pocztowych, listy właścicieli pojazdów).
• Brak odpowiedzi. Tylko 24% odpowiedziało (niemal wyłącznie Republikanie).
• Uwaga: George Gallup przewidział poprawnie na podstawie reprezentatywnej próbki 50 000 osób.
Obciążenie w próbkowaniu
Obciążenie w próbkowaniu występuje, gdy mamy do czynienia z systematycznym błędem faworyzującym
pewną część populacji. W przypadku takiego obciążenia nie pomoże nawet duży rozmiar próby.
Losowy wybór elementów do próby zwykle eliminuje takie obciążenie.
Stratyfikacja
Dzielimy populację na pod-populacje podobnych jednostek (warstwy) i oddzielnie próbkujemy w każdej
warstwie.
Przykłady warstw:
• studentki i studenci
• grupy zawodowe
• regiony geograficzne
Czym jest statystyka?
Statystyka to nauka rozumienia danych i podejmowania decyzji w obliczu losowości.
Problem. Dana jest populacja pewnych elementów. Interesuje nas średnia tej populacji. Jak ją obliczyć
dokładnie? Jak ją oszacować szybko i małym kosztem ze stosunkowo dużą dokładnością? I jaka jest ta
dokładność?
Przykłady
Oto kilka konkretnych zadań, rozwiązywanych za pomocą statystyki.
• Ile haseł jest w tej 1000-stronicowej encyklopedii?
• Jaki jest średni czas bezawaryjnego działania urządzeń, które produkuje dana fabryka (np. żarówek)?
• Ile czerwonych krwinek w 1 mm3 krwi zawiera badana próbka?
• Gdyby dziś odbywały się wybory, to ilu ludzi głosowałoby na partię X?
• Czy większość Polaków wypowiada się za przywróceniem kary śmierci?
Liczba haseł w encyklopedii
Rozważmy pierwszy przykład. Ile haseł omawia dana encyklopedia?
• Jak liczbę haseł obliczyć dokładnie?
• Kto chciałby to zrobić i czy warto wkładać tyle wysiłku w tę, w gruncie rzeczy, mało istotną informację?
• Jak to zrobić, stosując statystykę?
• Ile średnio haseł jest na jednej stronie?
• Gdy to już wiemy, mnożymy średnią przez liczbę stron.
• Jak dokładne są takie obliczenia?
„Czas życia” żarówki
Ile czasu średnio świecą żarówki, które produkujemy?
3
• Tu nie można zbadać wszystkich żarówek!
• Czy na podstawie jednej żarówki możemy szacować czas świecenia całej populacji?
• Ile pomiarów trzeba przeprowadzić, aby ich średnia była dobrym odzwierciedleniem nieznanego średniego czasu świecenia?
Czerwone krwinki
• Jak je szybko policzyć? Wynik wychodzi w milionach!
Średnia z próby
• Symbol x oznacza liczbę — arytmetyczną średnią z obserwacji.
• Symbol X oznacza pojęcie średniej z próby.
Parametry średniej
Za chwilę wylosujemy z danej populacji (np. żarówki) n elementów. Czas świecenia (do przepalenia żarówki)
jest zmienną losową o nieznanym nam rozkładzie. Nie znamy też żadnych parametrów tego rozkładu, a
interesuje nas średnia.
• Niech X1 , X2 , ..., Xn będą czasami świecenia wylosowanych żarówek.
•
X=
X1 + X2 + ... + Xn
n
• Jaka jest wartość oczekiwana E(X)?
• Jaka wariancja V ar(X)?
Parametry X
Ponieważ zmienne X1 , X2 , ..., Xn pochodzą z jednej populacji, więc ich rozkład jest jednakowy (czy naprawdę
jest???). Oczywiście zarówno średnia, jak i wariancja są skończone.
•
E(X) = E
•
•
•
X1 + X2 + ... + Xn
n
=
1
(E(X1 ) + E(X2 ) + ... + E(Xn )) = E(X1 )
n
X1 + X2 + ... + Xn
V ar(X) = V ar
n
=
1
V ar(X1 )
(V ar(X1 ) + ... + V ar(Xn )) =
n2
n
Parametry X
Podsumujmy: w próbie prostej (tzn. gdy wszystkie zmienne są niezależne i mają jednakowy rozkład)
•
E(X) = E(X1 )
•
V ar(X) =
V ar(X1 )
n
• Wniosek: Im więcej prób, tym dokładniejszy wynik (wariancja maleje!).
4
Przykład
Dla próby n-elementowej z pewnej populacji V ar(X) = a. Jak dużą próbę należałoby wziąć, aby
• ta wariancja zmalała dwukrotnie?
• odchylenie standardowe zmalało dziesięciokrotnie?
Rozwiązanie
Wiemy, że V ar(X) =
V ar(X1 )
n
= a.
• Jeśli chcemy zmniejszyć wariancję dwukrotnie, to musimy dzielić przez dwa razy większą liczbę, czyli
należy dwukrotnie zwiększyć liczbę prób.
• Odchylenie standardowe to pierwiastek z wariancji:
s
σX =
V ar(X1 )
.
n
• Aby tę liczbę zmniejszyć dziesięciokrotnie, należy zwiększyć mianownik pod pierwiastkiem 100 razy.
• Odpowiedź: Trzeba zwiększyć liczbę prób z n do 100n.
Przedziały ufności Neymana
Jerzy Spława-Neyman (1894-1981), polski statystyk, w latach 1924-38 w Londynie, od 1938 pracował w
Berkeley.
Opracował (między innymi) teorię przedziałów ufności.
Definicja przedziału ufności
Niech cecha X ma w populacji rozkład z nieznanym parametrem θ. Z populacji wybieramy próbę losową
X1 , X2 , ..., Xn . Przedziałem ufności (θ1 , θ2 ) o poziomie ufności 1 − α nazywamy taki przedział, który
spełnia warunek:
P (θ1 < θ < θ2 ) = 1 − α,
gdzie θ1 i θ2 są funkcjami wyznaczonymi na podstawie próby losowej.
• Zazwyczaj poszukuje się przedziałów najkrótszych.
• Poziom ufności 1−α to prawdopodobieństwo, że rzeczywista wartość parametru θ w populacji znajduje
się w wyznaczonym przez nas przedziale ufności.
• W praktyce przyjmuje się zazwyczaj następujące wartości poziomu 1 − α: 0,99, 0,95 lub (rzadziej)
0,90.
Przedziały ufności dla wartości średniej
Załóżmy, że chcemy oszacować nieznaną wartość średnią m zmiennej losowej (cechy) X, której wariancję σ 2 znamy. Przyjmujemy jedno z dwu założeń:
2
• Zmienna X ma rozkład N (m, σ 2 ), wtedy X ∼ N (m, σn ) lub
• zmienna X ma rozkład różny od normalnego, ale próba jest na tyle duża (n > 30? n > 50?), że średnia
2
X ma w przybliżeniu rozkład N (m, σn ).
• Jeśli spełnione jest jedno z tych założeń, to
• zmienna
X − m√
n ma rozkład N (0, 1).
σ
5
Wyznaczanie przedziału ufności
Wybierzmy odpowiedni poziom ufności, na przykład 0,95.
• Skoro
X − m√
n ma rozkład N (0, 1),
σ
• to z tablic rozkładu normalnego można wyznaczyć taką liczbę zα , dla której
•
P (−zα <
X − m√
n < zα ) = 1 − α = 0, 95.
σ
• Przekształćmy wyrażenie w nawiasie tak, aby otrzymać nierówność dla nieznanej średniej m:
Wyznaczanie przedziału ufności
•
•
σ
σ
P (−zα √ < X − m < zα √ ) = 1 − α = 0, 95,
n
n
skąd
σ
σ
P (X − zα √ < m < X + zα √ ) = 1 − α = 0, 95.
n
n
• Szukanym przedziałem ufności dla m na poziomie ufności 1 − α jest więc przedział
•
σ
σ
.
X − zα √ , X + zα √
n
n
• Estymatorem nieznanej średniej m jest x, a margines błędu wynosi zα √σn .
Trzy najważniejsze poziomy ufności
Niech Z ∼ N (0, 1). Z tablic rozkładu normalnego N (0, 1) odczytujemy, że dla danego 1 − α, równego 0,9,
0,95 oraz 0,99:
• dla 0,9 mamy P (Z < 1, 65) = 0, 95, więc z0,9 = 1, 65
• dla 0,95 mamy P (Z < 1, 96) = 0, 975, więc z0,95 = 1, 96,
• dla 0,99 mamy P (Z < 2, 58) = 0, 995, więc z0,99 = 2, 58.
Długość przedziału ufności
Przy planowaniu eksperymentu (w tym liczebności próby) chcemy wiedzieć, z jaką dokładnością będziemy
znać m (margines błędu).
• Nieznana średnia m zawarta jest w przedziale
•
σ
σ
X − zα √ , X + zα √
n
n
• o długości
•
zα σ
2∆ = 2 √
n
• Znamy σ, dla wybranego α odczytujemy z tablic zα .
6
• Szerokość przedziału zależy zatem od
√
n.
Długość przedziału ufności
Jeśli zadana jest liczba ∆ (czyli połowa długości przedziału), to liczba prób, potrzebna do otrzymania
przedziału danej długości, jest równa
n = zα2
σ2
.
∆2
Przykład
Próba pobrana z dużej partii lamp zawiera 100 lamp. Średnia z próby długości świecenia lampy wynosi 1000
godzin. Na poziomie ufności 1 − α = 0, 95 wyznacz przedział ufności dla średniej długości świecenia lampy
z całej partii, jeśli wiadomo, że odchylenie standardowe wynosi σ = 40 godzin.
Rozwiązanie
Nie znamy rozkładu długości świecenia, ale próba n = 100 jest na tyle duża, że średnia X ma w przybliżeniu
2
402
).
rozkład N (m, σn ) czyli N (m, 100
• Zadany poziom ufności 1 − α = 0, 95.
• Szukamy takiej liczby zα , dla której P (−zα < Z < zα ) = 0, 95, skąd zα = 1, 96.
• Szukanym przedziałem ufności jest przedział 1000 − 1, 96 ·
• czyli (992, 16; 1007, 84).
7
40
10 ;
1000 + 1, 96 ·
40
10
,