Wykład 8. Przedziały ufności dla średniej 27 kwietnia 2007 Czym

Transkrypt

Wykład 8. Przedziały ufności dla średniej 27 kwietnia 2007 Czym
Wykład 8. Przedziały ufności dla średniej
27 kwietnia 2007
Czym jest statystyka?
Statystyka to nauka rozumienia danych i podejmowania decyzji w obliczu losowości.
Problem. Dana jest populacja pewnych elementów. Interesuje nas średnia tej populacji. Jak ją obliczyć
dokładnie? Jak ją oszacować szybko i małym kosztem ze stosunkowo dużą dokładnością? I jaka jest ta
dokładność?
Przykłady
Oto kilka konkretnych zadań, rozwiązywanych za pomocą statystyki.
• Ile haseł jest w tej 1000-stronicowej encyklopedii?
• Jaki jest średni czas bezawaryjnego działania urządzeń, które produkuje dana fabryka (np. żarówek)?
• Ile czerwonych krwinek w 1 mm3 krwi zawiera badana próbka?
• Gdyby dziś odbywały się wybory, to ilu ludzi głosowałoby na partię X?
• Czy większość Polaków wypowiada się za przywróceniem kary śmierci?
Liczba haseł w encyklopedii
Rozważmy pierwszy przykład. Ile haseł omawia dana encyklopedia?
• Jak liczbę haseł obliczyć dokładnie?
• Kto chciałby to zrobić i czy warto wkładać tyle wysiłku w tę, w gruncie rzeczy, mało istotną informację?
• Jak to zrobić, stosując statystykę?
• Ile średnio haseł jest na jednej stronie?
• Gdy to już wiemy, mnożymy średnią przez liczbę stron.
• Jak dokładne są takie obliczenia?
„Czas życia” żarówki
Ile czasu średnio świecą żarówki, które produkujemy?
• Tu nie można zbadać wszystkich żarówek!
• Czy na podstawie jednej żarówki możemy szacować czas świecenia całej populacji?
• Ile pomiarów trzeba przeprowadzić, aby ich średnia była dobrym odzwierciedleniem nieznanego średniego czasu świecenia?
Czerwone krwinki
• Jak je szybko policzyć?
• Wynik wychodzi w milionach!
Próba a populacja
Przypomnijmy:
1
• Populacja to zbiór, z którego losujemy próbę i który chcemy opisać.
• Próba to podzbiór populacji.
• Próba powinna być reprezentatywna dla populacji.
• Wnioskowanie statystyczne to wnioskowanie o populacji w oparciu o próbę.
Próba prosta
Prosta próba losowa:
• Każdy element populacji może być wybrany z tym samym prawdopodobieństwem.
• Wybory poszczególnych elementów są niezależne.
Średnia z próby
• Symbol x oznacza liczbę — arytmetyczną średnią z obserwacji.
• Symbol X oznacza pojęcie średniej z próby.
Parametry średniej
Za chwilę wylosujemy z danej populacji (np. żarówki) n elementów. Czas świecenia (do przepalenia żarówki)
jest zmienną losową o nieznanym nam rozkładzie. Nie znamy też żadnych parametrów tego rozkładu, a
interesuje nas średnia.
• Niech X1 , X2 , ..., Xn będą czasami świecenia wylosowanych żarówek.
•
X=
X1 + X2 + ... + Xn
n
• Jaka jest wartość oczekiwana E(X)?
• Jaka wariancja V ar(X)?
Parametry X
Ponieważ zmienne X1 , X2 , ..., Xn pochodzą z jednej populacji, więc ich rozkład jest jednakowy (czy naprawdę
jest???). Oczywiście zarówno średnia, jak i wariancja są skończone.
•
E(X) = E
•
•
•
X1 + X2 + ... + Xn
n
=
1
(E(X1 ) + E(X2 ) + ... + E(Xn )) = E(X1 )
n
X1 + X2 + ... + Xn
V ar(X) = V ar
n
=
1
V ar(X1 )
(V ar(X1 ) + ... + V ar(Xn )) =
2
n
n
Parametry X
Podsumujmy: w próbie prostej (tzn. gdy wszystkie zmienne są niezależne i mają jednakowy rozkład)
2
•
E(X) = E(X1 )
•
V ar(X) =
V ar(X1 )
n
• Wniosek: Im więcej prób, tym dokładniejszy wynik (wariancja maleje!).
Przykład
Dla próby n-elementowej z pewnej populacji V ar(X) = a. Jak dużą próbę należałoby wziąć, aby
• ta wariancja zmalała dwukrotnie?
• odchylenie standardowe zmalało dziesięciokrotnie?
Rozwiązanie
Wiemy, że V ar(X) =
V ar(X1 )
n
= a.
• Jeśli chcemy zmniejszyć wariancję dwukrotnie, to musimy dzielić przez dwa razy większą liczbę, czyli
należy dwukrotnie zwiększyć liczbę prób.
• Odchylenie standardowe to pierwiastek z wariancji:
s
σX =
V ar(X1 )
.
n
• Aby tę liczbę zmniejszyć dziesięciokrotnie, należy zwiększyć mianownik pod pierwiastkiem 100 razy.
• Odpowiedź: Trzeba zwiększyć liczbę prób z n do 100n.
Przedziały ufności Neymana
Jerzy Spława-Neyman (1894-1981), polski statystyk, w latach 1924-38 w Londynie, od 1938 pracował w
Berkeley.
Opracował (między innymi) teorię przedziałów ufności.
Definicja przedziału ufności
Niech cecha X ma w populacji rozkład z nieznanym parametrem θ. Z populacji wybieramy próbę losową
X1 , X2 , ..., Xn . Przedziałem ufności (θ1 , θ2 ) o poziomie ufności 1 − α nazywamy taki przedział, który
spełnia warunek:
P (θ1 < θ < θ2 ) = 1 − α,
gdzie θ1 i θ2 są funkcjami wyznaczonymi na podstawie próby losowej.
• Zazwyczaj poszukuje się przedziałów najkrótszych.
• Poziom ufności 1−α to prawdopodobieństwo, że rzeczywista wartość parametru θ w populacji znajduje
się w wyznaczonym przez nas przedziale ufności.
• W praktyce przyjmuje się zazwyczaj następujące wartości poziomu 1 − α: 0,99, 0,95 lub (rzadziej)
0,90.
Przedziały ufności dla wartości średniej
Załóżmy, że chcemy oszacować nieznaną wartość średnią m zmiennej losowej (cechy) X, której wariancję σ 2 znamy. Przyjmujemy jedno z dwu założeń:
3
2
• Zmienna X ma rozkład N (m, σ 2 ), wtedy X ∼ N (m, σn ),
• lub
• zmienna X ma rozkład różny od normalnego, ale próba jest na tyle duża (n > 30? n > 50?), że średnia
2
X ma w przybliżeniu rozkład N (m, σn ).
• Jeśli spełnione jest jedno z tych założeń, to
• zmienna
X − m√
n ma rozkład N (0, 1).
σ
Wyznaczanie przedziału ufności
Wybierzmy odpowiedni poziom ufności, na przykład 0,95.
• Skoro
X − m√
n ma rozkład N (0, 1),
σ
• to z tablic rozkładu normalnego można wyznaczyć taką liczbę zα , dla której
•
P (−zα <
X − m√
n < zα ) = 1 − α = 0, 95.
σ
• Przekształćmy wyrażenie w nawiasie tak, aby otrzymać nierówność dla nieznanej średniej m:
Wyznaczanie przedziału ufności
•
•
σ
σ
P (−zα √ < X − m < zα √ ) = 1 − α = 0, 95,
n
n
skąd
σ
σ
P (X − zα √ < m < X + zα √ ) = 1 − α = 0, 95.
n
n
• Szukanym przedziałem ufności dla m na poziomie ufności 1 − α jest więc przedział
•
σ
σ
X − z α √ , X + zα √
.
n
n
• Estymatorem nieznanej średniej m jest x, a margines błędu wynosi zα √σn .
Trzy najważniejsze poziomy ufności
Niech Z ∼ N (0, 1). Z tablic rozkładu normalnego N (0, 1) odczytujemy, że dla danego 1 − α, równego 0,9,
0,95 oraz 0,99:
• dla 0,9 mamy P (Z < 1, 65) = 0, 95, więc z0,9 = 1, 65
• dla 0,95 mamy P (Z < 1, 96) = 0, 975, więc z0,95 = 1, 96,
• dla 0,99 mamy P (Z < 2, 58) = 0, 995, więc z0,99 = 2, 58.
Długość przedziału ufności
Przy planowaniu eksperymentu (w tym liczebności próby) chcemy wiedzieć, z jaką dokładnością będziemy
znać m (margines błędu).
• Nieznana średnia m zawarta jest w przedziale
4
•
σ
σ
X − zα √ , X + zα √
n
n
• o długości
•
zα σ
2∆ = 2 √
n
• Znamy σ, dla wybranego α odczytujemy z tablic zα .
√
• Szerokość przedziału zależy zatem od n.
Długość przedziału ufności
Jeśli zadana jest liczba ∆ (czyli połowa długości przedziału), to liczba prób, potrzebna do otrzymania
przedziału danej długości, jest równa
n = zα2
σ2
.
∆2
Przykład
Próba pobrana z dużej partii lamp zawiera 100 lamp. Średnia z próby długości świecenia lampy wynosi 1000
godzin. Na poziomie ufności 1 − α = 0, 95 wyznacz przedział ufności dla średniej długości świecenia lampy
z całej partii, jeśli wiadomo, że odchylenie standardowe wynosi σ = 40 godzin.
Rozwiązanie
Nie znamy rozkładu długości świecenia, ale próba n = 100 jest na tyle duża, że średnia X ma w przybliżeniu
2
402
rozkład N (m, σn ) czyli N (m, 100
).
• Zadany poziom ufności 1 − α = 0, 95.
• Szukamy takiej liczby zα , dla której P (−zα < Z < zα ) = 0, 95, skąd zα = 1, 96.
• Szukanym przedziałem ufności jest przedział 1000 − 1, 96 ·
40
10 ;
1000 + 1, 96 ·
40
10
,
• czyli (992, 16; 1007, 84).
A gdy nie znamy wariancji σ 2 ?
W bardzo wielu przypadkach wartość σ nie jest znana. Jak wtedy szacować wartość średnią m?
Przypomnijmy, że
S2 =
n
1 X
(Xi − X)2
n − 1 i=1
Wtedy statystyka
X − m√
n
S
ma rozkład t-Studenta o n − 1 stopniach swobody.
Używać S czy Ŝ?
Określiliśmy dwie, bardzo podobne statystyki:
S=√
1
n−1
v
u n
uX
t (Xi − X)2 ,
i=1
5
v
u n
1 uX
Ŝ = √ t (Xi − X)2 .
n
i=1
X − m√
n − 1 też ma rozkład t-Studenta
Ŝ
o n − 1 stopniach swobody.
Statystyka
Uwaga: Oczywiście
√
n − 1S =
√
n Ŝ, więc
X − m√
X − m√
n=
n − 1.
S
Ŝ
Kim był Student?
Praca na temat tego rozkładu została opublikowana w czasopiśmie Biometrika w 1908 roku.
• Dlaczego praca podpisana była pseudonimem?
• Londyn — najważniejszy ośrodek statystyki na świecie.
• Karl Pearson (1857 - 1936) wprowadził np. termin odchylenie standardowe, test χ2 -Pearsona itp.
• Egon Pearson (1895-1980) współpracował z Jerzym Spławą-Neymanem, był synem Karla Pearsona.
• William Gosset „Student”.
Rozkład t-Studenta
Rozkład Studenta jest (na pierwszy rzut oka) podobny do rozkładu normalnego, ma jednak „ciężkie ogony”.
• Kształt jego gęstości zależy od liczby stopni swobody.
• Dla n = 1 ma nieskończoną wartość oczekiwaną.
• Gdy n → ∞, to rozkład Studenta zbliża się do rozkładu normalnego tak, że
• dla n > 30 różnica pomiedzy tymi rozkładami jest niewielka.
• Tablice rozkładu Studenta podają zwykle tylko wartości dla n ¬ 30 stopni swobody.
Zadanie
Znajdź dwie symetryczne wartości −tα i tα takie, że między nimi zawiera się 0,95 masy rozkładu Studenta
z 11 stopniami swobody.
• Rozwiązanie.
• Niech Tk oznacza zmienną o rozkładzie studenta z k stopniami swobody.
• Szukamy takiego t, dla którego
• P (T11 < t) = 0, 975.
• Z tablic t = 2, 2010.
• Odpowiedź: −tα = −2, 2010, tα = 2, 2010.
Zadanie
Wytrzymałość pewnego materiału budowlanego ma rozkład normalny N (m, σ 2 ).
Pięcioelementowa próba wylosowanych sztuk tego materiału dała wyniki: x̄ = 20, 8 N/cm2 , ŝ = 2, 8N/cm2 .
Na poziomie ufności 0,99 zbuduj przedział ufności dla średniej m.
Rozwiązanie
Nie znamy wartości parametru σ, a próba ma liczebność n < 30, więc musimy użyć rozkładu t-Studenta.
6
• Wiemy, że
X − m√
n−1
Ŝ
• ma rozkład Studenta o 4 stopniach swobody.
• Dla poziomu ufności 0,99 i 4 stopni swobody odczytujemy z tablic t = 4, 6041
• Zatem
!
P
X − m√
−4, 6041 <
n − 1 < 4, 6041
Ŝ
= 0, 99,
• co daje przedział (14, 36; 27, 24).
A jeśli przedział jest zbyt szeroki?
Zwiększając liczbę pomiarów w próbie, możemy zmniejszyć długość przedziału ufności.
Gdy stosujemy rozkład t-Studenta powinniśmy zwracać baczną uwagę na:
• liczbę stopni swobody,
• rodzaj statystyki, jaki stosujemy: S czy też Ŝ.
• Jeśli jest więcej niż 30 obserwacji w próbie, to korzystamy z tablic rozkładu normalnego.
7