Wykład 8. Przedziały ufności dla średniej 27 kwietnia 2007 Czym

Transkrypt

Wykład 8. Przedziały ufności dla średniej
27 kwietnia 2007
Czym jest statystyka?
Statystyka to nauka rozumienia danych i podejmowania decyzji w obliczu losowości.
Problem. Dana jest populacja pewnych elementów. Interesuje nas średnia tej populacji. Jak ją obliczyć
dokładnie? Jak ją oszacować szybko i małym kosztem ze stosunkowo dużą dokładnością? I jaka jest ta
dokładność?
Przykłady
Oto kilka konkretnych zadań, rozwiązywanych za pomocą statystyki.
• Ile haseł jest w tej 1000-stronicowej encyklopedii?
• Jaki jest średni czas bezawaryjnego działania urządzeń, które produkuje dana fabryka (np. żarówek)?
• Ile czerwonych krwinek w 1 mm3 krwi zawiera badana próbka?
• Gdyby dziś odbywały się wybory, to ilu ludzi głosowałoby na partię X?
• Czy większość Polaków wypowiada się za przywróceniem kary śmierci?
Liczba haseł w encyklopedii
Rozważmy pierwszy przykład. Ile haseł omawia dana encyklopedia?
• Jak liczbę haseł obliczyć dokładnie?
• Kto chciałby to zrobić i czy warto wkładać tyle wysiłku w tę, w gruncie rzeczy, mało istotną informację?
• Jak to zrobić, stosując statystykę?
• Ile średnio haseł jest na jednej stronie?
• Gdy to już wiemy, mnożymy średnią przez liczbę stron.
• Jak dokładne są takie obliczenia?
„Czas życia” żarówki
Ile czasu średnio świecą żarówki, które produkujemy?
• Tu nie można zbadać wszystkich żarówek!
• Czy na podstawie jednej żarówki możemy szacować czas świecenia całej populacji?
• Ile pomiarów trzeba przeprowadzić, aby ich średnia była dobrym odzwierciedleniem nieznanego średniego czasu świecenia?
Czerwone krwinki
• Jak je szybko policzyć?
• Wynik wychodzi w milionach!
Próba a populacja
Przypomnijmy:
1
• Populacja to zbiór, z którego losujemy próbę i który chcemy opisać.
• Próba to podzbiór populacji.
• Próba powinna być reprezentatywna dla populacji.
• Wnioskowanie statystyczne to wnioskowanie o populacji w oparciu o próbę.
Próba prosta
Prosta próba losowa:
• Każdy element populacji może być wybrany z tym samym prawdopodobieństwem.
• Wybory poszczególnych elementów są niezależne.
Średnia z próby
• Symbol x oznacza liczbę — arytmetyczną średnią z obserwacji.
• Symbol X oznacza pojęcie średniej z próby.
Parametry średniej
Za chwilę wylosujemy z danej populacji (np. żarówki) n elementów. Czas świecenia (do przepalenia żarówki)
jest zmienną losową o nieznanym nam rozkładzie. Nie znamy też żadnych parametrów tego rozkładu, a
interesuje nas średnia.
• Niech X1 , X2 , ..., Xn będą czasami świecenia wylosowanych żarówek.
•
X=
X1 + X2 + ... + Xn
n
• Jaka jest wartość oczekiwana E(X)?
• Jaka wariancja V ar(X)?
Parametry X
Ponieważ zmienne X1 , X2 , ..., Xn pochodzą z jednej populacji, więc ich rozkład jest jednakowy (czy naprawdę
jest???). Oczywiście zarówno średnia, jak i wariancja są skończone.
•
E(X) = E
•
•
•
X1 + X2 + ... + Xn
n
=
1
(E(X1 ) + E(X2 ) + ... + E(Xn )) = E(X1 )
n
X1 + X2 + ... + Xn
V ar(X) = V ar
n
=
1
V ar(X1 )
(V ar(X1 ) + ... + V ar(Xn )) =
2
n
n
Parametry X
Podsumujmy: w próbie prostej (tzn. gdy wszystkie zmienne są niezależne i mają jednakowy rozkład)
2
•
E(X) = E(X1 )
•
V ar(X) =
V ar(X1 )
n
• Wniosek: Im więcej prób, tym dokładniejszy wynik (wariancja maleje!).
Przykład
Dla próby n-elementowej z pewnej populacji V ar(X) = a. Jak dużą próbę należałoby wziąć, aby
• ta wariancja zmalała dwukrotnie?
• odchylenie standardowe zmalało dziesięciokrotnie?
Rozwiązanie
Wiemy, że V ar(X) =
V ar(X1 )
n
= a.
• Jeśli chcemy zmniejszyć wariancję dwukrotnie, to musimy dzielić przez dwa razy większą liczbę, czyli
należy dwukrotnie zwiększyć liczbę prób.
• Odchylenie standardowe to pierwiastek z wariancji:
s
σX =
V ar(X1 )
.
n
• Aby tę liczbę zmniejszyć dziesięciokrotnie, należy zwiększyć mianownik pod pierwiastkiem 100 razy.
• Odpowiedź: Trzeba zwiększyć liczbę prób z n do 100n.
Przedziały ufności Neymana
Jerzy Spława-Neyman (1894-1981), polski statystyk, w latach 1924-38 w Londynie, od 1938 pracował w
Berkeley.
Opracował (między innymi) teorię przedziałów ufności.
Definicja przedziału ufności
Niech cecha X ma w populacji rozkład z nieznanym parametrem θ. Z populacji wybieramy próbę losową
X1 , X2 , ..., Xn . Przedziałem ufności (θ1 , θ2 ) o poziomie ufności 1 − α nazywamy taki przedział, który
spełnia warunek:
P (θ1 < θ < θ2 ) = 1 − α,
gdzie θ1 i θ2 są funkcjami wyznaczonymi na podstawie próby losowej.
• Zazwyczaj poszukuje się przedziałów najkrótszych.
• Poziom ufności 1−α to prawdopodobieństwo, że rzeczywista wartość parametru θ w populacji znajduje
się w wyznaczonym przez nas przedziale ufności.
• W praktyce przyjmuje się zazwyczaj następujące wartości poziomu 1 − α: 0,99, 0,95 lub (rzadziej)
0,90.
Przedziały ufności dla wartości średniej
Załóżmy, że chcemy oszacować nieznaną wartość średnią m zmiennej losowej (cechy) X, której wariancję σ 2 znamy. Przyjmujemy jedno z dwu założeń:
3
2
• Zmienna X ma rozkład N (m, σ 2 ), wtedy X ∼ N (m, σn ),
• lub
• zmienna X ma rozkład różny od normalnego, ale próba jest na tyle duża (n > 30? n > 50?), że średnia
2
X ma w przybliżeniu rozkład N (m, σn ).
• Jeśli spełnione jest jedno z tych założeń, to
• zmienna
X − m√
n ma rozkład N (0, 1).
σ
Wyznaczanie przedziału ufności
Wybierzmy odpowiedni poziom ufności, na przykład 0,95.
• Skoro
X − m√
n ma rozkład N (0, 1),
σ
• to z tablic rozkładu normalnego można wyznaczyć taką liczbę zα , dla której
•
P (−zα <
X − m√
n < zα ) = 1 − α = 0, 95.
σ
• Przekształćmy wyrażenie w nawiasie tak, aby otrzymać nierówność dla nieznanej średniej m:
Wyznaczanie przedziału ufności
•
•
σ
σ
P (−zα √ < X − m < zα √ ) = 1 − α = 0, 95,
n
n
skąd
σ
σ
P (X − zα √ < m < X + zα √ ) = 1 − α = 0, 95.
n
n
• Szukanym przedziałem ufności dla m na poziomie ufności 1 − α jest więc przedział
•
σ
σ
X − z α √ , X + zα √
.
n
n
• Estymatorem nieznanej średniej m jest x, a margines błędu wynosi zα √σn .
Trzy najważniejsze poziomy ufności
Niech Z ∼ N (0, 1). Z tablic rozkładu normalnego N (0, 1) odczytujemy, że dla danego 1 − α, równego 0,9,
0,95 oraz 0,99:
• dla 0,9 mamy P (Z < 1, 65) = 0, 95, więc z0,9 = 1, 65
• dla 0,95 mamy P (Z < 1, 96) = 0, 975, więc z0,95 = 1, 96,
• dla 0,99 mamy P (Z < 2, 58) = 0, 995, więc z0,99 = 2, 58.
Długość przedziału ufności
Przy planowaniu eksperymentu (w tym liczebności próby) chcemy wiedzieć, z jaką dokładnością będziemy
znać m (margines błędu).
• Nieznana średnia m zawarta jest w przedziale
4
•
σ
σ
X − zα √ , X + zα √
n
n
• o długości
•
zα σ
2∆ = 2 √
n
• Znamy σ, dla wybranego α odczytujemy z tablic zα .
√
• Szerokość przedziału zależy zatem od n.
Długość przedziału ufności
Jeśli zadana jest liczba ∆ (czyli połowa długości przedziału), to liczba prób, potrzebna do otrzymania
przedziału danej długości, jest równa
n = zα2
σ2
.
∆2
Przykład
Próba pobrana z dużej partii lamp zawiera 100 lamp. Średnia z próby długości świecenia lampy wynosi 1000
godzin. Na poziomie ufności 1 − α = 0, 95 wyznacz przedział ufności dla średniej długości świecenia lampy
z całej partii, jeśli wiadomo, że odchylenie standardowe wynosi σ = 40 godzin.
Rozwiązanie
Nie znamy rozkładu długości świecenia, ale próba n = 100 jest na tyle duża, że średnia X ma w przybliżeniu
2
402
rozkład N (m, σn ) czyli N (m, 100
).
• Zadany poziom ufności 1 − α = 0, 95.
• Szukamy takiej liczby zα , dla której P (−zα < Z < zα ) = 0, 95, skąd zα = 1, 96.
• Szukanym przedziałem ufności jest przedział 1000 − 1, 96 ·
40
10 ;
1000 + 1, 96 ·
40
10
,
• czyli (992, 16; 1007, 84).
A gdy nie znamy wariancji σ 2 ?
W bardzo wielu przypadkach wartość σ nie jest znana. Jak wtedy szacować wartość średnią m?
Przypomnijmy, że
S2 =
n
1 X
(Xi − X)2
n − 1 i=1
Wtedy statystyka
X − m√
n
S
ma rozkład t-Studenta o n − 1 stopniach swobody.
Używać S czy Ŝ?
Określiliśmy dwie, bardzo podobne statystyki:
S=√
1
n−1
v
u n
uX
t (Xi − X)2 ,
i=1
5
v
u n
1 uX
Ŝ = √ t (Xi − X)2 .
n
i=1
X − m√
n − 1 też ma rozkład t-Studenta
Ŝ
o n − 1 stopniach swobody.
Statystyka
Uwaga: Oczywiście
√
n − 1S =
√
n Ŝ, więc
X − m√
X − m√
n=
n − 1.
S
Ŝ
Kim był Student?
Praca na temat tego rozkładu została opublikowana w czasopiśmie Biometrika w 1908 roku.
• Dlaczego praca podpisana była pseudonimem?
• Londyn — najważniejszy ośrodek statystyki na świecie.
• Karl Pearson (1857 - 1936) wprowadził np. termin odchylenie standardowe, test χ2 -Pearsona itp.
• Egon Pearson (1895-1980) współpracował z Jerzym Spławą-Neymanem, był synem Karla Pearsona.
• William Gosset „Student”.
Rozkład t-Studenta
Rozkład Studenta jest (na pierwszy rzut oka) podobny do rozkładu normalnego, ma jednak „ciężkie ogony”.
• Kształt jego gęstości zależy od liczby stopni swobody.
• Dla n = 1 ma nieskończoną wartość oczekiwaną.
• Gdy n → ∞, to rozkład Studenta zbliża się do rozkładu normalnego tak, że
• dla n > 30 różnica pomiedzy tymi rozkładami jest niewielka.
• Tablice rozkładu Studenta podają zwykle tylko wartości dla n ¬ 30 stopni swobody.
Zadanie
Znajdź dwie symetryczne wartości −tα i tα takie, że między nimi zawiera się 0,95 masy rozkładu Studenta
z 11 stopniami swobody.
• Rozwiązanie.
• Niech Tk oznacza zmienną o rozkładzie studenta z k stopniami swobody.
• Szukamy takiego t, dla którego
• P (T11 < t) = 0, 975.
• Z tablic t = 2, 2010.
• Odpowiedź: −tα = −2, 2010, tα = 2, 2010.
Zadanie
Wytrzymałość pewnego materiału budowlanego ma rozkład normalny N (m, σ 2 ).
Pięcioelementowa próba wylosowanych sztuk tego materiału dała wyniki: x̄ = 20, 8 N/cm2 , ŝ = 2, 8N/cm2 .
Na poziomie ufności 0,99 zbuduj przedział ufności dla średniej m.
Rozwiązanie
Nie znamy wartości parametru σ, a próba ma liczebność n < 30, więc musimy użyć rozkładu t-Studenta.
6
• Wiemy, że
X − m√
n−1
Ŝ
• ma rozkład Studenta o 4 stopniach swobody.
• Dla poziomu ufności 0,99 i 4 stopni swobody odczytujemy z tablic t = 4, 6041
• Zatem
!
P
X − m√
−4, 6041 <
n − 1 < 4, 6041
Ŝ
= 0, 99,
• co daje przedział (14, 36; 27, 24).
A jeśli przedział jest zbyt szeroki?
Zwiększając liczbę pomiarów w próbie, możemy zmniejszyć długość przedziału ufności.
Gdy stosujemy rozkład t-Studenta powinniśmy zwracać baczną uwagę na:
• liczbę stopni swobody,
• rodzaj statystyki, jaki stosujemy: S czy też Ŝ.
• Jeśli jest więcej niż 30 obserwacji w próbie, to korzystamy z tablic rozkładu normalnego.
7

Wykład 8. Przedziały ufności dla średniej 27 kwietnia 2007 Czym

Transkrypt

Podobne dokumenty

Przedziały ufności dla wariancji i odchylenia standardowego. Model

CW2 MEWS

zadania

Lista 6

Rachunek prawdopodobieństwa i statystyka matematyczna 16

Wykład 8. Przedziały ufności i testowanie hipotez A gdy nie znamy

371 Dlaczego nie lubię skali staninowej?

Kazanie o Miłosierdziu Bożym Ufność lekarstwem na lęk

Ćwiczenia 5 - ESTYMACJA Zadanie 1. Oszacować - E-SGH

STATYSTYKA MATEMATYCZNA Zestaw 3. Estymacja przedziałowa

powiedzmy

wykład

Wykład