1 Wykład 14 Jak duża powinna być próba?

Transkrypt

1 Wykład 14 Jak duża powinna być próba?
Wykład 14
Jak duża powinna być próba?
Załóżmy, że σ =10. Wtedy
• Poprzez wybór odpowiedniego n możemy
uzyskać PU o odpowiedniej (dowolnie
małej) szerokości
• Możemy estymować µ z zadaną precyzją
• Przykład: znajdź rozmiar próby taki, aby
95% PU dla średniej miał szerokość 5.
• Na ogół nie znamyσ, możemy jednak wykonać
badanie wstępne (mała próba) i użyć s.
Podstawowe założenie (jeszcze raz)
• Próba musi być losowa:
– każdy element w populacji ma jednakową
szansę być wybranym
– poszczególne wybory są od siebie niezależne
• Jeżeli to założenie nie jest spełnione to
wzrost n może nie gwarantować
zmniejszenia SE.
Przedział ufności dla frakcji w populacji
• Estymujemy p za pomocą p̂
• Chcemy skonstruować przedział ufności dla p
• Moglibyśmy skorzystać z rozkładu
dwumianowego, ale wymagałoby to uciążliwych
rachunków.
• Korzystamy z przybliżenia rozkładu Bernoulliego
rozkładem normalnym
• Gdy Y ma rozkład dwumianowy (n, p) i n jest
duże, wtedy Y ma w przybliżeniu rozkład
normalny
(
N np , np (1 − p )
•
)
p̂ = Y/n ma wartość oczekiwaną=
• Zatem
iσ=
p̂
ma w przybliżeniu rozkład
1
Przedział ufności dla p (cd.)
• Skonstruujemy przybliżony przedział ufności
dla p, z centrum w p̂
• Użyjemy kwantyli z rozkładu normalnego Zα/2
• Dla 95% PU użyjemy Z0.025 =1.96
• Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU
użyjemy Z0.005=2.58.
• przybliżony 95% PU dla p wynosi
pˆ ± 1.96 × SE pˆ = pˆ ± 1.96
Przykład:
• Złapano 125 myszy i 6 z nich ma brzuszki nakrapiane na
biało
• p = frakcja myszek w całej populacji, które mają
nakrapiane na biało brzuszki
• 95% PU dla p:
pˆ (1 − pˆ )
n
90% PU dla p
• Sformułowanie konkluzji:
Mamy 90% pewności że frakcja myszek w tej
populacji, które mają brzuszki nakrapiane na
biało zawiera się w przedziale między
a
.
• Zauważmy, że 90% PU jest
niż 95% PU.
Jak duża powinna być próba ?
• Chcemy aby 95% PU miał długość nie większą od
zadanej. Jak ustalić rozmiar próby?
• Idea: długość przedziału zależy od n, skąd można
wyznaczyć wystarczający rozmiar próby.
• Uwaga – długość przedziału zależy też od p̂, którego nie
znamy.
• Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej
przybliżonej wartości użyć w równaniu na długość
przedziału (skąd wyznaczymy n)
• Jeżeli nie mamy żadnych wstępnych informacji, to
użyjemy p = 0.5. Prowadzi to do ostrożnego wyboru n:
szerokość PU skonstruowanego w oparciu o próbę o
wyliczonym rozmiarze nie będzie większa od założonej, a
może być dużo mniejsza. (Czy to dobrze?)
Przykład
• Chcemy aby SE było równe 0.005 (95%
PU będzie miał długość około 0.02).
• Przypuszczamy, że prawdziwe p jest
bliskie 0.05. Rachunki:
• Konkluzja: „Proszę złapać
myszy.”
2
•
Obliczenia, gdy nie wiemy nic o p:
•
Konkluzja: „Proszę złapać
myszy.”
3