1 Wykład 14 Jak duża powinna być próba?
Transkrypt
1 Wykład 14 Jak duża powinna być próba?
Wykład 14 Jak duża powinna być próba? Załóżmy, że σ =10. Wtedy • Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości • Możemy estymować µ z zadaną precyzją • Przykład: znajdź rozmiar próby taki, aby 95% PU dla średniej miał szerokość 5. • Na ogół nie znamyσ, możemy jednak wykonać badanie wstępne (mała próba) i użyć s. Podstawowe założenie (jeszcze raz) • Próba musi być losowa: – każdy element w populacji ma jednakową szansę być wybranym – poszczególne wybory są od siebie niezależne • Jeżeli to założenie nie jest spełnione to wzrost n może nie gwarantować zmniejszenia SE. Przedział ufności dla frakcji w populacji • Estymujemy p za pomocą p̂ • Chcemy skonstruować przedział ufności dla p • Moglibyśmy skorzystać z rozkładu dwumianowego, ale wymagałoby to uciążliwych rachunków. • Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym • Gdy Y ma rozkład dwumianowy (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład normalny ( N np , np (1 − p ) • ) p̂ = Y/n ma wartość oczekiwaną= • Zatem iσ= p̂ ma w przybliżeniu rozkład 1 Przedział ufności dla p (cd.) • Skonstruujemy przybliżony przedział ufności dla p, z centrum w p̂ • Użyjemy kwantyli z rozkładu normalnego Zα/2 • Dla 95% PU użyjemy Z0.025 =1.96 • Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58. • przybliżony 95% PU dla p wynosi pˆ ± 1.96 × SE pˆ = pˆ ± 1.96 Przykład: • Złapano 125 myszy i 6 z nich ma brzuszki nakrapiane na biało • p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki • 95% PU dla p: pˆ (1 − pˆ ) n 90% PU dla p • Sformułowanie konkluzji: Mamy 90% pewności że frakcja myszek w tej populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a . • Zauważmy, że 90% PU jest niż 95% PU. Jak duża powinna być próba ? • Chcemy aby 95% PU miał długość nie większą od zadanej. Jak ustalić rozmiar próby? • Idea: długość przedziału zależy od n, skąd można wyznaczyć wystarczający rozmiar próby. • Uwaga – długość przedziału zależy też od p̂, którego nie znamy. • Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej przybliżonej wartości użyć w równaniu na długość przedziału (skąd wyznaczymy n) • Jeżeli nie mamy żadnych wstępnych informacji, to użyjemy p = 0.5. Prowadzi to do ostrożnego wyboru n: szerokość PU skonstruowanego w oparciu o próbę o wyliczonym rozmiarze nie będzie większa od założonej, a może być dużo mniejsza. (Czy to dobrze?) Przykład • Chcemy aby SE było równe 0.005 (95% PU będzie miał długość około 0.02). • Przypuszczamy, że prawdziwe p jest bliskie 0.05. Rachunki: • Konkluzja: „Proszę złapać myszy.” 2 • Obliczenia, gdy nie wiemy nic o p: • Konkluzja: „Proszę złapać myszy.” 3