Elementarne metody statystyczne 3
Transkrypt
Elementarne metody statystyczne 3
Elementarne metody statystyczne 3 Przedziały tolerancji. Test zgodności χ2 Pearsona. Przedziały tolerancji 100Q− procentowym przedziałem tolerancji wyznaczonym dla cechy X na poziomie ufności q nazywamy przedział liczbowy, utworzony na podstawie próby losowej tej cechy, do którego z prawdopodobieństwem q należy 100Q procent wartości cechy X w populacji. Model 1. Załóżmy, że cecha X ma w populacji rozkład normalny N (m, σ) o nieznanych parametrach. Wówczas szukany przedział tolarancji dla cechy X ma postać: X ∈ x − Kn (Q, q)sb(x), x + Kn (Q, q)sb(x) , gdzie Kn (Q, q) = u 1+Q 2 s a sb(x) = 1 n−1 n P 5u2q + 10 uq 1+ √ + , 12n 2n (xi − x)2 (jest nieobciążonym estymatorem odchylenia standardowego σ). i=1 Oczywiście uα oznacza kwantyl rzędu α rozkładu normalnego standardowego. Model 2. Załóżmy, że w populacji cecha X ma rozkład o dowolnej, ale ciągłej dystrybuancie F (x). Minimalna liczebność próby losowej n gwarantująca, że z prawdopodobieństwem q do przedziału postaci X(1) , ∞) lub −∞, X(n) należy 100Q procent wartości cechy w populacji wynosi n1 (Q, q), którą to wielkość odczytujemy z tablic statystycznych (np. R. Zieliński, W. Zieliński „Tablice statystyczne”, PWN, Warszawa 1990). Wartości X(1) oraz X(n) oznaczają odpowiednio najmniejszą i największą wartość w próbie losowej cechy X. Podobnie, minimalna liczebność próby losowej potrzebna do tego, by w przedziale X(1) , X(n) z prawdopodobieństwem q zawartych było 100Q procent wartości cechy X w populacji wynosi n2 (Q, n) (odczytujemy z tablic). Z kolei, odczytywana z tablic wielkość n(m, Q, q) jest minimalną liczebnością próby losowej potrzebną do tego, by z prawdopodobieństwem q 100Q procent wartości cechy X w populacji znalazło się w przedziale X(r) , X(n−s+1) , gdzie m = r + s. Test zgodności χ2 Pearsona Test ten służy do weryfikacji hipotezy o zgodności dystrybuanty F (x) pewnej cechy X z ustaloną dystrybuantą F0 (x). Mamy zatem: H0 : F (x) = F0 (x), H1 : F (x) 6= F0 (x). Weryfikacji hipotezy H0 dokonuje się na podstawie próby losowej zgrupowanej w szereg rozn P (ni −npi )2 dzielczy (przedziałowy lub punktowy) za pomocą statystyki χ2 = , która przy zanpi i=1 łożeniu prawdziwości H0 ma rozkład chi-kwadrat o k − r − 1 stopniach swobody. Wartości k i r oznaczają odpowiednio liczbę klas (wariantów) szeregu rozdzielczego oraz liczbę parametrów dystrybuanty F0 (x) szacowanych za pomocą próby losowej. Zbiór krytyczny tego testu ma postać K = [χ2k−r−1,1−α , ∞), gdzie χ2k−r−1,1−α jest kwantylem rzędu 1 − α rozkładu chi-kwadrat o 1 k − r − 1 stopniach swobody, przy czym α oznacza poziom istotności testu. 1. Badaniu statystycznemu poddano czas wykonania pewnego elementu w zakładzie produkcyjnym. Próba losowa 50−elementowa dała następujące rezultaty (w sekundach): 17, 18, 23, 21, 24, 30, 18, 19, 20, 22, 25, 14, 32, 31, 27, 29, 20, 19, 34, 31, 18, 32, 19, 21, 23, 25, 26, 21, 30, 31, 18, 17, 30, 37, 34, 25, 21, 17, 30, 29, 21, 20, 17, 18, 21, 28, 21, 22, 20, 34. Przyjmując poziomy ufności q1 = 0.90 i q2 = 0.95 wyznaczyć 99-procentowe przedziały tolerancji dla badanej cechy. 2. Próba losowa wzrostu w pewnej grupie wiekowej dzieci dała następujące wyniki: Wzrost (cm) Liczba dzieci 140-144 23 144-148 30 148-152 54 152-156 27 156-160 26 Na poziomie ufności q = 0.95 skonstruuj przedział licznbowy, w którym znajdzie się 90 procent wartości cechy w populacji. 3. Jak liczną próbą losową należałoby dysponować, aby na poziomie ufności q = 0.99 95 procent wartości cechy X należało do jednostronnego przedziału tolerancji postaci X(1) , ∞ ? 4. Ile powinna wynosić liczebność próby losowej n, aby z prawdopodobieństwem q = 0.90 do przedziału postaci X(1) , X(n) należało 90 procent wartości cechy X w populacji ? 5. Wyznacz minimalną liczebność próby losowej potrzebnej do tego, by z prawdopodobień stwem q = 0.95 w przedziale X(2) , X(n−3) znalazło się 95 procent wartości pewnej badanej cechy X w populacji. 6. Obserwacji statystycznej poddano liczbę wykroczeń drogowych, polegających na przekroczeniu dozwolonej prędkości na pewnym odcinku drogi przelotowej, podczas kolejnych dni tygodnia. Wyniki przedstawia tabela: Dzień tygodnia Liczba wykroczeń poniedziałek 33 wtorek 32 środa 34 czwartek 40 piątek 54 sobota 31 niedziela 36 Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że rozkład liczby wykroczeń jest równomierny. 7. Dysponujemy następującymi danymi dotyczącymi liczby zgłoszeń w 400 losowo wybranych, trzysekundowych, okresach czasu pracy pewnej centrali telefonicznej: Liczba zgłoszeń Liczba okresów 0 1 51 142 2 3 101 52 4 5 28 16 6 10 Przyjmując α = 0.01, testem χ2 Pearsona zweryfikuj hipotezę o tym, że rozkład liczby zgłoszeń jest rozkładem Poissona. 8. Mamy następujące dane dotyczące czasu dojazdu z miejsca zamieszkania na uczelnię (w minutach) w ustalonym dniu zajęć dla 80 losowo wybranych studentów pewnego kierunku: 15, 23, 25, 34, 42, 64, 70, 18, 32, 35, 40, 42, 54, 51, 59, 50, 19, 20, 62, 80, 19, 24, 21, 54, 20, 90, 76, 50, 50, 19, 32, 36, 37, 42, 47, 50, 31, 31, 40, 82, 70, 75, 23, 31, 37, 45, 50, 16, 25, 24, 30, 43, 27, 45, 56, 43, 32, 21, 80, 16, 19, 76, 85, 43, 32, 32, 30, 45, 41, 19, 27, 29, 30, 34, 36, 54, 40, 67, 62, 40. 2 Dla powyższych danych skonstruuj szereg rozdzielczy przedziałowy, przyjmując jako dolną granicę pierwszej klasy minimalną wartość cechy w próbie. Następnie dla tak zgrupowanych danych testem χ2 zweryfikuj hipotezę o normalności rozkładu czasu dojazdu na uczelnię. Przyjmij α = 0.1. 9. Dane dotyczące wieku 100 losowo wybranych pracowników zatrudnionych w pewnym sektorze są następujące: Wiek Liczba pracowników 20-30 30-40 20 32 40-50 34 50-60 14 Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że rozkład wieku pracowników tego sektora jest zgodny z rozkładem N (m, 10). 3