Elementarne metody statystyczne 3

Transkrypt

Elementarne metody statystyczne 3
Elementarne metody statystyczne 3
Przedziały tolerancji. Test zgodności χ2 Pearsona.
Przedziały tolerancji
100Q− procentowym przedziałem tolerancji wyznaczonym dla cechy X na poziomie ufności
q nazywamy przedział liczbowy, utworzony na podstawie próby losowej tej cechy, do którego z
prawdopodobieństwem q należy 100Q procent wartości cechy X w populacji.
Model 1. Załóżmy, że cecha X ma w populacji rozkład normalny N (m, σ) o nieznanych parametrach. Wówczas szukany przedział tolarancji dla cechy X ma postać:
X ∈ x − Kn (Q, q)sb(x), x + Kn (Q, q)sb(x) ,
gdzie
Kn (Q, q) = u 1+Q
2
s
a sb(x) =
1
n−1
n
P
5u2q + 10 uq
1+ √ +
,
12n
2n
(xi − x)2 (jest nieobciążonym estymatorem odchylenia standardowego σ).
i=1
Oczywiście uα oznacza kwantyl rzędu α rozkładu normalnego standardowego.
Model 2. Załóżmy, że w populacji cecha X ma rozkład o dowolnej, ale ciągłej dystrybuancie F (x). Minimalna liczebność
próby
losowej n gwarantująca, że z prawdopodobieństwem q
do przedziału postaci X(1) , ∞) lub −∞, X(n) należy 100Q procent wartości cechy w populacji wynosi n1 (Q, q), którą to wielkość odczytujemy z tablic statystycznych (np. R. Zieliński,
W. Zieliński „Tablice statystyczne”, PWN, Warszawa 1990). Wartości X(1) oraz X(n) oznaczają
odpowiednio najmniejszą i największą wartość w próbie losowej cechy X.
Podobnie, minimalna liczebność próby losowej potrzebna do tego, by w przedziale X(1) , X(n)
z prawdopodobieństwem q zawartych było 100Q procent wartości cechy X w populacji wynosi
n2 (Q, n) (odczytujemy z tablic).
Z kolei, odczytywana z tablic wielkość n(m, Q, q) jest minimalną liczebnością próby losowej
potrzebną do tego, by z prawdopodobieństwem
q 100Q procent wartości cechy X w populacji
znalazło się w przedziale X(r) , X(n−s+1) , gdzie m = r + s.
Test zgodności χ2 Pearsona
Test ten służy do weryfikacji hipotezy o zgodności dystrybuanty F (x) pewnej cechy X
z ustaloną dystrybuantą F0 (x). Mamy zatem:
H0 : F (x) = F0 (x),
H1 : F (x) 6= F0 (x).
Weryfikacji hipotezy H0 dokonuje się na podstawie próby losowej zgrupowanej w szereg rozn
P
(ni −npi )2
dzielczy (przedziałowy lub punktowy) za pomocą statystyki χ2 =
, która przy zanpi
i=1
łożeniu prawdziwości H0 ma rozkład chi-kwadrat o k − r − 1 stopniach swobody. Wartości k i
r oznaczają odpowiednio liczbę klas (wariantów) szeregu rozdzielczego oraz liczbę parametrów
dystrybuanty F0 (x) szacowanych za pomocą próby losowej. Zbiór krytyczny tego testu ma postać K = [χ2k−r−1,1−α , ∞), gdzie χ2k−r−1,1−α jest kwantylem rzędu 1 − α rozkładu chi-kwadrat o
1
k − r − 1 stopniach swobody, przy czym α oznacza poziom istotności testu.
1. Badaniu statystycznemu poddano czas wykonania pewnego elementu w zakładzie produkcyjnym. Próba losowa 50−elementowa dała następujące rezultaty (w sekundach):
17, 18, 23, 21, 24, 30, 18, 19, 20, 22, 25, 14, 32, 31, 27, 29, 20, 19, 34, 31, 18, 32, 19, 21, 23,
25, 26, 21, 30, 31, 18, 17, 30, 37, 34, 25, 21, 17, 30, 29, 21, 20, 17, 18, 21, 28, 21, 22, 20, 34.
Przyjmując poziomy ufności q1 = 0.90 i q2 = 0.95 wyznaczyć 99-procentowe przedziały tolerancji dla badanej cechy.
2. Próba losowa wzrostu w pewnej grupie wiekowej dzieci dała następujące wyniki:
Wzrost (cm)
Liczba dzieci
140-144
23
144-148
30
148-152
54
152-156
27
156-160
26
Na poziomie ufności q = 0.95 skonstruuj przedział licznbowy, w którym znajdzie się 90 procent
wartości cechy w populacji.
3. Jak liczną próbą losową należałoby dysponować, aby na poziomie ufności q = 0.99 95 procent
wartości cechy X należało do jednostronnego przedziału tolerancji postaci X(1) , ∞ ?
4. Ile powinna wynosić
liczebność
próby losowej n, aby z prawdopodobieństwem q = 0.90 do
przedziału postaci X(1) , X(n) należało 90 procent wartości cechy X w populacji ?
5. Wyznacz minimalną liczebność
próby losowej
potrzebnej do tego, by z prawdopodobień
stwem q = 0.95 w przedziale X(2) , X(n−3) znalazło się 95 procent wartości pewnej badanej
cechy X w populacji.
6. Obserwacji statystycznej poddano liczbę wykroczeń drogowych, polegających na przekroczeniu dozwolonej prędkości na pewnym odcinku drogi przelotowej, podczas kolejnych dni tygodnia. Wyniki przedstawia tabela:
Dzień tygodnia
Liczba wykroczeń
poniedziałek
33
wtorek
32
środa
34
czwartek
40
piątek
54
sobota
31
niedziela
36
Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że rozkład liczby wykroczeń jest równomierny.
7. Dysponujemy następującymi danymi dotyczącymi liczby zgłoszeń w 400 losowo wybranych,
trzysekundowych, okresach czasu pracy pewnej centrali telefonicznej:
Liczba zgłoszeń
Liczba okresów
0
1
51 142
2
3
101 52
4 5
28 16
6
10
Przyjmując α = 0.01, testem χ2 Pearsona zweryfikuj hipotezę o tym, że rozkład liczby zgłoszeń
jest rozkładem Poissona.
8. Mamy następujące dane dotyczące czasu dojazdu z miejsca zamieszkania na uczelnię (w
minutach) w ustalonym dniu zajęć dla 80 losowo wybranych studentów pewnego kierunku:
15, 23, 25, 34, 42, 64, 70, 18, 32, 35, 40, 42, 54, 51, 59, 50, 19, 20, 62, 80,
19, 24, 21, 54, 20, 90, 76, 50, 50, 19, 32, 36, 37, 42, 47, 50, 31, 31, 40, 82,
70, 75, 23, 31, 37, 45, 50, 16, 25, 24, 30, 43, 27, 45, 56, 43, 32, 21, 80, 16,
19, 76, 85, 43, 32, 32, 30, 45, 41, 19, 27, 29, 30, 34, 36, 54, 40, 67, 62, 40.
2
Dla powyższych danych skonstruuj szereg rozdzielczy przedziałowy, przyjmując jako dolną granicę pierwszej klasy minimalną wartość cechy w próbie. Następnie dla tak zgrupowanych danych testem χ2 zweryfikuj hipotezę o normalności rozkładu czasu dojazdu na uczelnię. Przyjmij
α = 0.1.
9. Dane dotyczące wieku 100 losowo wybranych pracowników zatrudnionych w pewnym sektorze są następujące:
Wiek
Liczba pracowników
20-30 30-40
20
32
40-50
34
50-60
14
Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że rozkład wieku pracowników tego sektora
jest zgodny z rozkładem N (m, 10).
3