Inżynierskie zastosowania statystyki — ćwiczenia

Transkrypt

Inżynierskie zastosowania statystyki — ćwiczenia
Inżynierskie zastosowania statystyki — ćwiczenia
Tydzień 14: Testowanie hipotez: testy istotności dla wartości oczekiwanej
Poniżej opisano używane pojęcia i zebrano charakterystyczne dla tego tematu typy zadań.
Tam gdzie nie jest to jawnie napisane, ale wynika to z treści zadania, rozważamy próbę losową
X = (X1 , . . . , Xn ) niezależnych zmiennych losowych o tym samym rozkładzie podanym w zadaniu.
Należy mieć ze sobą tablice rozkładu t-Studenta, a także tablice rozkładu normalnego
Zadania
1. Przyjmując, że średnice śrub pochodzących z masowej produkcji mają rozkład normalny, w
którym znane jest odchylenie standardowe σ = 0.2mm, na poziomie istotności 0.05 zweryfikować hipotezę H0 : µ = 10mm przeciwko hipotezie H1 : µ < 10mm w oparciu o następujące
wyniki pomiarów 5 przypadkowo wybranych śrub:
9.81, 9.89, 9.49, 9.93, 9.78.
2. Z rozkładu N (µ, σ 2 ) wylosowano 4 zmienne: 7,9,10,8. Na poziomie istotności α = 0.05 zbadać
hipotezę, że wartość oczekiwana wynosi 10 przeciw hipotezie alternatywnej µ < 10.
3. Z populacji o rozkładzie normalnych pobrano 4-elementową próbę: 2.32, 2.56, 2.91, 3.01. Na
poziomie istotności 0.1 zweryfikować hipotezę, że µ = 2.5 przeciw hipotezie alternatywnej
µ 6= 2.5.
4. Z n = 50 prób wyznaczono X̄ = 2.6 i s2 = 0.045. Na poziomie istotności 0.1 zweryfikować
hipotezę, że µ = 2.5 przeciw hipotezie alternatywnej µ > 2.5.
5. W nx = 4 losowo wybranych punktach zmierzono grubość pewnej płytki metalowej otrzymując
x̄ = 0.511mm oraz Sx2 = 0.03mm. Następnie płytkę poddano obróbce chemicznej i ponownie
zmierzono jej grubość w ny = 9 losowo wybranych punktach, otrzymując ȳ = 0.449mm i
Sy2 = 0.02mm. Przyjmując poziom istotności α = 0.05 sprawdzić hipotezę, że grubość płytki
nie zmieniła się podczas obróbki.
6. Zmienne Xi pochodzą z rozkładu N (µx , σ 2 ), a niezależne zmienne Yi z rozkładu N (µy , σ 2 ),
gdzie σ = 2, 5. Zmierzone średnie wynosiły x̄ = 3.55 i ȳ = 3.65. Zweryfikuj hipotezę H0 : µx =
µy przeciw hipotezie alternatywnej H1 : µx 6= µy na poziomie istotności α = 1%. Liczności
obu prób wynosiły odpowiednio n1 = 200 i n2 = 250.
7. Zmierzono średnie spalanie paliwa na 100km w samochodach pewnej marki. Przetestowano
auta pochodzące z dwóch roczników: n1 = 30 samochodów wyprodukowanych w 2009 roku
i otrzymano średnie spalanie na poziomie m1 = 5.6 l/100 km przy odchyleniu standardowym
σ1 = 1.1 l/100 km oraz n2 = 100 samochodów wyprodukowanych w 2010 roku i otrzymano
średnie spalanie na poziomie m2 = 5.3l/100 km przy odchyleniu standardowym σ2 = 1.3 l/100 km.
Zweryfikować na poziomie istotności 5% hipotezę, czy auta wyprodukowane później mają
istotnie mniejsze średnie spalanie paliwa?
Teoria
Testowanie hipotez
Przypuszczenie parametrów rozkładu zmiennej losowej nazywa się hipotezą parametryczną. Pozostałe hipotezy statystyczne nazywają się nieparametryczne — np. przypuszczenie, że dwie zmienne
losowe są niezależne, bądź przypuszczenie, że zmienna losowa ma rozkład wykładniczy. W testowaniu hipotez trzeba wskazać dwie wykluczające się wzajemnie hipotezy. Hipoteza zerowa H0 jest
hipotezą sprawdzaną i procedury weryfikacji hipotez są sformułowane z wyróżnieniem hipotezy zerowej. Drugą z hipotez nazywamy hipotezą alternatywną H1 . Testem statystycznym hipotezy zerowej
H0 przeciwko hipotezie alternatywnej H1 nazywamy statystykę, której wartość policzona na podstawie próby, pozwala zdecydować o odrzuceniu H0 na rzecz hipotezy H1 . Hipotezę odrzucamy, gdy
jej przyjęcie oznaczałoby, że zaszło zdarzenie bardzo mało prawdopodobne - którego prawdopodobieństwo byłoby mniejsze od α. Hipotez nigdy nie przyjmujemy! Możemy je tylko z odpowiednim
poziomem ufności odrzucić lub nie mieć podstaw do odrzucenia. Poziom istotności α jest górnym
ograniczeniem popełnienia błędu pierwszego rodzaju: odrzucenia hipotezy H0 pomimo, że w
rzeczywistości jest prawdziwa.
(a) Test istotności dla wartości oczekiwanej
(I przypadek) Rozkład cechy normalny, σ znane. H0 : µ = µ0 przeciwko jednej z hipotez:
H1 : µ < µ0 , H1 : µ > µ0 , H1 : µ 6= µ0 . Ustalony poziom istotności α, najczęściej α = 0.05.
√
0
Statystyka testowa U = X̄−µ
n ma rozkład N (0, 1) przy prawdziwości hipotezy H0 .
σ
Wyznacz wartość ue statystyki testowej U na podstawie pobranej próby losowej. Wyznacz
obszar krytyczny Q. Jeśli ue ∈ Q, to mamy podstawy do odrzucenia H0 na rzecz H1 .
• Dla H1 : µ < µ0 , obszar krytyczny lewostronny Q = (−∞, −uα ), gdzie uα wyznaczone
jest z zależności Φ(uα ) = 1 − α.
• Dla H1 : µ > µ0 , obszar krytyczny prawostronny Q = (uα , ∞), gdzie uα wyznaczone
jest z zależności Φ(uα ) = 1 − α.
• Dla H1 : µ 6= µ0 , obszar krytyczny dwustronny Q = (−∞, −uα ) ∪ (uα , ∞), gdzie uα
wyznaczone jest z zależności Φ(uα ) = 1 − α2 .
(Zadanie 1)
Średnice śrub pochodzących z masowej produkcji mają rozkład normalny, w którym znane
jest σ = 0.1mm. Na poziomie istotności 0.05 zweryfikować hipotezę H0 : µ = 8mm przeciwko hipotezie H1 : µ > 8mm w oparciu o następujące wyniki pomiarów 7 wybranych
śrub: 8.31, 8.40, 8.25, 8.35, 8.36, 7.85, 8.28.
(II przypadek) Rozkład cechy normalny N (µ, σ), σ i µ nieznane. Hipoteza H0 i hipotezy alternatywne H1 dotyczące nieznanego parametru µ są takie same jak w poprzednim przypadku.
√
0
Statystyka weryfikująca hipotezę H0 : µ = µ0 dana jest wzorem t = X̄−µ
n − 1, która
S
przy założeniu prawdziwości hipotezy H0 ma rozkład t-Studenta o n − 1 stopniach swobody. W obszarach krytycznych z Przypadku I uα jest zastąpione przez tα , które wyznaczane
jest ze wzorów:
• P (|t| > tα ) = α dla dwustronnego obszaru krytycznego,
• P (t > tα ) = 2α dla jednostronnych obszarów krytycznych.
Jeśli dostępne tablice statystyczne podają wartość krytyczną tα według wzoru P (|t| >
tα ) = α dla danych α i n to w wyznaczaniu jednostronnych obszarów krytycznych trzeba
skorzystać z zależności 2P (t > tα ) = P (|t| > tα ). Jeśli n > 30, statystyka t ma rozkład w
przybliżeniu normalny jak w kolejnym przypadku III.
(Zadanie 2)
Średnice śrub pochodzących z masowej produkcji mają rozkład normalny, w którym nieznane jest σ. Na poziomie istotności 0.05 zweryfikować hipotezę H0 : µ = 8mm przeciwko
hipotezie H1 : µ > 8mm w oparciu o następujące wyniki pomiarów 7 wybranych śrub:
8.31, 8.40, 8.25, 8.35, 8.36, 7.85, 8.28.
(III przypadek) Rozkład cechy dowolny, istnieje skończona wariancja, duża próba (­ 30). Sta√
0
tystyka testowa U = X̄−µ
n − 1 ma rozkład asymptotycznie normalny N (0, 1) i dalsze
S
procedury są identyczne jak w przypadku I.
(Zadanie 3)
Z n = 36 prób wyznaczono x̄ = 1.32 i s2 = 0.041. Na poziomie istotności 0.1 zweryfikować
hipotezę, że µ = 1.25 przeciwko hipotezie H1 : µ > 1.25.
(b) Test istotności dla dwóch wartości oczekiwanych
Mamy podane dwie populacje generalne o rozkładach normalnych N (µ1 , σ1 ) i N (µ2 , σ2 ), w
których σ1 i σ2 są znane. Test istotności (czy średnia w obu populacjach jest taka sama, a więc
H0 : µ1 = µ2 ) opiera się na zmiennej losowej
x̄1 − x̄2
u= r
.
σ12
σ22
n1 + n2
Zmienna u ma rozkład N (0, 1), o ile hipoteza o równościach średnich H0 jest prawdziwa.
Dla hipotezy alternatywnej H1 : µ1 6= µ2 , wyznaczamy obszar krytyczny dwustronny Q =
(−∞, −uα ) ∪ (uα , ∞), gdzie uα wyznaczone jest z zależności Φ(uα ) = 1 − α2 , natomiast dla
hipotezy alternatywnej H10 : µ1 > µ2 lub H100 : µ1 < µ2 wyznaczamy obszar krytyczny jednostronny. Dla H10 obszarem krytycznym będzie Q = (−∞, −uα ) dla Φ(uα ) = 1 − α, zaś dla H100
otrzymujemy Q = (uα , ∞) dla Φ(uα ) = 1 − α. Jeśli u ∈ Q, to mamy podstawy do odrzucenia
H0 na rzecz H1 .
(Zadanie 4)
W roku 2012 wybrano 100 losowo wybranych mieszkańców Otwocka zjadło przeciętnie 10kg
czekolady rocznie przy odchyleniu standardowym 2kg, zaś w roku 2013 spośród wybranych
225 losowych mieszkańców Otwocka średnie spożycie czekolady wynosiło 11kg przy odchyleniu
standardowym 3kg. Na poziomie istotności α = 0.1 zweryfikować hipotezę H0 : µ1 = µ2 , że obie
populacje mają takie samo średnie roczne spożycie czekolady.
Literatura
[1] Ryszard Magiera, "Modele i metody statystyki matematycznej. Część II: Wnioskowanie statystyczne", GiS 2007.

Podobne dokumenty