Inżynierskie zastosowania statystyki — ćwiczenia
Transkrypt
Inżynierskie zastosowania statystyki — ćwiczenia
Inżynierskie zastosowania statystyki — ćwiczenia Tydzień 14: Testowanie hipotez: testy istotności dla wartości oczekiwanej Poniżej opisano używane pojęcia i zebrano charakterystyczne dla tego tematu typy zadań. Tam gdzie nie jest to jawnie napisane, ale wynika to z treści zadania, rozważamy próbę losową X = (X1 , . . . , Xn ) niezależnych zmiennych losowych o tym samym rozkładzie podanym w zadaniu. Należy mieć ze sobą tablice rozkładu t-Studenta, a także tablice rozkładu normalnego Zadania 1. Przyjmując, że średnice śrub pochodzących z masowej produkcji mają rozkład normalny, w którym znane jest odchylenie standardowe σ = 0.2mm, na poziomie istotności 0.05 zweryfikować hipotezę H0 : µ = 10mm przeciwko hipotezie H1 : µ < 10mm w oparciu o następujące wyniki pomiarów 5 przypadkowo wybranych śrub: 9.81, 9.89, 9.49, 9.93, 9.78. 2. Z rozkładu N (µ, σ 2 ) wylosowano 4 zmienne: 7,9,10,8. Na poziomie istotności α = 0.05 zbadać hipotezę, że wartość oczekiwana wynosi 10 przeciw hipotezie alternatywnej µ < 10. 3. Z populacji o rozkładzie normalnych pobrano 4-elementową próbę: 2.32, 2.56, 2.91, 3.01. Na poziomie istotności 0.1 zweryfikować hipotezę, że µ = 2.5 przeciw hipotezie alternatywnej µ 6= 2.5. 4. Z n = 50 prób wyznaczono X̄ = 2.6 i s2 = 0.045. Na poziomie istotności 0.1 zweryfikować hipotezę, że µ = 2.5 przeciw hipotezie alternatywnej µ > 2.5. 5. W nx = 4 losowo wybranych punktach zmierzono grubość pewnej płytki metalowej otrzymując x̄ = 0.511mm oraz Sx2 = 0.03mm. Następnie płytkę poddano obróbce chemicznej i ponownie zmierzono jej grubość w ny = 9 losowo wybranych punktach, otrzymując ȳ = 0.449mm i Sy2 = 0.02mm. Przyjmując poziom istotności α = 0.05 sprawdzić hipotezę, że grubość płytki nie zmieniła się podczas obróbki. 6. Zmienne Xi pochodzą z rozkładu N (µx , σ 2 ), a niezależne zmienne Yi z rozkładu N (µy , σ 2 ), gdzie σ = 2, 5. Zmierzone średnie wynosiły x̄ = 3.55 i ȳ = 3.65. Zweryfikuj hipotezę H0 : µx = µy przeciw hipotezie alternatywnej H1 : µx 6= µy na poziomie istotności α = 1%. Liczności obu prób wynosiły odpowiednio n1 = 200 i n2 = 250. 7. Zmierzono średnie spalanie paliwa na 100km w samochodach pewnej marki. Przetestowano auta pochodzące z dwóch roczników: n1 = 30 samochodów wyprodukowanych w 2009 roku i otrzymano średnie spalanie na poziomie m1 = 5.6 l/100 km przy odchyleniu standardowym σ1 = 1.1 l/100 km oraz n2 = 100 samochodów wyprodukowanych w 2010 roku i otrzymano średnie spalanie na poziomie m2 = 5.3l/100 km przy odchyleniu standardowym σ2 = 1.3 l/100 km. Zweryfikować na poziomie istotności 5% hipotezę, czy auta wyprodukowane później mają istotnie mniejsze średnie spalanie paliwa? Teoria Testowanie hipotez Przypuszczenie parametrów rozkładu zmiennej losowej nazywa się hipotezą parametryczną. Pozostałe hipotezy statystyczne nazywają się nieparametryczne — np. przypuszczenie, że dwie zmienne losowe są niezależne, bądź przypuszczenie, że zmienna losowa ma rozkład wykładniczy. W testowaniu hipotez trzeba wskazać dwie wykluczające się wzajemnie hipotezy. Hipoteza zerowa H0 jest hipotezą sprawdzaną i procedury weryfikacji hipotez są sformułowane z wyróżnieniem hipotezy zerowej. Drugą z hipotez nazywamy hipotezą alternatywną H1 . Testem statystycznym hipotezy zerowej H0 przeciwko hipotezie alternatywnej H1 nazywamy statystykę, której wartość policzona na podstawie próby, pozwala zdecydować o odrzuceniu H0 na rzecz hipotezy H1 . Hipotezę odrzucamy, gdy jej przyjęcie oznaczałoby, że zaszło zdarzenie bardzo mało prawdopodobne - którego prawdopodobieństwo byłoby mniejsze od α. Hipotez nigdy nie przyjmujemy! Możemy je tylko z odpowiednim poziomem ufności odrzucić lub nie mieć podstaw do odrzucenia. Poziom istotności α jest górnym ograniczeniem popełnienia błędu pierwszego rodzaju: odrzucenia hipotezy H0 pomimo, że w rzeczywistości jest prawdziwa. (a) Test istotności dla wartości oczekiwanej (I przypadek) Rozkład cechy normalny, σ znane. H0 : µ = µ0 przeciwko jednej z hipotez: H1 : µ < µ0 , H1 : µ > µ0 , H1 : µ 6= µ0 . Ustalony poziom istotności α, najczęściej α = 0.05. √ 0 Statystyka testowa U = X̄−µ n ma rozkład N (0, 1) przy prawdziwości hipotezy H0 . σ Wyznacz wartość ue statystyki testowej U na podstawie pobranej próby losowej. Wyznacz obszar krytyczny Q. Jeśli ue ∈ Q, to mamy podstawy do odrzucenia H0 na rzecz H1 . • Dla H1 : µ < µ0 , obszar krytyczny lewostronny Q = (−∞, −uα ), gdzie uα wyznaczone jest z zależności Φ(uα ) = 1 − α. • Dla H1 : µ > µ0 , obszar krytyczny prawostronny Q = (uα , ∞), gdzie uα wyznaczone jest z zależności Φ(uα ) = 1 − α. • Dla H1 : µ 6= µ0 , obszar krytyczny dwustronny Q = (−∞, −uα ) ∪ (uα , ∞), gdzie uα wyznaczone jest z zależności Φ(uα ) = 1 − α2 . (Zadanie 1) Średnice śrub pochodzących z masowej produkcji mają rozkład normalny, w którym znane jest σ = 0.1mm. Na poziomie istotności 0.05 zweryfikować hipotezę H0 : µ = 8mm przeciwko hipotezie H1 : µ > 8mm w oparciu o następujące wyniki pomiarów 7 wybranych śrub: 8.31, 8.40, 8.25, 8.35, 8.36, 7.85, 8.28. (II przypadek) Rozkład cechy normalny N (µ, σ), σ i µ nieznane. Hipoteza H0 i hipotezy alternatywne H1 dotyczące nieznanego parametru µ są takie same jak w poprzednim przypadku. √ 0 Statystyka weryfikująca hipotezę H0 : µ = µ0 dana jest wzorem t = X̄−µ n − 1, która S przy założeniu prawdziwości hipotezy H0 ma rozkład t-Studenta o n − 1 stopniach swobody. W obszarach krytycznych z Przypadku I uα jest zastąpione przez tα , które wyznaczane jest ze wzorów: • P (|t| > tα ) = α dla dwustronnego obszaru krytycznego, • P (t > tα ) = 2α dla jednostronnych obszarów krytycznych. Jeśli dostępne tablice statystyczne podają wartość krytyczną tα według wzoru P (|t| > tα ) = α dla danych α i n to w wyznaczaniu jednostronnych obszarów krytycznych trzeba skorzystać z zależności 2P (t > tα ) = P (|t| > tα ). Jeśli n > 30, statystyka t ma rozkład w przybliżeniu normalny jak w kolejnym przypadku III. (Zadanie 2) Średnice śrub pochodzących z masowej produkcji mają rozkład normalny, w którym nieznane jest σ. Na poziomie istotności 0.05 zweryfikować hipotezę H0 : µ = 8mm przeciwko hipotezie H1 : µ > 8mm w oparciu o następujące wyniki pomiarów 7 wybranych śrub: 8.31, 8.40, 8.25, 8.35, 8.36, 7.85, 8.28. (III przypadek) Rozkład cechy dowolny, istnieje skończona wariancja, duża próba ( 30). Sta√ 0 tystyka testowa U = X̄−µ n − 1 ma rozkład asymptotycznie normalny N (0, 1) i dalsze S procedury są identyczne jak w przypadku I. (Zadanie 3) Z n = 36 prób wyznaczono x̄ = 1.32 i s2 = 0.041. Na poziomie istotności 0.1 zweryfikować hipotezę, że µ = 1.25 przeciwko hipotezie H1 : µ > 1.25. (b) Test istotności dla dwóch wartości oczekiwanych Mamy podane dwie populacje generalne o rozkładach normalnych N (µ1 , σ1 ) i N (µ2 , σ2 ), w których σ1 i σ2 są znane. Test istotności (czy średnia w obu populacjach jest taka sama, a więc H0 : µ1 = µ2 ) opiera się na zmiennej losowej x̄1 − x̄2 u= r . σ12 σ22 n1 + n2 Zmienna u ma rozkład N (0, 1), o ile hipoteza o równościach średnich H0 jest prawdziwa. Dla hipotezy alternatywnej H1 : µ1 6= µ2 , wyznaczamy obszar krytyczny dwustronny Q = (−∞, −uα ) ∪ (uα , ∞), gdzie uα wyznaczone jest z zależności Φ(uα ) = 1 − α2 , natomiast dla hipotezy alternatywnej H10 : µ1 > µ2 lub H100 : µ1 < µ2 wyznaczamy obszar krytyczny jednostronny. Dla H10 obszarem krytycznym będzie Q = (−∞, −uα ) dla Φ(uα ) = 1 − α, zaś dla H100 otrzymujemy Q = (uα , ∞) dla Φ(uα ) = 1 − α. Jeśli u ∈ Q, to mamy podstawy do odrzucenia H0 na rzecz H1 . (Zadanie 4) W roku 2012 wybrano 100 losowo wybranych mieszkańców Otwocka zjadło przeciętnie 10kg czekolady rocznie przy odchyleniu standardowym 2kg, zaś w roku 2013 spośród wybranych 225 losowych mieszkańców Otwocka średnie spożycie czekolady wynosiło 11kg przy odchyleniu standardowym 3kg. Na poziomie istotności α = 0.1 zweryfikować hipotezę H0 : µ1 = µ2 , że obie populacje mają takie samo średnie roczne spożycie czekolady. Literatura [1] Ryszard Magiera, "Modele i metody statystyki matematycznej. Część II: Wnioskowanie statystyczne", GiS 2007.