ĆWICZENIA nr 8
Transkrypt
ĆWICZENIA nr 8
ĆWICZENIA nr 8 Cel zajęć: Przedstawienie wybranych testów statystycznych, zasad wyboru właściwego testu, przeprowadzenia go oraz interpretacji wyników. Wprowadzenie teoretyczne Testem statystycznym nazywamy metodę umożliwiającą weryfikację hipotezy zerowej. W zależności od jej postaci i od rodzaju przeprowadzanego eksperymentu, należy wybrać odpowiedni test. Poniżej przedstawione zostały wybrane testy statystyczne oraz warunki, w jakich należy ich użyć. Test t jest skrótem od nazwy test t Studenta. Testy t stosuje się do sprawdzania hipotez dotyczących wartości oczekiwanej rozkładów normalnych. W zależności od rodzaju danych wyróżnia się: test t dla jednej próby, test t dla prób niepowiązanych (niezależnych) oraz test t dla prób powiązanych (zależnych). Test t dla jednej próby stosuje się dla próby losowej z populacji generalnej, której cecha ma rozkład normalny o nieznanej wariancji. Hipoteza zerowa jest postaci H0: µ = µ0, hipoteza alternatywna H1: µ ≠ µ0, jest to więc test dwustronny. Statystyka testowa jest postaci T= n (X − µ 0 ) , S gdzie X jest średnią arytmetyczną badanej cechy, n jest liczbą obserwacji, S jest odchyleniem standardowym cechy z próby. Obszar krytyczny (obszar odrzucenia) testu jest postaci K = t : t > t α , n −1,1− 2 gdzie t jest wartością statystyki T, tn-1,1-α/2 oznacza kwantyl rozkładu t rzędu 1-α/2 o n-1 stopniach swobody, α jest poziomem istotności. Jeżeli t jest dodatnie, to µ > µ0. Jeżeli t jest ujemne, to µ < µ0. Test t dla prób niepowiązanych stosuje się dla dwóch niezależnych prób losowych z dwóch populacji generalnych o rozkładach normalnych o tej samej, nieznanej wariancji. Hipoteza zerowa jest postaci H0: µ1 = µ2, hipoteza alternatywna H1: µ1 ≠ µ2, gdzie µ1 jest wartością oczekiwaną cechy w pierwszej populacji, µ2 jest wartością oczekiwaną cechy w drugiej populacji. Statystyka testowa jest postaci T= X1 − X 2 (n1 − 1)S12 + (n2 − 1)S 22 n1 n2 (n1 + n2 − 2) , n1 + n2 gdzie X 1 , X 2 są średnimi arytmetycznymi badanej cechy w próbie pierwszej i drugiej, S12, S22 są wariancjami cechy w próbie pierwszej i drugiej, n1, n2 są liczebnościami prób. Obszar krytyczny testu jest postaci K = t : t > t α , n1 + n2 − 2 ,1− 2 gdzie t jest wartością statystyki T, t n1 +n2 − 2,1−α / 2 oznacza kwanty rozkładu t rzędu 1-α/2 o n1+n2-2 stopniach swobody, α jest poziomem istotności. Jeżeli t jest dodatnie, to µ1 > µ2. Jeżeli t jest ujemne, to µ1 < µ2. Test t dla prób powiązanych stosuje się dla zestawów par wiązanych X i Y, gdzie D = Y – X oraz D ma rozkład normalny o średniej µD i nieznanej wariancji. Hipoteza zerowa jest postaci H0: µX = µY, hipoteza alternatywna H1: µX ≠ µY. Statystyka testowa jest postaci T= nD , SD gdzie D= SD = 1 n ∑ Di , n i =1 1 n (Di − D )2 , ∑ n − 1 i =1 n jest liczbą obserwacji. Obszar krytyczny testu jest postaci K = t : t > t α , n −1,1− 2 gdzie t jest wartością statystyki T, tn-1,1-α/2 oznacza kwanty rozkładu t rzędu 1-α/2 o n-1 stopniach swobody, α jest poziomem istotności. Jeżeli t jest dodatnie, to µX > µY. Jeżeli t jest ujemne, to µX < µY. Zadania do rozwiązania 1. W hodowli drobiu, w celu uzyskania ptaków o wysokiej wartości użytkowej, stosuje się krzyżowanie różnych ras. Dobór tych ras stanowi tajemnicę firmy hodowlanej, która sprzedaje hodowcom pisklęta-mieszańce. Firma gwarantuje uzyskanie średnio 220 jaj od kury. Hodowca zakupił partię piskląt, z których uzyskał 25 kur z ukończoną nieśnością. Średnia arytmetyczna nieśności wyniosła 213.8 jaj, a odchylenie standardowe było równe 16 jaj. Sprawdzić, czy zapewnienia firmy są prawdziwe. Przyjąć α = 0.05 oraz założyć, że badana cecha ma rozkład normalny. 2. Wylosowano niezależnie 12 indywidualnych gospodarstw rolnych w pewnej wsi i otrzymano dla nich następujące wielkości uzyskanych plonów owsa (w q/ha): 23.3, 22.1, 21.8, 19.9, 23.7, 22.3, 22.6, 21.5, 21.9, 22.8, 23, 22.2. Na poziomie istotności α = 0.05 zweryfikować hipotezę, że wartość przeciętna plonu owsa w całej wsi wynosi 22.6 q/ha. Założyć, że badana cecha ma rozkład normalny. 3. W celu porównania średniego stażu pracy w dwóch zakładach pracy wylosowano z każdego z tych zakładów grupę pracowników i zbadano ją pod względem długości stażu pracy w danym zakładzie. Otrzymano następujące rezultaty: • zakład 1 – liczba badanych pracowników 36, średni staż pracy 6.8, odchylenie standardowe 1.7, • zakład 2 - liczba badanych pracowników 40, średni staż pracy 8.2, odchylenie standardowe 2.5. Zweryfikować na poziomie istotności α = 0.05 hipotezę, że średnie staże pracy dla wszystkich pracowników każdego z tych zakładów są równe. Przyjąć, że badana cecha w obydwu populacjach (zakładach) ma rozkład normalny o tej samej wariacji. 4. Spośród uczniów pewnego liceum wylosowano 15 z klas pierwszych oraz 12 z klas drugich. Obliczono średnią ocen uzyskanych w semestrze dla każdego z uczniów i otrzymano następujące wyniki: • dla klas pierwszych: 3.71, 4.28, 2.95, 3.20, 3.38, 4.05, 4.07, 4.98, 3.20, 3.43, 3.09, 4.50, 3.12, 3.68, 3.90, • dla klas drugich: 3.10, 3.38, 4.06, 3.60, 3.81, 4.50, 4.00, 3.25, 4.11, 4.85, 2.80, 4.00. Zakładając, że średnie wyniki ocen mają rozkłady normalne o tej samej wariancji, zweryfikować na poziomie istotności α = 0.05 hipotezę, że przeciętne ocen uzyskanych przez uczniów klas pierwszych i drugich są jednakowe. 5. Aby ustalić zmienianie się ilości witaminy C w ziemniakach z upływem czasu, wybrano losowo 8 ziemniaków zaraz po zbiorze i określono w nich ilość witaminy C w mg na 100 g ziemniaka. Otrzymano następujące wyniki: 18.2, 17.8, 17.3, 18.9, 18.5, 17.5, 17.9, 18.3. W miesiąc po zbiorze ponownie dokonano pomiaru oraz otrzymano wyniki: 17.4, 17.7, 18.0, 17.6, 16.9, 17.5, 17.0, 17.5. Przy założeniu, że badana cecha ma rozkład normalny, sprawdzić wpływ czasu na zawartość witaminy C w ziemniakach. Przyjąć α = 0.05. 6. Dla siedmiu wybranych losowo roślin chmielu wykonano następujące doświadczenie. Zapylono połowę każdej z roślin, druga połowa pozostała niezapylona. Plon nasion roślin chmielu przedstawiono w tabeli: roślina 1 2 3 4 5 6 7 zapylona 0.78 0.76 0.43 0.92 0.86 0.59 0.68 masa nasion niezapylona 0.21 0.12 0.32 0.29 0.30 0.20 0.14 Przyjąć, że badana cecha ma rozkład normalny. Czy na poziomie ufności α = 0.05 można uznać, że zapylenie rośliny ma wpływ na wielkość plonu? Źródła: Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M. „Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach – część II: Statystyka matematyczna”, PWN, Warszawa 2004 Łomnicki A. „Wprowadzenie do statystyki dla przyrodników”, PWN, Warszawa 2007 Magiera R. „Modele i metody statystyki matematycznej”, Oficyna Wydawnicza GiS, Wrocław 2002 Żuk B. „Biometria stosowana”, PWN, Warszawa 1989