ĆWICZENIA nr 8

Transkrypt

ĆWICZENIA nr 8
ĆWICZENIA nr 8
Cel zajęć: Przedstawienie wybranych testów statystycznych, zasad wyboru właściwego testu,
przeprowadzenia go oraz interpretacji wyników.
Wprowadzenie teoretyczne
Testem statystycznym nazywamy metodę umożliwiającą weryfikację hipotezy zerowej.
W zależności od jej postaci i od rodzaju przeprowadzanego eksperymentu, należy wybrać odpowiedni
test. Poniżej przedstawione zostały wybrane testy statystyczne oraz warunki, w jakich należy ich użyć.
Test t jest skrótem od nazwy test t Studenta. Testy t stosuje się do sprawdzania hipotez
dotyczących wartości oczekiwanej rozkładów normalnych. W zależności od rodzaju danych wyróżnia
się: test t dla jednej próby, test t dla prób niepowiązanych (niezależnych) oraz test t dla prób
powiązanych (zależnych).
Test t dla jednej próby stosuje się dla próby losowej z populacji generalnej, której cecha ma
rozkład normalny o nieznanej wariancji. Hipoteza zerowa jest postaci
H0: µ = µ0, hipoteza
alternatywna H1: µ ≠ µ0, jest to więc test dwustronny. Statystyka testowa jest postaci
T=
n (X − µ 0 )
,
S
gdzie X jest średnią arytmetyczną badanej cechy, n jest liczbą obserwacji, S jest odchyleniem
standardowym cechy z próby. Obszar krytyczny (obszar odrzucenia) testu jest postaci


K = t : t > t
α ,
n −1,1−
2 

gdzie t jest wartością statystyki T, tn-1,1-α/2 oznacza kwantyl rozkładu t rzędu 1-α/2 o n-1 stopniach
swobody, α jest poziomem istotności. Jeżeli t jest dodatnie, to µ > µ0. Jeżeli t jest ujemne, to µ < µ0.
Test t dla prób niepowiązanych stosuje się dla dwóch niezależnych prób losowych z dwóch
populacji generalnych o rozkładach normalnych o tej samej, nieznanej wariancji. Hipoteza zerowa
jest postaci H0: µ1 = µ2, hipoteza alternatywna H1: µ1 ≠ µ2, gdzie µ1 jest wartością oczekiwaną cechy w
pierwszej populacji, µ2 jest wartością oczekiwaną cechy w drugiej populacji. Statystyka testowa jest
postaci
T=
X1 − X 2
(n1 − 1)S12 + (n2 − 1)S 22
n1 n2 (n1 + n2 − 2)
,
n1 + n2
gdzie X 1 , X 2 są średnimi arytmetycznymi badanej cechy w próbie pierwszej i drugiej, S12, S22 są
wariancjami cechy w próbie pierwszej i drugiej, n1, n2 są liczebnościami prób. Obszar krytyczny testu
jest postaci


K = t : t > t
α ,
n1 + n2 − 2 ,1−
2 

gdzie t jest wartością statystyki T, t n1 +n2 − 2,1−α / 2 oznacza kwanty rozkładu t rzędu 1-α/2 o n1+n2-2
stopniach swobody, α jest poziomem istotności. Jeżeli t jest dodatnie, to µ1 > µ2. Jeżeli t jest ujemne,
to µ1 < µ2.
Test t dla prób powiązanych stosuje się dla zestawów par wiązanych X i Y, gdzie D = Y – X
oraz D ma rozkład normalny o średniej µD i nieznanej wariancji. Hipoteza zerowa jest postaci
H0: µX = µY, hipoteza alternatywna H1: µX ≠ µY. Statystyka testowa jest postaci
T=
nD
,
SD
gdzie
D=
SD =
1 n
∑ Di ,
n i =1
1 n
(Di − D )2 ,
∑
n − 1 i =1
n jest liczbą obserwacji. Obszar krytyczny testu jest postaci


K = t : t > t
α ,
n −1,1−
2 

gdzie t jest wartością statystyki T, tn-1,1-α/2 oznacza kwanty rozkładu t rzędu 1-α/2 o n-1 stopniach
swobody, α jest poziomem istotności. Jeżeli t jest dodatnie, to µX > µY. Jeżeli t jest ujemne, to µX < µY.
Zadania do rozwiązania
1. W hodowli drobiu, w celu uzyskania ptaków o wysokiej wartości użytkowej, stosuje się
krzyżowanie różnych ras. Dobór tych ras stanowi tajemnicę firmy hodowlanej, która
sprzedaje hodowcom pisklęta-mieszańce. Firma gwarantuje uzyskanie średnio 220 jaj od
kury. Hodowca zakupił partię piskląt, z których uzyskał 25 kur z ukończoną nieśnością.
Średnia arytmetyczna nieśności wyniosła 213.8 jaj, a odchylenie standardowe było równe 16
jaj. Sprawdzić, czy zapewnienia firmy są prawdziwe. Przyjąć α = 0.05 oraz założyć, że badana
cecha ma rozkład normalny.
2. Wylosowano niezależnie 12 indywidualnych gospodarstw rolnych w pewnej wsi i otrzymano
dla nich następujące wielkości uzyskanych plonów owsa (w q/ha): 23.3, 22.1, 21.8, 19.9, 23.7,
22.3, 22.6, 21.5, 21.9, 22.8, 23, 22.2. Na poziomie istotności α = 0.05 zweryfikować hipotezę,
że wartość przeciętna plonu owsa w całej wsi wynosi 22.6 q/ha. Założyć, że badana cecha ma
rozkład normalny.
3. W celu porównania średniego stażu pracy w dwóch zakładach pracy wylosowano z każdego z
tych zakładów grupę pracowników i zbadano ją pod względem długości stażu pracy w danym
zakładzie. Otrzymano następujące rezultaty:
• zakład 1 – liczba badanych pracowników 36, średni staż pracy 6.8, odchylenie
standardowe 1.7,
• zakład 2 - liczba badanych pracowników 40, średni staż pracy 8.2, odchylenie
standardowe 2.5.
Zweryfikować na poziomie istotności α = 0.05 hipotezę, że średnie staże pracy dla wszystkich
pracowników każdego z tych zakładów są równe. Przyjąć, że badana cecha w obydwu
populacjach (zakładach) ma rozkład normalny o tej samej wariacji.
4. Spośród uczniów pewnego liceum wylosowano 15 z klas pierwszych oraz 12 z klas drugich.
Obliczono średnią ocen uzyskanych w semestrze dla każdego z uczniów i otrzymano
następujące wyniki:
• dla klas pierwszych: 3.71, 4.28, 2.95, 3.20, 3.38, 4.05, 4.07, 4.98, 3.20, 3.43, 3.09,
4.50, 3.12, 3.68, 3.90,
• dla klas drugich: 3.10, 3.38, 4.06, 3.60, 3.81, 4.50, 4.00, 3.25, 4.11, 4.85, 2.80, 4.00.
Zakładając, że średnie wyniki ocen mają rozkłady normalne o tej samej wariancji,
zweryfikować na poziomie istotności α = 0.05 hipotezę, że przeciętne ocen uzyskanych przez
uczniów klas pierwszych i drugich są jednakowe.
5. Aby ustalić zmienianie się ilości witaminy C w ziemniakach z upływem czasu, wybrano losowo
8 ziemniaków zaraz po zbiorze i określono w nich ilość witaminy C w mg na 100 g ziemniaka.
Otrzymano następujące wyniki: 18.2, 17.8, 17.3, 18.9, 18.5, 17.5, 17.9, 18.3. W miesiąc po
zbiorze ponownie dokonano pomiaru oraz otrzymano wyniki: 17.4, 17.7, 18.0, 17.6, 16.9,
17.5, 17.0, 17.5. Przy założeniu, że badana cecha ma rozkład normalny, sprawdzić wpływ
czasu na zawartość witaminy C w ziemniakach. Przyjąć α = 0.05.
6. Dla siedmiu wybranych losowo roślin chmielu wykonano następujące doświadczenie.
Zapylono połowę każdej z roślin, druga połowa pozostała niezapylona. Plon nasion roślin
chmielu przedstawiono w tabeli:
roślina
1
2
3
4
5
6
7
zapylona
0.78 0.76 0.43 0.92 0.86 0.59 0.68
masa nasion
niezapylona 0.21 0.12 0.32 0.29 0.30 0.20 0.14
Przyjąć, że badana cecha ma rozkład normalny. Czy na poziomie ufności α = 0.05 można
uznać, że zapylenie rośliny ma wpływ na wielkość plonu?
Źródła:
Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M. „Rachunek prawdopodobieństwa i
statystyka matematyczna w zadaniach – część II: Statystyka matematyczna”, PWN, Warszawa 2004
Łomnicki A. „Wprowadzenie do statystyki dla przyrodników”, PWN, Warszawa 2007
Magiera R. „Modele i metody statystyki matematycznej”, Oficyna Wydawnicza GiS, Wrocław 2002
Żuk B. „Biometria stosowana”, PWN, Warszawa 1989

Podobne dokumenty