Weryfikacja hipotez statystycznych.

Transkrypt

Weryfikacja hipotez statystycznych.
Metody statystyczne w naukach biologicznych
2006-04-11
Wykład: Weryfikacja hipotez statystycznych.
Zadaniem statystyki matematycznej jest wnioskowanie o populacji generalnej na podstawie
populacji próbnej. Wnioskowanie to polegać może na weryfikacji przyjętego modelu teoretycznego.
Na jego podstawie formułowana jest hipoteza, z kolei wnioskowanie ma ją potwierdzić lub
odrzucić. Hipoteza powinna być tak sformułowana, aby można było ją łatwo przyjąć lub odrzucić.
Hipotezy statystyczne mogą dotyczyć:
 wartości badanych zmiennych: średnia wzrost mężczyzn w wieku 30 lat wynosi 179 cm
 różnicy między grupami osobników w zakresie rozpatrywanej cechy: lek A skuteczniej
zwiększa krzepliwość krwi niż lek B
 zależności między badanymi cechami: istnieje silna zależność pomiędzy ilością wypalanych
papierosów a zachorowalnością na nowotwór płuc
 porównania rozkładu zmiennych: zmienna masa ciała ma rozkład normalny
Weryfikacja hipotez statystycznych polega na zastosowaniu określonego schematu postępowania
zwanego testu statystycznego, który rozstrzyga, przy jakich wynikach z próby sprawdzoną
hipotezę należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Hipotezy możemy podzielić na:
 parametryczne, tj. takie, które dotyczą wartości parametrów statystycznych populacji, np.
średniej arytmetycznej czy odchylenia standardowego
 nieparametryczne – dotyczą postaci rozkładu zmiennej lub losowości próby.
Analogicznie, wyróżnić możemy testy statystyczne: parametryczne (służą do weryfikacji hipotez
parametrycznych) i testy nieparametryczne – weryfikacja hipotez nieparametrycznych.
Hipoteza, która podlega sprawdzeniu zwana jest hipotezą zerową (H0). Konkurencyjną dla niej
hipotezą jest hipoteza alternatywna (H1). Hipoteza zerowa - ma najczęściej miejsce wówczas,
gdy domniemamy, że pomiędzy rozpatrywanymi parametrami lub rozkładami dwóch czy też kilku
populacji nie ma różnic.
Na podstawie pewnych przesłanek zakładamy, że wydajność mleka w pewnej populacji krów
wynosi 5000 kg mleka. Będzie to dla nas hipoteza zerowa, którą możemy zapisać następująco: H0:µ
=5000 kg. Alternatywna hipoteza może być różnoraką postać:
H1: µ<5000 kg, H2: µ>5000 kg; H3: µ≠5000 kg. Te dwie pierwsze zwane są hipotezami jednostronnymi, zaś ostatnia dwustronną.
Hipotezę zerową, dotyczącą wartości oczekiwanych można zapisać następująco:
H0 = E(X1)=E(X2), Oznacza to, że wartość oczekiwana E(X1) pierwszej populacji generalnej jest
równa wartości oczekiwanej E(X2) drugiej populacji. Jeśli zatem próby pochodzą z tych populacji
generalnych, to średnie z prób, będąc nieobciążonymi, zgodnymi i najefektywniejszymi
estymatorami średnich populacji, nie powinny różnić się między sobą istotnie.
Przystępując do weryfikacji hipotezy zerowej, zakładamy iż jest ona prawdziwa.
Weryfikując H0 można popełnić dwa błędy:
 Błąd pierwszego rodzaju (α), który polega na odrzuceniu hipotezy zerowej, mimo że jest ona
prawdziwa. Błąd ten zwany jest poziomem istotności. Najczęściej przyjmuje wartości 0,05; 0,01
czy 0,001. Poziom istotności wskazuje, na jak mały błąd „zgadzamy się” przy weryfikacji
hipotezy zerowej. Poziom istotności określa dopuszczalną częstość wystąpienia wyników
niezgodnych z przyjętymi założeniami na skutek losowego charakteru próby.
Autor: Dariusz Piwczyński
1
Metody statystyczne w naukach biologicznych
2006-04-11
 Błąd drugiego rodzaju (β) polega na przyjęciu hipotezy zerowej, gdy jest ona w rzeczywistości fałszywa.
Moc testu: prawdopodobieństwo 1-β, tj. prawdopodobieństwo odrzucenia hipotezy zerowej, gdy
jest ona fałszywa, a hipoteza alternatywna jest prawdziwa. Testem najmocniejszym jest ten,
którego, przy ustalonym poziome istotności α, wartość β jest najmniejsza.
Formułowanie i weryfikowanie hipotez statystycznych obejmuje 4 etapy:
1) sformułowanie hipotezy zerowej i alternatywnej
2) wybór testu lub testów określających reguły postępowania przy weryfikacji hipotezy zerowej
Do weryfikacji hipotez parametrycznych najczęściej wykorzystywanymi testami są: dla dużej próby
statystyka z, dla małej próby statystyka t-Studenta. Są to tzw. testy istotności, które znajdują
zastosowanie w sytuacji, gdy interesuje nas pytanie, czy hipotezę zerową można odrzucić - a nie
badamy innych hipotez. Z tym, że statystyka z wykorzystuje rozkład normalny, z kolei statystyka tStudenta rozkład t-Studenta.
3) określenie poziomu istotności (prawdopodobieństwa błędu), a tym samym wyznaczenie obszaru
krytycznego hipotezy. Obszar krytyczny, tzn. zbiór wszystkich wartości danej statystyki, dla
których hipoteza zerowa jest odrzucana. Zakładając, iż H0 jest prawdziwa i posługując się teorią
matematyczną (opisującą naszą zmienną) tworzy się zmienną losową, np. statystyka Z. Następnie
określa się wartości jakie musiałaby ona przyjąć, aby było to mało prawdopodobne, tzn. takie, że
prawdopodobieństwo ich wystąpienia równa się poziomowi istotności. Te mało prawdopodobne
wartości tworzą obszar krytyczny. Jeżeli statystyka, jaką obliczamy dla populacji próbnej mieści się
w obszarze krytycznym, to świadczy o tym, iż zdarzenie to nie powinno zaistnieć. Mamy zatem
podstawy do odrzucenia hipotezy zerowej i przyjęcia hipotezy alternatywnej.
4) formułowanie - na podstawie wyników z próby, testu i przyjętych założeń - wniosku końcowego:
"sformułowaną hipotezę zerową odrzucić" albo nie ma statystycznych podstaw do odrzucenia
sformułowanej hipotezy zerowej"
Interpretacja wyników:
Uzyskane wyniki nie dają podstaw do odrzucenia hipotezy zerowej, a zarazem nie pozwalają
stwierdzić, że średnie różnią się statystycznie. Doświadczenie nie udowodniło wyższości żadnego z
zastosowanych poziomów czynnika doświadczalnego. Nie można jednak twierdzić, że nie było
różnic pomiędzy obiema grupami. Różnice wystąpiły, jednakże nie można nic o nich powiedzieć na
podstawie danego doświadczenia. Być może przy powtórzeniu doświadczenia różnica mogłaby się
okazać statystycznie istotna.
Autor: Dariusz Piwczyński
2
Metody statystyczne w naukach biologicznych
2006-04-11
Dla pojedynczej próby statystykę t obliczamy z wzoru:
x − µ0
Sx
t=
Sx =
Sx
n
Sx - średni błąd średniej arytmetycznej, błąd losowy
Dla dwóch prób statystykę t obliczamy ze wzoru:
tα odczytujemy dla liczby stopni swobody równej n1 + n2 - 2
x1 − x 2
t=
SD
Sd średni błąd różnicy średnich
Sd średni błąd różnicy średnich (Test Cochrana-Coxa – nierówne wariancje)
Sd = S + S
2
x1
S x21
2
; Sx =
x2
Sx
n −1
- kwadrat średniego błędu średniej arytmetycznej
Sx - średni błąd średniej arytmetycznej, błąd losowy
Sd średni błąd różnicy średnich (Test T – równe wariancje)
Sd =
( n1 − 1) * s12 + ( n2 − 1) * s22 n1 + n2
*
(n1 + n2 − 2)
n1 * n2
Autor: Dariusz Piwczyński
3
Metody statystyczne w naukach biologicznych
2006-04-11
DOŚWIADCZENIA W UKŁADZIE PAR SKORELOWANYCH.
Doświadczenia w układzie par skorelowanych pozwalają na badanie wpływu czynnika
doświadczalnego na zwierzęta i jednocześnie ograniczają wyraźnie wpływ czynników losowych.
Jest to możliwe dzięki temu, iż elementy porównywanych grup zwierząt lub dwóch szeregów
statystycznych mają między sobą ścisłe powiązanie.
Zwierzęta do takiego typu doświadczeń dobiera się parami, które stanowią osobniki ze sobą
spokrewnione, będące w podobnym wieku, pochodzące z tego samego budynku. Na przykład, jeśli
chcemy zbadać efekt zastosowania dwóch pasz na świnie, zwierzęta dobiera się parami tj.: bierze
się osobniki z tej samej chlewni, w tym samym wieku, najlepiej spokrewnione np.: półrodzeństwo.
Następnie zwierzęta rozdzielamy do dwóch grup - otrzymujących różne pasze. W dalszej
kolejności możemy zbadać różnice w działaniu tych pasz. Stosujemy test t do badania istotności
różnic pomiędzy średnimi, ale nie analizujemy indywidualnych wartości każdej z prób, lecz różnice
tych wartości w poszczególnych parach.
Doświadczenie w układzie par skorelowanych możemy również wykorzystać w sytuacji,
gdy badamy jedną grupę zwierząt, ale poddaną działaniu dwóch różnych poziomów czynnika
doświadczalnego, oczywiście w innych przedziałach czasowych. Przykładem takiej sytuacji może
być porównanie wydajności w kolejnych laktacjach tej samej grupy krów. W tym wypadku pary
skorelowane stanowią wydajności tych laktacji.
Sposób konstruowania i obliczeń w doświadczeniu:
Badana populacja zwierząt to 24 matki rasy suffolk. Ocenie poddano wybrane cechy użytkowości mlecznej
owiec. Sprawdź czy pomiędzy ilością uzyskanego mleka w doju próbnym oraz składnikami mleka w I i II
miesiącu laktacji istnieją różnice istotne statystycznie.
Stawiamy hipotezę zerową: wydajność mleka w pierwszym miesiącu laktacji owiec rasy suffolk nie różni się
ze sobą.
Lp
1
2
3
4
5
6
7
8
9
10
11
12
mleko1 mleko2
(ml)
(ml)
130
80
170
40
90
100
140
375
135
120
320
75
di
x2i - x1i
60
20
125
190
205
210
65
160
75
140
260
55
70
60
45
-150
-115
-110
75
215
60
-20
60
20
di 2
lp
4900
3600
2025
22500
13225
12100
5625
46225
3600
400
3600
400
13
14
15
16
17
18
19
20
21
22
23
24
mleko1 mleko2
(ml)
(ml)
90
150
125
200
145
140
95
140
60
45
45
65
di
x2i - x1i
130
155
170
195
70
160
115
100
80
100
70
135
di2
-40
1600
-5
25
-45
2025
5
25
75
5625
-20
400
-20
400
40
1600
-20
400
-55
3025
-25
625
-70
4900
30 138850
x1i - wartość cechy w pierwszej próbie
x2i - wartość cechy w drugiej próbie
d - nowa zmienna, której wartościami są różnice między analogicznymi wartościami z obu prób
Jeśli
Autor: Dariusz Piwczyński
xd ≥ Sd ∗ t0,05
4
Metody statystyczne w naukach biologicznych
2006-04-11
to możemy wnioskować, iż czynnik doświadczalny wywiera istotny wpływ na analizowane cechy.
x
d
- to średnia z różnicy średnich, obliczamy sumę różnicy średnich uwzględniając znak różnicy,
następnie uzyskaną liczbę dzielimy przez liczbę par skorelowanych.
W naszym przykładzie
Sd
Sd =
x
d
wynosi 30/24, tj. 1,25
- błąd standardowy różnicy średnich
S 2d
n
n - liczba par skorelowanych
S =
2
d
Sd =
Σd
2
i
2
(
Σd i )
−
n −1
n
30 2
138850 24 = 6035,33
=
23
6035,33
= 4,90
24
Porównujemy x d z błędem standardowym średniej arytmetycznej S2d pomnożonym przez wartość
krytyczną t odczytaną z tabeli testu „t” dla liczby stopni swobody n-1 i odpowiednią liczbą stopni
swobody (α). Odczytane t wynosi: 2,07.
Sd * t 0, 05 = 4,90 * 2,07 = 10,14
Ponieważ x d jest mniejsze od iloczynu błędu standardowego różnicy średnich i wartości krytycznej
t0,05, nie mamy podstaw do odrzucenia hipotezy zerowej.
Kryteria doboru odpowiedniego testu
Rozkład normalny?
NIE
Duże próby?n1 i n2>50?
TAK
Czy znane wariancje?
TAK
Czy równe
NIE
Test U
TAK
Test Z
NIE
Test Cochrana-Coxa
TAK
Test t
Autor: Dariusz Piwczyński
5
NIE
Testy