Weryfikacja hipotez statystycznych.
Transkrypt
Weryfikacja hipotez statystycznych.
Metody statystyczne w naukach biologicznych 2006-04-11 Wykład: Weryfikacja hipotez statystycznych. Zadaniem statystyki matematycznej jest wnioskowanie o populacji generalnej na podstawie populacji próbnej. Wnioskowanie to polegać może na weryfikacji przyjętego modelu teoretycznego. Na jego podstawie formułowana jest hipoteza, z kolei wnioskowanie ma ją potwierdzić lub odrzucić. Hipoteza powinna być tak sformułowana, aby można było ją łatwo przyjąć lub odrzucić. Hipotezy statystyczne mogą dotyczyć: wartości badanych zmiennych: średnia wzrost mężczyzn w wieku 30 lat wynosi 179 cm różnicy między grupami osobników w zakresie rozpatrywanej cechy: lek A skuteczniej zwiększa krzepliwość krwi niż lek B zależności między badanymi cechami: istnieje silna zależność pomiędzy ilością wypalanych papierosów a zachorowalnością na nowotwór płuc porównania rozkładu zmiennych: zmienna masa ciała ma rozkład normalny Weryfikacja hipotez statystycznych polega na zastosowaniu określonego schematu postępowania zwanego testu statystycznego, który rozstrzyga, przy jakich wynikach z próby sprawdzoną hipotezę należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia. Hipotezy możemy podzielić na: parametryczne, tj. takie, które dotyczą wartości parametrów statystycznych populacji, np. średniej arytmetycznej czy odchylenia standardowego nieparametryczne – dotyczą postaci rozkładu zmiennej lub losowości próby. Analogicznie, wyróżnić możemy testy statystyczne: parametryczne (służą do weryfikacji hipotez parametrycznych) i testy nieparametryczne – weryfikacja hipotez nieparametrycznych. Hipoteza, która podlega sprawdzeniu zwana jest hipotezą zerową (H0). Konkurencyjną dla niej hipotezą jest hipoteza alternatywna (H1). Hipoteza zerowa - ma najczęściej miejsce wówczas, gdy domniemamy, że pomiędzy rozpatrywanymi parametrami lub rozkładami dwóch czy też kilku populacji nie ma różnic. Na podstawie pewnych przesłanek zakładamy, że wydajność mleka w pewnej populacji krów wynosi 5000 kg mleka. Będzie to dla nas hipoteza zerowa, którą możemy zapisać następująco: H0:µ =5000 kg. Alternatywna hipoteza może być różnoraką postać: H1: µ<5000 kg, H2: µ>5000 kg; H3: µ≠5000 kg. Te dwie pierwsze zwane są hipotezami jednostronnymi, zaś ostatnia dwustronną. Hipotezę zerową, dotyczącą wartości oczekiwanych można zapisać następująco: H0 = E(X1)=E(X2), Oznacza to, że wartość oczekiwana E(X1) pierwszej populacji generalnej jest równa wartości oczekiwanej E(X2) drugiej populacji. Jeśli zatem próby pochodzą z tych populacji generalnych, to średnie z prób, będąc nieobciążonymi, zgodnymi i najefektywniejszymi estymatorami średnich populacji, nie powinny różnić się między sobą istotnie. Przystępując do weryfikacji hipotezy zerowej, zakładamy iż jest ona prawdziwa. Weryfikując H0 można popełnić dwa błędy: Błąd pierwszego rodzaju (α), który polega na odrzuceniu hipotezy zerowej, mimo że jest ona prawdziwa. Błąd ten zwany jest poziomem istotności. Najczęściej przyjmuje wartości 0,05; 0,01 czy 0,001. Poziom istotności wskazuje, na jak mały błąd „zgadzamy się” przy weryfikacji hipotezy zerowej. Poziom istotności określa dopuszczalną częstość wystąpienia wyników niezgodnych z przyjętymi założeniami na skutek losowego charakteru próby. Autor: Dariusz Piwczyński 1 Metody statystyczne w naukach biologicznych 2006-04-11 Błąd drugiego rodzaju (β) polega na przyjęciu hipotezy zerowej, gdy jest ona w rzeczywistości fałszywa. Moc testu: prawdopodobieństwo 1-β, tj. prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona fałszywa, a hipoteza alternatywna jest prawdziwa. Testem najmocniejszym jest ten, którego, przy ustalonym poziome istotności α, wartość β jest najmniejsza. Formułowanie i weryfikowanie hipotez statystycznych obejmuje 4 etapy: 1) sformułowanie hipotezy zerowej i alternatywnej 2) wybór testu lub testów określających reguły postępowania przy weryfikacji hipotezy zerowej Do weryfikacji hipotez parametrycznych najczęściej wykorzystywanymi testami są: dla dużej próby statystyka z, dla małej próby statystyka t-Studenta. Są to tzw. testy istotności, które znajdują zastosowanie w sytuacji, gdy interesuje nas pytanie, czy hipotezę zerową można odrzucić - a nie badamy innych hipotez. Z tym, że statystyka z wykorzystuje rozkład normalny, z kolei statystyka tStudenta rozkład t-Studenta. 3) określenie poziomu istotności (prawdopodobieństwa błędu), a tym samym wyznaczenie obszaru krytycznego hipotezy. Obszar krytyczny, tzn. zbiór wszystkich wartości danej statystyki, dla których hipoteza zerowa jest odrzucana. Zakładając, iż H0 jest prawdziwa i posługując się teorią matematyczną (opisującą naszą zmienną) tworzy się zmienną losową, np. statystyka Z. Następnie określa się wartości jakie musiałaby ona przyjąć, aby było to mało prawdopodobne, tzn. takie, że prawdopodobieństwo ich wystąpienia równa się poziomowi istotności. Te mało prawdopodobne wartości tworzą obszar krytyczny. Jeżeli statystyka, jaką obliczamy dla populacji próbnej mieści się w obszarze krytycznym, to świadczy o tym, iż zdarzenie to nie powinno zaistnieć. Mamy zatem podstawy do odrzucenia hipotezy zerowej i przyjęcia hipotezy alternatywnej. 4) formułowanie - na podstawie wyników z próby, testu i przyjętych założeń - wniosku końcowego: "sformułowaną hipotezę zerową odrzucić" albo nie ma statystycznych podstaw do odrzucenia sformułowanej hipotezy zerowej" Interpretacja wyników: Uzyskane wyniki nie dają podstaw do odrzucenia hipotezy zerowej, a zarazem nie pozwalają stwierdzić, że średnie różnią się statystycznie. Doświadczenie nie udowodniło wyższości żadnego z zastosowanych poziomów czynnika doświadczalnego. Nie można jednak twierdzić, że nie było różnic pomiędzy obiema grupami. Różnice wystąpiły, jednakże nie można nic o nich powiedzieć na podstawie danego doświadczenia. Być może przy powtórzeniu doświadczenia różnica mogłaby się okazać statystycznie istotna. Autor: Dariusz Piwczyński 2 Metody statystyczne w naukach biologicznych 2006-04-11 Dla pojedynczej próby statystykę t obliczamy z wzoru: x − µ0 Sx t= Sx = Sx n Sx - średni błąd średniej arytmetycznej, błąd losowy Dla dwóch prób statystykę t obliczamy ze wzoru: tα odczytujemy dla liczby stopni swobody równej n1 + n2 - 2 x1 − x 2 t= SD Sd średni błąd różnicy średnich Sd średni błąd różnicy średnich (Test Cochrana-Coxa – nierówne wariancje) Sd = S + S 2 x1 S x21 2 ; Sx = x2 Sx n −1 - kwadrat średniego błędu średniej arytmetycznej Sx - średni błąd średniej arytmetycznej, błąd losowy Sd średni błąd różnicy średnich (Test T – równe wariancje) Sd = ( n1 − 1) * s12 + ( n2 − 1) * s22 n1 + n2 * (n1 + n2 − 2) n1 * n2 Autor: Dariusz Piwczyński 3 Metody statystyczne w naukach biologicznych 2006-04-11 DOŚWIADCZENIA W UKŁADZIE PAR SKORELOWANYCH. Doświadczenia w układzie par skorelowanych pozwalają na badanie wpływu czynnika doświadczalnego na zwierzęta i jednocześnie ograniczają wyraźnie wpływ czynników losowych. Jest to możliwe dzięki temu, iż elementy porównywanych grup zwierząt lub dwóch szeregów statystycznych mają między sobą ścisłe powiązanie. Zwierzęta do takiego typu doświadczeń dobiera się parami, które stanowią osobniki ze sobą spokrewnione, będące w podobnym wieku, pochodzące z tego samego budynku. Na przykład, jeśli chcemy zbadać efekt zastosowania dwóch pasz na świnie, zwierzęta dobiera się parami tj.: bierze się osobniki z tej samej chlewni, w tym samym wieku, najlepiej spokrewnione np.: półrodzeństwo. Następnie zwierzęta rozdzielamy do dwóch grup - otrzymujących różne pasze. W dalszej kolejności możemy zbadać różnice w działaniu tych pasz. Stosujemy test t do badania istotności różnic pomiędzy średnimi, ale nie analizujemy indywidualnych wartości każdej z prób, lecz różnice tych wartości w poszczególnych parach. Doświadczenie w układzie par skorelowanych możemy również wykorzystać w sytuacji, gdy badamy jedną grupę zwierząt, ale poddaną działaniu dwóch różnych poziomów czynnika doświadczalnego, oczywiście w innych przedziałach czasowych. Przykładem takiej sytuacji może być porównanie wydajności w kolejnych laktacjach tej samej grupy krów. W tym wypadku pary skorelowane stanowią wydajności tych laktacji. Sposób konstruowania i obliczeń w doświadczeniu: Badana populacja zwierząt to 24 matki rasy suffolk. Ocenie poddano wybrane cechy użytkowości mlecznej owiec. Sprawdź czy pomiędzy ilością uzyskanego mleka w doju próbnym oraz składnikami mleka w I i II miesiącu laktacji istnieją różnice istotne statystycznie. Stawiamy hipotezę zerową: wydajność mleka w pierwszym miesiącu laktacji owiec rasy suffolk nie różni się ze sobą. Lp 1 2 3 4 5 6 7 8 9 10 11 12 mleko1 mleko2 (ml) (ml) 130 80 170 40 90 100 140 375 135 120 320 75 di x2i - x1i 60 20 125 190 205 210 65 160 75 140 260 55 70 60 45 -150 -115 -110 75 215 60 -20 60 20 di 2 lp 4900 3600 2025 22500 13225 12100 5625 46225 3600 400 3600 400 13 14 15 16 17 18 19 20 21 22 23 24 mleko1 mleko2 (ml) (ml) 90 150 125 200 145 140 95 140 60 45 45 65 di x2i - x1i 130 155 170 195 70 160 115 100 80 100 70 135 di2 -40 1600 -5 25 -45 2025 5 25 75 5625 -20 400 -20 400 40 1600 -20 400 -55 3025 -25 625 -70 4900 30 138850 x1i - wartość cechy w pierwszej próbie x2i - wartość cechy w drugiej próbie d - nowa zmienna, której wartościami są różnice między analogicznymi wartościami z obu prób Jeśli Autor: Dariusz Piwczyński xd ≥ Sd ∗ t0,05 4 Metody statystyczne w naukach biologicznych 2006-04-11 to możemy wnioskować, iż czynnik doświadczalny wywiera istotny wpływ na analizowane cechy. x d - to średnia z różnicy średnich, obliczamy sumę różnicy średnich uwzględniając znak różnicy, następnie uzyskaną liczbę dzielimy przez liczbę par skorelowanych. W naszym przykładzie Sd Sd = x d wynosi 30/24, tj. 1,25 - błąd standardowy różnicy średnich S 2d n n - liczba par skorelowanych S = 2 d Sd = Σd 2 i 2 ( Σd i ) − n −1 n 30 2 138850 24 = 6035,33 = 23 6035,33 = 4,90 24 Porównujemy x d z błędem standardowym średniej arytmetycznej S2d pomnożonym przez wartość krytyczną t odczytaną z tabeli testu „t” dla liczby stopni swobody n-1 i odpowiednią liczbą stopni swobody (α). Odczytane t wynosi: 2,07. Sd * t 0, 05 = 4,90 * 2,07 = 10,14 Ponieważ x d jest mniejsze od iloczynu błędu standardowego różnicy średnich i wartości krytycznej t0,05, nie mamy podstaw do odrzucenia hipotezy zerowej. Kryteria doboru odpowiedniego testu Rozkład normalny? NIE Duże próby?n1 i n2>50? TAK Czy znane wariancje? TAK Czy równe NIE Test U TAK Test Z NIE Test Cochrana-Coxa TAK Test t Autor: Dariusz Piwczyński 5 NIE Testy