Wykład: Statystyka matematyczna – wprowadzenie

Transkrypt

Wykład: Statystyka matematyczna – wprowadzenie
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
Wykład: Założenia analizy wariancji. Analiza wariancji złożona i testy wielokrotnych
porównań.
Założenia analizy wariancji:
 Niezależność zmiennych objaśniających (czynników).

Homogeniczność wariancji (równość wariancji): porównywane grupy nie różnią się zmiennością. Jeśli
nie ma homogeniczności, to możliwe są logarytmiczne transformacje zmiennych lub też usunięcie grupy,
która pod względem zmienności wyraźnie odstaje od pozostałych.

Normalność: Rozkład cechy w każdej z grup winien być normalny. W praktyce często badamy czy
czynnik losowy, tj. eij posiada rozkład normalny. W celu sprawdzenia tego założenia, od każdego
pomiaru odejmujemy średnią wartość grupy, z której ten pomiar pochodzi, a następnie badamy rozkład
tychże różnic. Jeśli reszty nie mają rozkładu normalnego, to zaleca się transformacje zmiennych.
Model liniowy analizy wariancji:
Każda obserwacja przedstawiana jest jako suma efektów czynników, jakie zostały uwzględnione
w analizie zmienności.
Yij=µ + αi + eij
Czynnik stały (modele stałe): Z reguły liczba poziomów czynnika stałego jest niewielka.
W badaniach uwzględniamy z góry określone poziomy czynnika. Wnioski odnosimy wyłącznie do
tych poziomów czynnika, które zostały uwzględnione w analizie. Przykładem czynnika stałego
może być: płeć, grupa żywieniowa, rasa, rok badań, stado, sezon doju próbnego.
Czynnik losowy (modele losowe): Liczba poziomów czynnika losowego jest zwykle duża.
Badaniom poddany jest losowy podzbiór wszystkich poziomów czynnika. Nasze wnioski odnosimy
do wszystkich poziomów czynnika, nawet tych, które nie zostały uwzględnione w eksperymencie,
np. twierdzimy, że rasa wpływ na udział tłuszczu w mleko. Przykładem czynnika losowego jest
efekt matki, ojca, grupy genetycznej, rasy.
Różnica między czynnikami stałymi oraz losowymi jest dość płynna, w dużej mierze zależy od
postawionego do rozwiązania problemu.
Obs
1
2
3
4
5
14
15
16
17
18
NrZwierzecia
409634790
409634662
409633917
509090241
509013003
409633917
409634662
409634790
509083260
509127404
KgMleka
3075.9
3355.3
3658
3821.2
4474.4
3312
3549.8
3593.9
3743.6
3765.4
Reszty
-1463.26
-1183.86
-881.16
-717.96
-64.76
-1105.28
-867.48
-823.38
-673.68
-651.88
Predykcja
4539.16
4539.16
4539.16
4539.16
4539.16
4417.28
4417.28
4417.28
4417.28
4417.28
Model I analizy wariancji
Yij=µ + αi + eij
gdzie:
Yij – wartość cechy u j-tego obiektu pochodzącego z i-tej grupy,
µ - średnia ogólna, obliczona dla całej populacji,
αi- stały efekt i-tej grupy, tj. różnica między średnią dla i-tej grupy i dla całej populacji. Można ten
efekt traktować jako przewagę i-tej grupy nad przeciętną dla całej populacji.
Autor: Dariusz Piwczyński
1
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
eij – błąd losowy, resztowy.
Błąd losowy jest odchyleniem danej obserwacji od średniej grupy, z jakiej ona pochodzi.
Spowodowany jest zmiennością przypadkową, a ta dotyczy konkretnej obserwacji. Błąd jest to taka
część obserwowanej zmienności, która nie jest wytłumaczona za pomocą modelu.
Model II analizy wariancji
Yij=µ + Ai + eij
gdzie:
Ai- losowy efekt i-tej grupy, tj. różnica między średnią dla i-tej grupy i dla całej populacji,
Model dwuczynnikowy z interakcją. Analiza wariancji w układzie krzyżowym.
Yijk=µ + αi + βj + (αβ)ij + eijk
gdzie: (αβ)ij – efekt interakcji pomiędzy czynnikami (poprawka ze względu na interakcję).
Zaleca się, aby z modelu wyeliminować takie interakcje, które są nieistotne statystycznie. Zwiększa
się tym samym siłę działania czynników głównych. Jest to tym bardziej uzasadnione, jeśli: liczba
stopni swobody dla błędu jest mniejsza aniżeli 5 oraz średni kwadrat odchyleń dla interakcji
podzielony przez wariancję błędu jest mniejszy aniżeli 2.
Interakcja, czyli współdziałanie czynników ze sobą.
Jeśli interakcja jest istotna, to nie możemy porównywać średnich dla czynników głównych,
konieczne jest wtedy indywidualne porównanie poszczególnych podgrup, np. strefa odległości „1”
zakładu azotowego ze strefą odległości „1” w cementowni.
Autor: Dariusz Piwczyński
2
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
Model dwuczynnikowy, analiza wariancji w układzie hierarchicznym.
Jest to sytuacja, w której określone poziomy czynnika rozważane są w obrębie czynnika
nadrzędnego. np. kozioł czy też tryk kryje samice w wyłącznie w wybranych stadach.
Yijk=µ + αi + βij + eijk
gdzie:
αi – efekt stada, βij – czynnik zagnieżdżony, tj. wpływ ojca.
Autor: Dariusz Piwczyński
3
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
Przykład: Samce A i B kryły samice w następującym stadach:
Stado 1
A
Stado 2
B
Stado 3
A
B
Wynik analizy wariancji dwuczynnikowej z interakcją (SAS)
Zmienna zależna: nGat
Źródło
St.
sw.
Suma
kwadratów
Średnia
kwadratów
Model
23
8289.47088
360.41178
Błąd
933
8743.15608
9.37101
Razem
skorygowane
956
17032.62696
Wartość
F
38.46
Pr > F
<.0001
R-kwadrat Wsp. war. Pierwiastek MSE Średnia nGat
0.486682
21.72956
3.061211
14.08777
Źródło
St. Sw. Type III Suma kw. Średnia kwadratów Wartość F
Pr > F
Zaklad
5
3094.331294
618.866259
66.04
<.0001
Strefa
3
3371.342609
1123.780870
119.92
<.0001
1782.901984
118.860132
12.68
<.0001
Zaklad*Strefa 15
Dependent Variable: nGat nGat, po angielsku
Source
DF
Sum of Squares
Mean Square
F Value
Model
23
8289.47088
360.41178
38.46
Error
933
8743.15608
9.37101
Corrected Total
956
17032.62696
R-Square
Coeff Var
Root MSE
nGat Mean
0.486682
21.72956
3.061211
14.08777
Source
DF
Type III SS
Mean Square
F Value
Zaklad
5
3094.331294
618.866259
66.04
Autor: Dariusz Piwczyński
4
Pr > F
<.0001
Pr > F
<.0001
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
Source
DF
Type III SS
Mean Square
F Value
Strefa
3
3371.342609
1123.780870
119.92
<.0001
15
1782.901984
118.860132
12.68
<.0001
Zaklad*Strefa
Pr > F
W sytuacji, gdy wyniki analizy wariancji dają podstawę do odrzucenia hipotezy zerowej,
wykonujemy tzw. testy niezaplanowane, zwane inaczej testami a posteriori. Niedopuszczalne jest
stosowanie testu t-Studenta w przypadku większej liczby porównywanych średnich (więcej niż
2), gdyż drastycznie rośnie błąd I rodzaju dla całego doświadczenia. Przy jednej parze błąd ten
wynosić może 0,05, ale przy 4 średnich (6 możliwych porównań) prawdopodobieństwo, że się
pomylimy wynosi: 1-0,956, czyli aż 0.26.
Testy wielokrotnych porównań możemy je podzielić na 3 grupy:
 Analiza kontrastów (test Scheffego)
 Testy oparte na studentyzowanym rozstępie umożliwiające grupowanie średniach (NIR,
Newmana-Keulsa, Tukey, Duncan,)
 Wnioskowanie na podstawie przedziałów ufności (test Scheffego, Benferroniego, test
Dunneta)
Testy wielokrotnych porównań wykonujemy wtedy, gdy na podstawie analizy
wariancji stwierdzimy, iż czynnik wpływa istotnie na badaną cechę!!!!
Autor: Dariusz Piwczyński
5
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
Grupy jednorodne: są to takie grupy średnich, które nie różnią się statystycznie ze sobą.
Procedury, które zmierzają do wyróżnienia grup jednorodnych nazywają się procedurami porównań
wielokrotnych, procedurami jednoczesnego wnioskowania lub post-hoc. Testy te wykorzystujemy
przy analizie wariancji wykonywanej w ramach Modelu I.
Test Duncana jest oparty na studentyzowanym rozstępie. Poziom istotności dla całego
doświadczenia wynosi 1-(1-α)n-1. W sytuacji, gdy n rośnie do nieskończoności poziom ten rośnie do
jedności. W związku z czym, przy dużej liczbie porównywanych średnich prawdopodobieństwo
popełnienia błędu drastycznie rośnie. Test ten stosowany jest raczej jako test towarzyszący innym
testom. Test Duncana umożliwia tworzenie grup jednorodnych, czyli takich, pomiędzy którymi nie
występują różnice istotne statystycznie na podstawie prób niezależnych.
Kolejność działań przy wykonywaniu testu Duncana:
1. Porządkujemy rosnąco ciąg uzyskanych średnich arytmetycznych
2. Wybieramy parę średnich do porównania
3. Odczytujemy z tabel testu Duncana wartości krytyczne. Uzależnione są one od poziomu
istotności, liczby stopni swobody oraz typu rozstępu. Typ rozstępu - liczba wartości średnich
zawartych w jednym ciągu pomiędzy porównywanymi średnimi.
4. Wyliczamy tzw. istotny obszar zmienności: D*Sd
D – odczytujemy w zależności od liczby stopni swobody (zmienność wewnątrzgrupowa) oraz typu
rozstępu.
Sd =
2 S w2
n gr
S2w – wariancja dla zmienności wewnątrzgrupowej; ngr – przeciętna liczebność grupy
ni2 
 1  
∑

n gr = 
 * ∑ ni −
n
 k − 1  
∑ i 
k – liczba grup doświadczalnych, ni – liczebność grupy
Jeżeli |xi - xj| ≥ Sd*D0,05 to różnica pomiędzy średnimi jest istotna statystycznie;
Jeżeli |xi - xj| ≥ Sd*D0,01 to różnica pomiędzy średnimi jest wysoko istotna statystycznie;
Jeżeli |xi - xj| < Sd*D0,05 to różnica pomiędzy średnimi jest nieistotna statystycznie.
Test NIR [test najmniejszych istotnych różnic] (LSD [least significant differences]). Jest
najstarszym historycznie testem wielokrotnych porównań. Zaproponowany przez Fishera w 1949.
Jego idea polega na wyznaczeniu tzw. najmniejszych istotnych różnic i porównaniu ich z różnicami
średnich. Jest to test najmniej odporny na wzrost liczby wielokrotnych porównań, ponieważ poziom
istotności odnosi się do pojedynczego porównania. W takim przypadku bardzo szybko wzrasta
poziom istotności całego eksperymentu. Wobec powyższych test NIR stosowany jest jako test
towarzyszący innym testom. Jeśli bezwzględna wartość różnicy średnich z próby jest większa
aniżeli tzw. najmniejsza istotna różnica (NIR), to możemy stwierdzić, iż jest ona istotna
statystycznie.
Test Tukeya jest oparty o studentyzowany rozkład. Jest to test najbardziej polecany do porównania
par średnich. Pozwala on wyznaczać grupy średnich jednorodnych. Występuje w dwóch
odmianach: równa liczebność próbek, nierówna liczebność próbek (test Spjotvolla i Stolinea). Test
Tukea jest bardziej konserwatywny aniżeli NIR, lecz mniej niż test Scheffego. Błąd pierwszego
rodzaju jest przy tym teście mniejszy aniżeli w przypadku NIR, Duncan,a ponadto gwarantuje on
jednakowy poziom istotności dla wszystkich porównywanych par.
Autor: Dariusz Piwczyński
6
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
Test Scheffe jest testem najbardziej konserwatywnym, co oznacza, że rzadziej będziemy odrzucać
pojedyncze porównania niż w przypadku innych testów. Test Scheffe zapewnia łączny poziom
istotności dla wszystkich porównywanych par. Test ten doskonale nadaje się nie tylko do
porównania par cech, ale również uwzględnia wszelkie kontrasty. To test najbardziej zachowawczy,
gdyż błąd pierwszego rodzaju jest najmniejszy.
Analizę wariancji możemy wykonać w SAS za pomocą procedur ANOVA oraz
GLM.
ANOVA – Analysis of variance (Analiza wariancji)
General Linear Models (Ogólne modele liniowe)
Procedura anova w przypadku klasyfikacji pojedynczej (analiza jednoczynnikowa) oraz w
przypadku układów ortogonalnych daje identyczne rezultaty, jak GLM. GLM zalecana jest w
odniesieniu do klasyfikacji wieloczynnikowej, o niejednakowej wielkości grup doświadczalnych.
Przykład użycia procedury anova (glm):
proc anova data=biblioteka.tabela;
class czynnik;
model cecha = czynnik;
means czynnik/ tukey;
run;quit;
Objaśnienia:
class - nazwy czynników doświadczalnych/
model - tworzymy model analizy, zmienne zależne = zmienne niezależne (czynniki)
means - wskazujemy dla jakich grup mają być wyliczone średnie i jakie testy użyte do weryfikacji
różnic
Autor: Dariusz Piwczyński
7
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
Jak czytać istotności?
System SAS
The ANOVA Procedure
17:24 Monday, April 19, 2004
65
Test zakresu studentyzowanego Tukeya (HSD) dla pr_tloszac
UWAGA: Ten test sprawdza wartość błędu rodzaju I eksperymentalnie.
Alpha
0.01
Niepoprawne stopnie swobody
58
Kwadrat błędu średniej
11.11895
Wartość krytyczna zakresu studentyzowanego 4.60093
Porównania znaczące na poziomie 0.01 są wskazywane przez '***'.
Poniżej znajduje się efekt działania opcji „CLDIFF”. Porównywane grupy dobrane są parami,
przy każdej różnicy średnich znajduje się jej przedział ufności oraz informacja czy różnica jest
istotna statystycznie. Jak dowodzą rezultaty testu Tukey, jagnięta rasy merynos polski różnią się
wysoko istotnie z pozostałymi grupami genotypowymi. Nie stwierdzono różnic istotnych
statystycznie między grupami jagniąt z udziałem rasy suffolk, stanowią one grupę jednorodną.
Difference
gen
Comparison
su
su
su
R3
R3
R3
R2
R2
R2
mp
mp
mp
-
R3
R2
mp
su
R2
mp
su
R3
mp
su
R3
R2
Jednoczesny
Between
99% Confidence
Means
Limits
1.108
2.622
6.308
-1.108
1.514
5.200
-2.622
-1.514
3.686
-6.308
-5.200
-3.686
-2.377
-1.171
1.698
-4.593
-2.154
0.693
-6.414
-5.181
-1.063
-10.918
-9.707
-8.436
4.593
6.414
10.918
2.377
5.181
9.707
1.171
2.154
8.436
-1.698
-0.693
1.063
***
***
***
***
Różnice wysoko istotne statystycznie istnieją między grupami: su i mp
oraz R3 i mp.
The ANOVA Procedure
Test zakresu studentyzowanego Tukeya (HSD) dla pr_tloszac
UWAGA: Ten test sprawdza wartość błędu rodzaju I eksperymentalnie, lecz ma wyższą wartość błędu
rodzaju II niż REGWQ.
Alpha
0.01
Niepoprawne stopnie swobody
58
Kwadrat błędu średniej
11.11895
Wartość krytyczna zakresu studentyzowanego 4.60093
Różnica minimalnie znacząca
4.1653
Średnia harmoniczna rozmiarów komórek
13.56662
UWAGA: Rozmiary komórek nie są równe.
Means with the same letter are not significantly different.
Poniżej znajduje się efekt działania opcji „LINES”. Porównywane grupy uporządkowane są malejąco. Średnie, przy
których znajduje się ta sama litera stanowią, tzw. grupę średnich jednorodnych, tzn. które nie różnią się ze sobą.
Porównaj z wynikami istotności różnic powyżej. Bezwzględnie należy zwrócić uwagę, iż wzrost w genotypie jagniąt
udziału rasy suffolk korzystnie wpływa na procentowy udział wyrębów wartościowych w tuszy zwierząt.
Tukey Grouping
Autor: Dariusz Piwczyński
Mean
8
N
gen
Metody statystyczne w naukach biologicznych
2008-04-25 21:34
A
A
A
A
A
B
B
B
19.976
18
su
18.868
21
R3
17.354
15
R2
13.668
8
mp
Różnice wysoko istotne statystycznie istnieją między grupami: su i mp
oraz R3 i mp, ponieważ grupy te oznaczone są różnymi literami
lub też…
Średnie, przy których znajduje się te same litery stanowią grupę
średnich, które nie różnią się ze sobą. Litera „A” znajduje się przy
średnich grup su, R3 i mp, czyli te grupy nie różnią się ze sobą
statystycznie. Litera „B” znajdująca się przy grupach R2 i su również
znaczy, że nie ma między nimi różnicy istotnej.
Autor: Dariusz Piwczyński
9