Planowanie i analiza eksperymentu $2^{k-p}$ w

Transkrypt

Planowanie i analiza eksperymentu $2^{k-p}$ w
Planowanie i analiza doświadczeń typu 2(k−p) w 2r blokach
Stanisław Jaworski,Wojciech Zieliński
Streszczenie. W pracy przedstawiono metodę planowania i analizy eksperymentów typu 2k−p w 2r blokach. Metoda planowania polega na odpowiednim zadaniu zbioru efektów nieestymowalnych, na podstawie
którego tworzony jest plan eksperymentu. Analiza wykorzystuje wykres probabilistyczny typu chi-kwadrat.
Planowanie i analizę zilustrowano na przykładzie doświadczenia z burakiem cukrowym.
1. Wstęp
Jednymi z częściej stosowanymi w praktyce doświadczeniami są eksperymenty, w których czynniki mogą
występować tylko na dwóch poziomach: ”niskim” lub ”wysokim”. Jeżeli mamy k czynników, to takie doświadczenie oznaczane jest symbolem 2k . Jak nietrudno zauważyć, by móc oszacować wszystkie efekty występujące w takim modelu (efekty główne, współdziałania oraz wariancję błędu doświadczalnego) należałoby
mieć co najmniej 2k + 1 obserwacji. Niestety, bardzo często nie jest możliwe zebranie takiej ilości danych.
Ponadto podana wyżej liczba obserwacji jest minimalną liczbą przy założeniu, Że obiekty doświadczalne są
wyrównane. Jeżeli jednak tak nie jest i pojawia się konieczność grupowania obiektów w blokach, to minimalna liczba obserwacji drastycznie wzrasta. Zrodziło to potrzebę stworzenia metod planowania i analizy
doświadczeń omawianego typu w przypadku, gdy możemy zebrać mniej obserwacji niż trzeba.
Teoria planowania doświadczeń czynnikowych jest bardzo dobrze rozwinięta. Podstawowym założeniem, jakie
leży u podstaw konstrukcji planów doświadczeń jest jednakowa precyzja estymacji efektów pojawiających
się w modelu tego doświadczenia. Dokładniej, estymatory efektów tego samego ”rzędu” (efektów głównych,
współdzialań] pierwszego rzędu, drugiego rzędu, itd.) powinny mieć taką samą wariancję oraz estymatory
te powinny być nieskorelowane. Okazuje się, że w przypadku, gdy mamy do dyspozycji mniej jednostek
doświadczalnych niż estymowanych efektów, to musimy zrezygnować z estymacji niektórych z tych efektów.
W literaturze (Federer 1955, Montgomery 1976) podane są różne sposoby konstrukcji planów, ale z reguły
efekty nieestymowalne są konsekwencją wyboru planu doświadczenia. Celem niniejszej pracy jest konstrukcja
oraz analiza doświadczeń przy zadanych zbiorach efektów nieestymowalnych, a także komputeryzacja tak
postawionego problemu (dostępne pakiety statystyczne dają zazwyczaj ”jakieś” plany).
2. Plan doświadczenia
Rozważamy doświadczenie z k czynnikami A1 , . . . , Ak . Chcemy przeprowadzić to doświadczenie na 2k−p
jednostkach rozłożonych w 2r blokach. Chcemy skonstruować taki plan, by efekty poszczególnych rzędów
były oszacowane z taką samą precyzją.
Rozważmy przypadek, gdy r = 0, tzn. jednostki doświadczalne rozłożone są w jednym bloku. Przy redukcji
eksperymentu typu 2k do 2k−p (p ≥ 0) jednostek doświadczalnych możemy estymować, z dokładnością do
znaku, jedynie 2k−p − 1 liniowych kombinacji efektów z wagami ±1 składających się z 2p składników.
Przykład. Chcemy przeprowadzić doświadczenie typu 22 , to znaczy mamy dwa czynniki A oraz B. Każdy
z tych czynników stosujemy na jednym z dwóch poziomów: niskim (a, b) lub wysokim (A, B). Minimalna
liczba obserwacji wynosi cztery:
Nr. obiektu:
Zabieg:
Obserwacja:
1
2
ab aB
y1 y2
3
4
Ab AB
y3 y4
Wprowadzając średnią ogólną µ, standardowe restrykcje a+A = 0, b+B = 0 oraz odpowiednie restrykcje dla
współdziałań ab, aB, Ab, AB nasze doświadczenie możemy zapisać w języku modeli liniowych w następujący
sposób:
  

  
y1
+1 −1 −1 +1
µ
ε1
 y2   +1 +1 −1 −1   A   ε2 
 =

 +  .
y3
+1 −1 +1 −1
B
ε3
y4
+1 +1 +1 +1
AB
ε4
1
Ponieważ macierz planowania eksperymentu ma rząd cztery, więc w tym doświadczeniu estymowalne są
wszystkie parametry poza wariancją błędu. Jak łatwo sprawdzić, estymatory najmniejszych kwadratów w
tym modelu mają jednakowe wariancje oraz są nieskorelowane. Przypuśćmy, że dysponujemy mniejszą niż
cztery liczbą jednostek. By zachować warunek nieskorelowania estymatorów musimy wybrać dwie jednostki
doświadczalne. Zauważmy, że mamy sześć takich możliwości. Ograniczenie się jednak do dwóch jednostek
powoduje, że estymowalne są tylko pewne kombinacje liniowe parametrów (wnika to z twierdzenia o estymowalności funkcji liniowych parametrów modeli liniowych). W poniższej tabelce podane są wszystkie możliwe
doświadczenia i estymowalne kombinacje liniowe.
Doświadczenie
l
2
3
4
5
6
Obiekty
1, 2
1, 3
1, 4
2, 3
2, 4
3, 4
Estymowalne kombinacje
µ−A
B − AB
µ−B
A − AB
µ + AB
A+B
µ − AB
A−B
µ+B
A + AB
µ+A
B + AB
W zależności od naszych potrzeb wybieramy tylko jedno z tych doświadczeń. Takie doświadczenie nazywamy
doświadczeniem 22−1 .
W teorii doświadczeń czynnikowych zazwyczaj stosuje się jedno oznaczenie na czynnik i parametr związany z
tym czynnikiem. Będziemy więc mówić o czynnikach A1 , . . . , Ak i efektach A1 , . . . , Ak , A1 A2 , A1 A3 , . . . mając
na myśli odpowiednie parametry.
Rozważmy teraz przypadek, gdy jednostki doświadczalne pogrupowane są w r > 0 bloków. W modelu
pojawia się więc jeszcze jeden parametr Γ, zwany efektem blokowym. Jeżeli dysponujemy tylko co najwyżej
2k jednostkami, to w sposób oczywisty pojawi nam się uwikłanie niektórych efektów z blokami. Podobnie jak
w powyższym przykładzie estymowalność efektów uzależniona jest od wyboru efektu uwikłanego z blokami.
W sytuacji, gdy mamy do dyspozycji 2k−p jednostek, to uwikłane z blokami będą niektóre z estymowalnych
kombinacji liniowych. Wyboru estymowalnych kombinacji liniowych dokonujemy poprzez ustalenie p; efektów
nieestymowalnych z powodu redukcji eksperymentu do mniejszej liczby jednostek oraz r efektów uwikłanych
z blokami.
Przykład. Planujemy doświadczenie typu 23 z czynnikami A, B, C. Pełne doświadczenie przebiega w następujący sposób
Nr. obiektu: 1
2
3
4
5
6
7
8
Zabieg:
abc abC aBc aBC Abc AbC ABc ABC
Obserwacja: y1
y2
y3
y4
y5
y6
y7
y8
Przypuśćmy teraz, że mamy cztery jednostki doświadczalne (p = 1) zebrane w dwóch blokach (r = 1). Oto
niektóre z możliwości zaplanowania doświadczenia
Plan
1
Obiekty
blok1 blok2
1, 2
3, 4
2
1, 2
3, 5
3
1, 2
3, 6
4
5
6
1, 6
2, 5
1, 5
4, 7
3, 8
7, 8
Estymowalne kombinacje
liniowe parametrów
I −A
AB − B − Γ
C − AC
BC − ABC
AC + BC − C − ABC I − A − B + AB − Γ
I − AB − C + ABC + Γ B − A + AC − BC
AC + BC − C − ABC I − A − B + AB − Γ
I − AB + AC + BC + Γ A − B + C − ABC
A − BC
C − AB
A + BC
C + AB
AC + BC
C + ABC
Parametr Γ oznacza efekt blokowy, zaś parametr I oznacza średnią ogólną. O doświadczeniu pierwszym
powiemy, że efekt A oraz kombinacja liniowa AB − B nie są estymowalne odpowiednio z powodu redukcji
eksperymentu i blokowania. Efekt A jest uwikłany ze średnią ogólną, a kombinacja liniowa AB − B jest
2
uwikłana z efektem blokowym. Kombinacji liniowych efektów ze średnią ogólną oraz z efektem blokowym
nie uwzględniamy w zbiorze kombinacji estymowalnych. O efektach występujących w tego typu kombinacjach mówimy, że generują redukcje oraz podział na bloki. Poniżej podane są przykładowe plany wraz z
odpowiednimi efektami generującymi.
Plan
1
4
5
6
Obiekty
Estymowalne kombinacje Efekty generujące
blok1 blok2
liniowe parametrów
redukcję
bloki
1, 2
3, 4
C − AC
BC − ABC
A
B
1, 6
4, 7
A − BC
C − AB
ABC
B
2, 5
3, 8
A + BC
C + AB
ABC
B
1, 5
7, 8 AC + BC
C + ABC
AB
B
Wyboru odpowiedniego planu doświadczenia dokonujemy na podstawie dwóch efektów podanych w ostatnich
kolumnach powyższej tabeli. Efekty generujące wyznaczają z dokładnością do wag estymowalne kombinacje
liniowe efektów.
Podamy teraz opis planowania doświadczenia 2k−p w 2r blokach. Bardziej szczegółowy opis znajduje się w
pracy Jaworskiego i Zielińskiego (1994). Planowanie rozpoczynamy od wyboru efektów generujących redukcje eksperymentu oraz od wyboru efektów generujących podział na bloki. Każda jednostka doświadczalna
oraz każdy efekt może być reprezentowany przez wektor z przestrzeni {0, 1}k . Na przykład efekt A1 A4 jest
reprezentowany przez wektor (1, 0, 0, 1, 0, . . . , 0). Niech L = ({0, 1}k , ⊕, ) będzie przestrzenią liniową nad
ciałem liczb Z2 . Dodawanie ⊕ zdefiniowane jest jako dodawanie po współrzędnych modulo 2. Dla danego
wektora a ∈ {0, 1}t , 0 < t < k, oraz wektorów wi ∈ {0, 1}k , i = 1, . . . , t, zdefiniujmy następujący zbiór
t
Za,w
= v ∈ {0, 1}k : (ha, w1 i, . . . , ha, wt i) = a ,
1 ,...,wt
gdzie h·, ·i oznacza naturalny iloczyn skalarny w przestrzeni L. Dla ustalonych t oraz wektorów w1 , . . . , wt
t
zbiory Za,w
tworzą podział zbioru {0, 1}k . Odpowiednio do potrzeb merytorycznych eksperymentu
1 ,...,wt
wybieramy p + r liniowo niezależnych wektorów z przestrzeni L oraz, jeżeli p > 0, jeden wektor z przestrzeni
{0, 1}p . Niech f1 , f2 , . . . , fp , b1 , b2 , . . . , br ∈ {0, 1}k oraz a0 ∈ {0, 1}p będą wybranymi przez nas wektorami.
Wektory te determinują wybór 2k−p jednostek doświadczalnych i rozlokowanie ich do 2r równolicznych
bloków. Konkretnie, plan eksperymentu 2k na 2k−p jednostkach doświadczalnych rozłożonych w 2r blokach
ma postać:
n
o
r
Za,b
∩ Zap0 ,f1 ,...,fp : a ∈ {0, 1}r .
1 ,...,br
Konsekwencją takiego wyboru jest estymowalność tylko pewnych kombinacji liniowych. Określmy następujące odwzorowanie:
k
{0, 1} 3 v −→ KL(v) =
X


k
M
E(v ⊕ h) · g(hαh , ai) · g 
hj  ,
j=1
h∈H
gdzie a0 ∈ {0, 1}p , h = (h1 , . . . , hk ) ∈ H = Lin{f1 ,L
. . . , fp }, g : Z2 3 m → g(m) = 1 − 2m ∈ {−1, 1}. Wektor
p
αh = (αh1 , . . . , αhp ) jest takim wektorem, że h = i=1 (αhi fi ). Z niezależności wektorów fi , i = 1, . . . , p
wynika jednoznaczność wektora αh .
Niech G = Lin{b1 , . . . , br } będzie przestrzenią liniową rozpiętą na wektorach b1 , . . . , br . Jedynymi estymowalnymi kombinacjami liniowymi efektów są kombinacje liniowe ze zbioru:
KL = KL(v) : v ∈ {0, 1}k \ {G ∪ H} .
Przestrzenie liniowe H oraz G (z wyłączeniem wektorów zerowych) reprezentują efekty, które nie wchodzą
w skład estymowalnych kombinacji liniowych efektów odpowiednio z powodu redukcji doświadczenia
oraz
L
k
blokowania. Funkcja g odpowiada za wagi ±1, które zapisane są w postaci iloczynu g(hαh , ai) · g
h
j=1 j .
Zależą więc od wektora a0 .
3
Przykład. Planujemy doświadczenie 24−2 w jednym (r = 0) bloku z czynnikami A, B, C, D. Jako efekty
generujące redukcję eksperymentu wybieramy AB oraz CD, tzn, wybieramy następujące wektory f1 oraz
f2 :
f1 = (1, 1, 0, 0)
oraz
f2 = (0, 0, 1, 1).
Wówczas zbiorem efektów, które nie wchodzą w skład estymowalnych kombinacji liniowych efektów jest
Lin{f1 , f2 } \ {(0, 0, 0, 0)} = {AB, CD, ABCD}.
W zależności od wyboru wektora a0 mamy cztery możliwe plany doświadczenia:
Plan
1
abcd
abCd
AbCD
AbcD
I
II
III
IV
Obiekt
2
3
abCD ABcd
ABcD abcD
aBcd aBCD
aBcD aBCd
W ektor
a0
(0, 0)
(0, 1)
(1, 0)
(1, 1)
4
ABCD
ABCd
Abcd
AbCd
P rzykladowa estymowalna
kombinacja liniowa
A + B + ACD + BCD
A + B − ACD − BCD
A − B + ACD − BCD
A − B − ACD + BCD
3. Analiza statystyczna
Ze względu na małą liczbę obserwacji oszacowanie wariancji błędu losowego będzie zawierało w sobie oszacowania niektórych, wybranych przez nas, efektów. Powinny to być oszacowania efektów nieistotnych. W
przeciwnym razie estymator wariancji błędu losowego będzie obciążony wartością średnią niezerowego efektu.
Ponieważ określenie a priori, które efekty są nieistotne z reguły nie jest możliwe, to określenie nieistotnych
efektów dokonywane jest a posteriori. Można to zrobić wykorzystując wykres probabilistyczny. Na osi pionowej wykresu zaznaczane są sumy kwadratów S(j) (S(1) ≤ · · · S(l) ) wybranych efektów. Na osi poziomej
j−q
zaznaczane są kwantyle centralnego rozkładu chi-kwadrat z jednym stopniem swobody rzędu aj = l−2a+1
,
j = 1, . . . , l (0 < a < 0.5). Sposób wyznaczania kwantyli podany jest w pracy Wagnera (1990). Dla efektów
nieistotnych sumy kwadratów mają centralny rozkład chi-kwadrat z jednym stopniem swobody i punkty na
wykresie powinny być ”mniej więcej” współliniowe. Punkty odbiegające od linii prostej świadczą o tym, iż
odpowiednie sumy kwadratów mają niecentralny rozkład chi-kwadrat, a to oznacza, iż odpowiednich efektów nie można uznać za nieistotne. Do oszacowania wariancji błędu losowego włączamy ”współliniowe” sumy
kwadratów. W celu podania jawnego wzoru na sumy kwadratów kombinacji liniowych określamy następujące
odwzorowanie:
X
{0, 1} 3 w −→ CD (w) =
Y (v)g(h1 ⊕ v, wi),
v∈D
k
gdzie D ⊆ {0, 1} , Y (v) obserwacja na jednostce eksperymentalnej v, 1 - wektor składający się z jedynek.
Wówczas suma kwadratów dla kombinacji liniowej efektów KL(v) ma następującą postać:
h
SSKL(v) =
CZap
0 ,f1 ,...,fp
2k−p
i2
(v)
.
Jeżeli Y (v) ∼ N (mv , σ 2 ) oraz kombinacja liniowa KL(v) jest nieistotna, to suma kwadratów SSKL(v) ma
rozkład chi-kwadrat z jednym stopniem swobody. Sumy kwadratów kombinacji liniowych efektów SSKL(v)
spełniają następujący warunek:
dla v1 , v2 ∈ L takich,że v1 ⊕ v2 ∈ H zachodzi SSKL(v1 ) = SSKL(v2 ) .
Koncentrujemy naszą uwagę na takich wektorach v1 , . . . , vm , gdzie m jest pewną liczbą, że
∀vi 6=vj
SSKL(vi ) 6= SSKL(vj ) .
Bez względu na wybór wektorów f1 , . . . , fp , przy p > 0, zawsze m = 2k−p − 1. Ponieważ istotność pewnych
kombinacji liniowych będziemy chcieli zbadać przy pomocy testu, a nie wykresu probabilistycznego, ich sumy
4
kwadratów nie będą brane pod uwagę przy konstrukcji wykresu probabilistycznego. Powiedzmy, że będą to
kombinacje ze zbioru:
{KL(vi ) : i = l + 1, . . . , m; l < m} .
Zatem do wykresu zostaną wzięte sumy kwadratów z następującego zbioru:
SSKL(vi ) : i = 1, . . . , l .
4. Przykład liczbowy
Badaczy interesował wpływ na plon korzenia buraka (cecha Y ) siedmiu następujących czynników: dokarmianie dolistne (A), dawka (B), termin siewu (C), termin stosowania nawożenia azotowego (D), termin zbioru
(E), podział dawki nawożenia azotowego (F ) oraz obsada (G). Eksperyment 27 należało zaplanować w 23
blokach w jednym powtórzeniu. Jako efekty uwikłane z blokami wybrano ABC, DEF , AF G, tzn. wybrano
wektory b1 = (1, 1, 1, 0, 0, 0, 0), b2 = (0, 0, 0, 1, 1, 1, 0) oraz b3 = (1, 0, 0, 0, 0, 1, 1, 0). Efekty uwikłane z blokami
tworzą zbiór
Lin{b1 , b2 , b3 } \ 0 = {ABC, DEF, AF G, ADEG, BCF G, BCDEG, ABCDEF }.
Wektory bi , i = l, 2, 3 zostały tak dobrane, aby uwikłane z blokami efekty były interakcjami możliwie wysokiego rzędu. Wektory bi , i = 1, 2, 3, determinują następujący plan doświadczenia (obecność litery wskazuje
na wysoki poziom czynnika):
Obiekt
l
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
I
de
acdeg
(1)
abdeg
df g
abdf
acg
acef
abg
bcef g
ef g
acdf
bcdf g
abef
bcde
bc
II
cd
abcdef
bdef g
ce
bf g
cf g
be
af
abcdg
adg
adef
cdef g
abcf
bd
abceg
aeg
III
acf
abdef
abeg
abf
bcf g
aceg
e
acdef
def g
bcdef g
bcd
d
abdg
fg
bce
acdg
Blok
IV
V
abcdf g
beg
bdf
cdef
cdeg
cdg
abcde
abce
a
abcdef g
cef
bf
abcef g
bdef
adf g
af g
abc
adef g
cg
ad
aef g
ceg
ade
bdg
bef
ae
bdeg
cf
cdf
abcd
bg
abcf g
VI
g
df
abef g
ab
ef
bcdf
bcef
abde
bcdeg
acdf g
bcg
acef g
deg
ac
acde
abdf g
V II
bcdg
bcf
abc
acdef g
bceg
ace
abdef g
f
abf g
dg
bcdef
acd
def
eg
acf g
abd
V III
ag
bdf g
abcdf
b
adeg
cef g
cdf g
abcg
c
abcdeg
adf
abcef
bef g
aef
bde
cde
Na podstawie uzyskanych wyników wyznaczono sumy kwadratów dla efektów. Skonstruowano następujący
wykres probabilistyczny, do którego użyto sum kwadratów dla interakcji rzędu większego niż trzy:
Punkty na prawo od narysowanej pionowej prostej odpowiadają efektom, których oszacowania nie powinny
składać się na oszacowanie wariancji błędu losowego. Są to efekty:
ABCE ABCG ABDG ADEF G ACF G ABEG ABCDEF G
ADF G AC DEF ABCEF G ABC D ACDF G ABDEF G
Po odrzuceniu sum kwadratów dla tych efektów ponownie skonstruowano wykres probabilistyczny. Po kilkukrotnym zastosowaniu tej procedury na oszacowanie błędu losowego złożyły się oszacowania następujących
efektów:
DCDG ABDE BCEG CDEF G
ABDEF DEF G BDEF G
BCEF ACEG BEF G ACDEF G ABEF G BDEF BCDF G
ACDF ACEF BCDF BCDEF G ABDF G ABF G BCDEF
CDEG CDEF ABDF ABCDEG BCEF G ACDG ABCDG
BDEG BDF G AEF G ACEF G
ABCDE CEF G ABCF G
ABCF BCDE CDF G ABDEG
ACDE
ADEF
5
Otrzymano następujące wyniki dla efektów głównych:
Źródło zmienności
A
B
C
D
E
F
G
Bd
∗
St.sw.
1
1
1
1
1
1
1
41
Średni kwadrat
F
11514.03
4.22∗
17353.85
6.36∗
65395.36
23.96∗
101.89
0.04
72513.84
26.57∗
992.35
0.36
11631.94
4.26∗
2729.139
oznacza istotność efektu na poziomie istotności 0.05
Literatura cytowana
FEDERER W.T., (1955) Experimental Design, The Macmillan Company, New York.
JAWORSKI S., ZIELIŃSKI W., (1994) Planowanie eksperymentu 2(k−p) w 2r blokach, Algorytmy Biometryczne i Statystyczne, w druku.
MONTGOMERY D.C., (1976) Design and Analysis of Experiments, John Wiley & Sons, New York.
WAGNER W., (1990) Zastosowanie wykresów probabilistycznych w jednozmiennej analizie wariancji, Listy
Biometryczne, 27, 47-60
6