Planowanie i analiza eksperymentu $2^{k-p}$ w
Transkrypt
Planowanie i analiza eksperymentu $2^{k-p}$ w
Planowanie i analiza doświadczeń typu 2(k−p) w 2r blokach Stanisław Jaworski,Wojciech Zieliński Streszczenie. W pracy przedstawiono metodę planowania i analizy eksperymentów typu 2k−p w 2r blokach. Metoda planowania polega na odpowiednim zadaniu zbioru efektów nieestymowalnych, na podstawie którego tworzony jest plan eksperymentu. Analiza wykorzystuje wykres probabilistyczny typu chi-kwadrat. Planowanie i analizę zilustrowano na przykładzie doświadczenia z burakiem cukrowym. 1. Wstęp Jednymi z częściej stosowanymi w praktyce doświadczeniami są eksperymenty, w których czynniki mogą występować tylko na dwóch poziomach: ”niskim” lub ”wysokim”. Jeżeli mamy k czynników, to takie doświadczenie oznaczane jest symbolem 2k . Jak nietrudno zauważyć, by móc oszacować wszystkie efekty występujące w takim modelu (efekty główne, współdziałania oraz wariancję błędu doświadczalnego) należałoby mieć co najmniej 2k + 1 obserwacji. Niestety, bardzo często nie jest możliwe zebranie takiej ilości danych. Ponadto podana wyżej liczba obserwacji jest minimalną liczbą przy założeniu, Że obiekty doświadczalne są wyrównane. Jeżeli jednak tak nie jest i pojawia się konieczność grupowania obiektów w blokach, to minimalna liczba obserwacji drastycznie wzrasta. Zrodziło to potrzebę stworzenia metod planowania i analizy doświadczeń omawianego typu w przypadku, gdy możemy zebrać mniej obserwacji niż trzeba. Teoria planowania doświadczeń czynnikowych jest bardzo dobrze rozwinięta. Podstawowym założeniem, jakie leży u podstaw konstrukcji planów doświadczeń jest jednakowa precyzja estymacji efektów pojawiających się w modelu tego doświadczenia. Dokładniej, estymatory efektów tego samego ”rzędu” (efektów głównych, współdzialań] pierwszego rzędu, drugiego rzędu, itd.) powinny mieć taką samą wariancję oraz estymatory te powinny być nieskorelowane. Okazuje się, że w przypadku, gdy mamy do dyspozycji mniej jednostek doświadczalnych niż estymowanych efektów, to musimy zrezygnować z estymacji niektórych z tych efektów. W literaturze (Federer 1955, Montgomery 1976) podane są różne sposoby konstrukcji planów, ale z reguły efekty nieestymowalne są konsekwencją wyboru planu doświadczenia. Celem niniejszej pracy jest konstrukcja oraz analiza doświadczeń przy zadanych zbiorach efektów nieestymowalnych, a także komputeryzacja tak postawionego problemu (dostępne pakiety statystyczne dają zazwyczaj ”jakieś” plany). 2. Plan doświadczenia Rozważamy doświadczenie z k czynnikami A1 , . . . , Ak . Chcemy przeprowadzić to doświadczenie na 2k−p jednostkach rozłożonych w 2r blokach. Chcemy skonstruować taki plan, by efekty poszczególnych rzędów były oszacowane z taką samą precyzją. Rozważmy przypadek, gdy r = 0, tzn. jednostki doświadczalne rozłożone są w jednym bloku. Przy redukcji eksperymentu typu 2k do 2k−p (p ≥ 0) jednostek doświadczalnych możemy estymować, z dokładnością do znaku, jedynie 2k−p − 1 liniowych kombinacji efektów z wagami ±1 składających się z 2p składników. Przykład. Chcemy przeprowadzić doświadczenie typu 22 , to znaczy mamy dwa czynniki A oraz B. Każdy z tych czynników stosujemy na jednym z dwóch poziomów: niskim (a, b) lub wysokim (A, B). Minimalna liczba obserwacji wynosi cztery: Nr. obiektu: Zabieg: Obserwacja: 1 2 ab aB y1 y2 3 4 Ab AB y3 y4 Wprowadzając średnią ogólną µ, standardowe restrykcje a+A = 0, b+B = 0 oraz odpowiednie restrykcje dla współdziałań ab, aB, Ab, AB nasze doświadczenie możemy zapisać w języku modeli liniowych w następujący sposób: y1 +1 −1 −1 +1 µ ε1 y2 +1 +1 −1 −1 A ε2 = + . y3 +1 −1 +1 −1 B ε3 y4 +1 +1 +1 +1 AB ε4 1 Ponieważ macierz planowania eksperymentu ma rząd cztery, więc w tym doświadczeniu estymowalne są wszystkie parametry poza wariancją błędu. Jak łatwo sprawdzić, estymatory najmniejszych kwadratów w tym modelu mają jednakowe wariancje oraz są nieskorelowane. Przypuśćmy, że dysponujemy mniejszą niż cztery liczbą jednostek. By zachować warunek nieskorelowania estymatorów musimy wybrać dwie jednostki doświadczalne. Zauważmy, że mamy sześć takich możliwości. Ograniczenie się jednak do dwóch jednostek powoduje, że estymowalne są tylko pewne kombinacje liniowe parametrów (wnika to z twierdzenia o estymowalności funkcji liniowych parametrów modeli liniowych). W poniższej tabelce podane są wszystkie możliwe doświadczenia i estymowalne kombinacje liniowe. Doświadczenie l 2 3 4 5 6 Obiekty 1, 2 1, 3 1, 4 2, 3 2, 4 3, 4 Estymowalne kombinacje µ−A B − AB µ−B A − AB µ + AB A+B µ − AB A−B µ+B A + AB µ+A B + AB W zależności od naszych potrzeb wybieramy tylko jedno z tych doświadczeń. Takie doświadczenie nazywamy doświadczeniem 22−1 . W teorii doświadczeń czynnikowych zazwyczaj stosuje się jedno oznaczenie na czynnik i parametr związany z tym czynnikiem. Będziemy więc mówić o czynnikach A1 , . . . , Ak i efektach A1 , . . . , Ak , A1 A2 , A1 A3 , . . . mając na myśli odpowiednie parametry. Rozważmy teraz przypadek, gdy jednostki doświadczalne pogrupowane są w r > 0 bloków. W modelu pojawia się więc jeszcze jeden parametr Γ, zwany efektem blokowym. Jeżeli dysponujemy tylko co najwyżej 2k jednostkami, to w sposób oczywisty pojawi nam się uwikłanie niektórych efektów z blokami. Podobnie jak w powyższym przykładzie estymowalność efektów uzależniona jest od wyboru efektu uwikłanego z blokami. W sytuacji, gdy mamy do dyspozycji 2k−p jednostek, to uwikłane z blokami będą niektóre z estymowalnych kombinacji liniowych. Wyboru estymowalnych kombinacji liniowych dokonujemy poprzez ustalenie p; efektów nieestymowalnych z powodu redukcji eksperymentu do mniejszej liczby jednostek oraz r efektów uwikłanych z blokami. Przykład. Planujemy doświadczenie typu 23 z czynnikami A, B, C. Pełne doświadczenie przebiega w następujący sposób Nr. obiektu: 1 2 3 4 5 6 7 8 Zabieg: abc abC aBc aBC Abc AbC ABc ABC Obserwacja: y1 y2 y3 y4 y5 y6 y7 y8 Przypuśćmy teraz, że mamy cztery jednostki doświadczalne (p = 1) zebrane w dwóch blokach (r = 1). Oto niektóre z możliwości zaplanowania doświadczenia Plan 1 Obiekty blok1 blok2 1, 2 3, 4 2 1, 2 3, 5 3 1, 2 3, 6 4 5 6 1, 6 2, 5 1, 5 4, 7 3, 8 7, 8 Estymowalne kombinacje liniowe parametrów I −A AB − B − Γ C − AC BC − ABC AC + BC − C − ABC I − A − B + AB − Γ I − AB − C + ABC + Γ B − A + AC − BC AC + BC − C − ABC I − A − B + AB − Γ I − AB + AC + BC + Γ A − B + C − ABC A − BC C − AB A + BC C + AB AC + BC C + ABC Parametr Γ oznacza efekt blokowy, zaś parametr I oznacza średnią ogólną. O doświadczeniu pierwszym powiemy, że efekt A oraz kombinacja liniowa AB − B nie są estymowalne odpowiednio z powodu redukcji eksperymentu i blokowania. Efekt A jest uwikłany ze średnią ogólną, a kombinacja liniowa AB − B jest 2 uwikłana z efektem blokowym. Kombinacji liniowych efektów ze średnią ogólną oraz z efektem blokowym nie uwzględniamy w zbiorze kombinacji estymowalnych. O efektach występujących w tego typu kombinacjach mówimy, że generują redukcje oraz podział na bloki. Poniżej podane są przykładowe plany wraz z odpowiednimi efektami generującymi. Plan 1 4 5 6 Obiekty Estymowalne kombinacje Efekty generujące blok1 blok2 liniowe parametrów redukcję bloki 1, 2 3, 4 C − AC BC − ABC A B 1, 6 4, 7 A − BC C − AB ABC B 2, 5 3, 8 A + BC C + AB ABC B 1, 5 7, 8 AC + BC C + ABC AB B Wyboru odpowiedniego planu doświadczenia dokonujemy na podstawie dwóch efektów podanych w ostatnich kolumnach powyższej tabeli. Efekty generujące wyznaczają z dokładnością do wag estymowalne kombinacje liniowe efektów. Podamy teraz opis planowania doświadczenia 2k−p w 2r blokach. Bardziej szczegółowy opis znajduje się w pracy Jaworskiego i Zielińskiego (1994). Planowanie rozpoczynamy od wyboru efektów generujących redukcje eksperymentu oraz od wyboru efektów generujących podział na bloki. Każda jednostka doświadczalna oraz każdy efekt może być reprezentowany przez wektor z przestrzeni {0, 1}k . Na przykład efekt A1 A4 jest reprezentowany przez wektor (1, 0, 0, 1, 0, . . . , 0). Niech L = ({0, 1}k , ⊕, ) będzie przestrzenią liniową nad ciałem liczb Z2 . Dodawanie ⊕ zdefiniowane jest jako dodawanie po współrzędnych modulo 2. Dla danego wektora a ∈ {0, 1}t , 0 < t < k, oraz wektorów wi ∈ {0, 1}k , i = 1, . . . , t, zdefiniujmy następujący zbiór t Za,w = v ∈ {0, 1}k : (ha, w1 i, . . . , ha, wt i) = a , 1 ,...,wt gdzie h·, ·i oznacza naturalny iloczyn skalarny w przestrzeni L. Dla ustalonych t oraz wektorów w1 , . . . , wt t zbiory Za,w tworzą podział zbioru {0, 1}k . Odpowiednio do potrzeb merytorycznych eksperymentu 1 ,...,wt wybieramy p + r liniowo niezależnych wektorów z przestrzeni L oraz, jeżeli p > 0, jeden wektor z przestrzeni {0, 1}p . Niech f1 , f2 , . . . , fp , b1 , b2 , . . . , br ∈ {0, 1}k oraz a0 ∈ {0, 1}p będą wybranymi przez nas wektorami. Wektory te determinują wybór 2k−p jednostek doświadczalnych i rozlokowanie ich do 2r równolicznych bloków. Konkretnie, plan eksperymentu 2k na 2k−p jednostkach doświadczalnych rozłożonych w 2r blokach ma postać: n o r Za,b ∩ Zap0 ,f1 ,...,fp : a ∈ {0, 1}r . 1 ,...,br Konsekwencją takiego wyboru jest estymowalność tylko pewnych kombinacji liniowych. Określmy następujące odwzorowanie: k {0, 1} 3 v −→ KL(v) = X k M E(v ⊕ h) · g(hαh , ai) · g hj , j=1 h∈H gdzie a0 ∈ {0, 1}p , h = (h1 , . . . , hk ) ∈ H = Lin{f1 ,L . . . , fp }, g : Z2 3 m → g(m) = 1 − 2m ∈ {−1, 1}. Wektor p αh = (αh1 , . . . , αhp ) jest takim wektorem, że h = i=1 (αhi fi ). Z niezależności wektorów fi , i = 1, . . . , p wynika jednoznaczność wektora αh . Niech G = Lin{b1 , . . . , br } będzie przestrzenią liniową rozpiętą na wektorach b1 , . . . , br . Jedynymi estymowalnymi kombinacjami liniowymi efektów są kombinacje liniowe ze zbioru: KL = KL(v) : v ∈ {0, 1}k \ {G ∪ H} . Przestrzenie liniowe H oraz G (z wyłączeniem wektorów zerowych) reprezentują efekty, które nie wchodzą w skład estymowalnych kombinacji liniowych efektów odpowiednio z powodu redukcji doświadczenia oraz L k blokowania. Funkcja g odpowiada za wagi ±1, które zapisane są w postaci iloczynu g(hαh , ai) · g h j=1 j . Zależą więc od wektora a0 . 3 Przykład. Planujemy doświadczenie 24−2 w jednym (r = 0) bloku z czynnikami A, B, C, D. Jako efekty generujące redukcję eksperymentu wybieramy AB oraz CD, tzn, wybieramy następujące wektory f1 oraz f2 : f1 = (1, 1, 0, 0) oraz f2 = (0, 0, 1, 1). Wówczas zbiorem efektów, które nie wchodzą w skład estymowalnych kombinacji liniowych efektów jest Lin{f1 , f2 } \ {(0, 0, 0, 0)} = {AB, CD, ABCD}. W zależności od wyboru wektora a0 mamy cztery możliwe plany doświadczenia: Plan 1 abcd abCd AbCD AbcD I II III IV Obiekt 2 3 abCD ABcd ABcD abcD aBcd aBCD aBcD aBCd W ektor a0 (0, 0) (0, 1) (1, 0) (1, 1) 4 ABCD ABCd Abcd AbCd P rzykladowa estymowalna kombinacja liniowa A + B + ACD + BCD A + B − ACD − BCD A − B + ACD − BCD A − B − ACD + BCD 3. Analiza statystyczna Ze względu na małą liczbę obserwacji oszacowanie wariancji błędu losowego będzie zawierało w sobie oszacowania niektórych, wybranych przez nas, efektów. Powinny to być oszacowania efektów nieistotnych. W przeciwnym razie estymator wariancji błędu losowego będzie obciążony wartością średnią niezerowego efektu. Ponieważ określenie a priori, które efekty są nieistotne z reguły nie jest możliwe, to określenie nieistotnych efektów dokonywane jest a posteriori. Można to zrobić wykorzystując wykres probabilistyczny. Na osi pionowej wykresu zaznaczane są sumy kwadratów S(j) (S(1) ≤ · · · S(l) ) wybranych efektów. Na osi poziomej j−q zaznaczane są kwantyle centralnego rozkładu chi-kwadrat z jednym stopniem swobody rzędu aj = l−2a+1 , j = 1, . . . , l (0 < a < 0.5). Sposób wyznaczania kwantyli podany jest w pracy Wagnera (1990). Dla efektów nieistotnych sumy kwadratów mają centralny rozkład chi-kwadrat z jednym stopniem swobody i punkty na wykresie powinny być ”mniej więcej” współliniowe. Punkty odbiegające od linii prostej świadczą o tym, iż odpowiednie sumy kwadratów mają niecentralny rozkład chi-kwadrat, a to oznacza, iż odpowiednich efektów nie można uznać za nieistotne. Do oszacowania wariancji błędu losowego włączamy ”współliniowe” sumy kwadratów. W celu podania jawnego wzoru na sumy kwadratów kombinacji liniowych określamy następujące odwzorowanie: X {0, 1} 3 w −→ CD (w) = Y (v)g(h1 ⊕ v, wi), v∈D k gdzie D ⊆ {0, 1} , Y (v) obserwacja na jednostce eksperymentalnej v, 1 - wektor składający się z jedynek. Wówczas suma kwadratów dla kombinacji liniowej efektów KL(v) ma następującą postać: h SSKL(v) = CZap 0 ,f1 ,...,fp 2k−p i2 (v) . Jeżeli Y (v) ∼ N (mv , σ 2 ) oraz kombinacja liniowa KL(v) jest nieistotna, to suma kwadratów SSKL(v) ma rozkład chi-kwadrat z jednym stopniem swobody. Sumy kwadratów kombinacji liniowych efektów SSKL(v) spełniają następujący warunek: dla v1 , v2 ∈ L takich,że v1 ⊕ v2 ∈ H zachodzi SSKL(v1 ) = SSKL(v2 ) . Koncentrujemy naszą uwagę na takich wektorach v1 , . . . , vm , gdzie m jest pewną liczbą, że ∀vi 6=vj SSKL(vi ) 6= SSKL(vj ) . Bez względu na wybór wektorów f1 , . . . , fp , przy p > 0, zawsze m = 2k−p − 1. Ponieważ istotność pewnych kombinacji liniowych będziemy chcieli zbadać przy pomocy testu, a nie wykresu probabilistycznego, ich sumy 4 kwadratów nie będą brane pod uwagę przy konstrukcji wykresu probabilistycznego. Powiedzmy, że będą to kombinacje ze zbioru: {KL(vi ) : i = l + 1, . . . , m; l < m} . Zatem do wykresu zostaną wzięte sumy kwadratów z następującego zbioru: SSKL(vi ) : i = 1, . . . , l . 4. Przykład liczbowy Badaczy interesował wpływ na plon korzenia buraka (cecha Y ) siedmiu następujących czynników: dokarmianie dolistne (A), dawka (B), termin siewu (C), termin stosowania nawożenia azotowego (D), termin zbioru (E), podział dawki nawożenia azotowego (F ) oraz obsada (G). Eksperyment 27 należało zaplanować w 23 blokach w jednym powtórzeniu. Jako efekty uwikłane z blokami wybrano ABC, DEF , AF G, tzn. wybrano wektory b1 = (1, 1, 1, 0, 0, 0, 0), b2 = (0, 0, 0, 1, 1, 1, 0) oraz b3 = (1, 0, 0, 0, 0, 1, 1, 0). Efekty uwikłane z blokami tworzą zbiór Lin{b1 , b2 , b3 } \ 0 = {ABC, DEF, AF G, ADEG, BCF G, BCDEG, ABCDEF }. Wektory bi , i = l, 2, 3 zostały tak dobrane, aby uwikłane z blokami efekty były interakcjami możliwie wysokiego rzędu. Wektory bi , i = 1, 2, 3, determinują następujący plan doświadczenia (obecność litery wskazuje na wysoki poziom czynnika): Obiekt l 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 I de acdeg (1) abdeg df g abdf acg acef abg bcef g ef g acdf bcdf g abef bcde bc II cd abcdef bdef g ce bf g cf g be af abcdg adg adef cdef g abcf bd abceg aeg III acf abdef abeg abf bcf g aceg e acdef def g bcdef g bcd d abdg fg bce acdg Blok IV V abcdf g beg bdf cdef cdeg cdg abcde abce a abcdef g cef bf abcef g bdef adf g af g abc adef g cg ad aef g ceg ade bdg bef ae bdeg cf cdf abcd bg abcf g VI g df abef g ab ef bcdf bcef abde bcdeg acdf g bcg acef g deg ac acde abdf g V II bcdg bcf abc acdef g bceg ace abdef g f abf g dg bcdef acd def eg acf g abd V III ag bdf g abcdf b adeg cef g cdf g abcg c abcdeg adf abcef bef g aef bde cde Na podstawie uzyskanych wyników wyznaczono sumy kwadratów dla efektów. Skonstruowano następujący wykres probabilistyczny, do którego użyto sum kwadratów dla interakcji rzędu większego niż trzy: Punkty na prawo od narysowanej pionowej prostej odpowiadają efektom, których oszacowania nie powinny składać się na oszacowanie wariancji błędu losowego. Są to efekty: ABCE ABCG ABDG ADEF G ACF G ABEG ABCDEF G ADF G AC DEF ABCEF G ABC D ACDF G ABDEF G Po odrzuceniu sum kwadratów dla tych efektów ponownie skonstruowano wykres probabilistyczny. Po kilkukrotnym zastosowaniu tej procedury na oszacowanie błędu losowego złożyły się oszacowania następujących efektów: DCDG ABDE BCEG CDEF G ABDEF DEF G BDEF G BCEF ACEG BEF G ACDEF G ABEF G BDEF BCDF G ACDF ACEF BCDF BCDEF G ABDF G ABF G BCDEF CDEG CDEF ABDF ABCDEG BCEF G ACDG ABCDG BDEG BDF G AEF G ACEF G ABCDE CEF G ABCF G ABCF BCDE CDF G ABDEG ACDE ADEF 5 Otrzymano następujące wyniki dla efektów głównych: Źródło zmienności A B C D E F G Bd ∗ St.sw. 1 1 1 1 1 1 1 41 Średni kwadrat F 11514.03 4.22∗ 17353.85 6.36∗ 65395.36 23.96∗ 101.89 0.04 72513.84 26.57∗ 992.35 0.36 11631.94 4.26∗ 2729.139 oznacza istotność efektu na poziomie istotności 0.05 Literatura cytowana FEDERER W.T., (1955) Experimental Design, The Macmillan Company, New York. JAWORSKI S., ZIELIŃSKI W., (1994) Planowanie eksperymentu 2(k−p) w 2r blokach, Algorytmy Biometryczne i Statystyczne, w druku. MONTGOMERY D.C., (1976) Design and Analysis of Experiments, John Wiley & Sons, New York. WAGNER W., (1990) Zastosowanie wykresów probabilistycznych w jednozmiennej analizie wariancji, Listy Biometryczne, 27, 47-60 6