O odpornym estymatorze wariancji w modelu
Transkrypt
O odpornym estymatorze wariancji w modelu
O odpornym estymatorze wariancji w modelu liniowym Ryszard Zieliński, Wojciech Zieliński 1. Wstęp. Sformułowanie zagadnienia Rozważamy model liniowy y = Xβ+ε, w którym y ′ = (y1 , . . . , yn ) jest wektorem obserwacji, β ′ = (β1 , . . . , βk ) jest wektorem (nieznanych) współczynników regresji, X = (xij ), i = 1, . . . , n, j = 1, . . . , k, k < n, jest daną macierzą rzędu r (macierzą planu eksperymentu) oraz ε′ = (ε1 , . . . , εn ) jest wektorem „zakłóceń”: εi są niezależnymi zmiennymi losowymi o jednakowym rozkładzie mającym cztery pierwsze momenty centralne µp , p = 1, 2, 3, 4 (σ 2 = µ2 ). Zakładamy przy tym, że Eεi = 0 oraz że γ2 = µ4 /σ 4 − 3 = γ20 , gdzie γ20 jest ustaloną liczbą (wiadomo, że zawsze γ2 ≥ −2). Zadanie polega na skonstruowaniu takiego estymatora wariancji σ 2 , którego wariancja zmieniałaby się możliwie mało, gdy kurtoza γ2 modelowego rozkładu ulega zmianie i przebiega pewien przedział (γ 2 , γ 2 ), γ 2 ≤ γ20 ≤ γ 2 . Przypadek modeli gaussowskich (εi ma rozkład normalny, γ20 = 0) był rozważany już w 1931 roku przez Pearsona [5] i później w licznych pracach, np. w 1953 roku przez Boxa [1] i w 1955 roku przez Boxa i Andersena [2]. W pracach tych koncentrowano uwagę na badaniu konsekwencji zakłóceń modelu gaussowskiego polegających na zmianie kurtozy γ2 , przy czym konsekwencje te opisywano za pomocą zmian rozmiaru różnych testów (testu t Studenta, testu F Snedecora i licznych testów służących do porównywania wariancji). Obszerny przegląd tych badań oraz oryginalne wyniki przedstawione zostały w 1982 roku w pracy Nürnberga [4]. W niniejszej pracy ograniczamy się do rozważania konsekwencji polegających na tym, że w wyniku zmiany kurtozy może zmienić się wariancja estymatora (w wyniku tego może również ulec zmianie moc i rozmiar testów oraz poziom ufności przedziałów ufności, opartych na wariancji). W naszych rozważaniach założenie o normalności rozkładu nie jest potrzebne. Ograniczymy się do badania estymatorów postaci y ′ Ay, gdzie - bez straty ogólności - A jest macierzą symetryczną, i efektywnie wyznaczymy najbardziej odporny, ze względu na zmianę wariancji, estymator wariancji w tej klasie. Interesujące jest, że jeżeli y1 , . . . , yn jest ciągiem niezależnych obserwacji o jednakowym rozkładzie, to okazuje się, że takim estymatorem jest standardowy estymator s2 . Formalnie zagadnienie można opisać w następujący sposób. Niech a oznacza wektor utworzony z przekątnej macierzy A, tzn. niech a = diagA. Wtedy Ey ′ Ay = σ 2 trA + β ′ X ′ AXβ V ary ′ Ay = σ 4 (γ2 a′ a + 2trA2 ) + 4σ 2 β ′ X ′ A2 Xβ + 4µ3 β ′ X ′ Aa. (1) Wzorując się na koncepcji odporności z pracy [7] opiszemy odporność estymatora y ′ Ay za pomocą wielkości sup γ ≤γ20 ≤γ 2 2 V ary ′ Ay − inf γ ≤γ20 ≤γ 2 V ary ′ Ay = (γ 2 − γ 2 )a′ a, 2 wtedy zadanie sprowadza się do znalezienia estymatora y ′ Ay o minimalnym a′ a. Bez żadnych ograniczeń na macierz A (a więc na estymator) otrzymujemy trywialne rozwiązanie a = 0; są to jednak estymatory bezsensowne, gdyż wówczas Ey ′ Ay = β ′ X ′ AXβ. Ograniczymy więc zbiór rozważanych macierzy A do klasy A macierzy symetrycznych takich, że ∀β, X ∀β, X Ey ′ Ay = σ 2 (nieobciążoność estymatora), ′ (y − Xβ) A(y − Xβ) = y ′ Ay (niezmienniczość estymatora). Ze wzorów (1) wynika, że A ∈ A wtedy i tylko wtedy, gdy A jest macierzą symetryczną spełniającą warunki trA = 1, AX = 0. Ostatecznie zadanie brzmi: znaleźć macierz A ∈ A, dla której a′ a osiąga minimum. 1 (2) 2. Charakteryzacja zbioru A Niech m = dimKerX ′ . Wykażemy, że A ∈ A wtedy i tylko wtedy, gdy A = B/trB, gdzie B= m ∑ m ∑ (3) βij (bi b′j + bj b′i ) i=1 j=1 dla pewnej bazy b1 , . . . , bm przestrzeni KerX oraz pewnych rzeczywistych βij . Dostateczność warunku jest oczywista. Wykażemy jego konieczność. Niech A ∈ A. Z warunków (2) wynika, że A = B/trB, gdzie B jest dowolną macierzą symetryczną taką, że BX = 0. Ale wtedy B = y1 b′1 + · · · + ym b′m (4) dla pewnej bazy b1 , . . . , bm przestrzeni KerX ′ i dla pewnych wektorów y1 , . . . , ym ∈ Rn . Ponieważ macierz B ′ ma być symetryczna, więc musi być również spełniony warunek B ′ X = 0. Ponieważ B ′ = b1 y1′ + · · · + bm ym , ′ więc y1 , . . . , ym muszą również należeć do KerX . Zatem yi = β1i b1 + · · · + βmi bm dla pewnych βij . Stąd otrzymujemy B= m ∑ (i = 1, . . . , m) βij bi b′j . i,j=1 bi b′j , Ponieważ układ macierzy βij = βji i stąd postać (3). Uwaga. (i, j = 1, . . . , m) jest liniowo niezależny, więc z warunku B = B ′ otrzymujemy 1) Jeżeli r = k = n, to A jest zbiorem pustym; 2) jeżeli r = n − 1, to A jest zbiorem jednoelementowym; 3) jeżeli r < n − 2, to A zawiera nieskończenie wiele elementów. Dowód uwagi. Ad 1) Jedyną macierzą spełniającą AX = 0 jest A = 0. Wówczas jednak nie zachodzi trA = 1. Ad 2) Jeżeli r = n − 1, to m = 1 i wtedy jedyną macierzą postaci (3) jest A = b1 b′1 /b′1 b1 . Ad 3) Jeżeli r ≤ n − 2, to m > 2. Niech b1 , b2 ∈ KerX ′ będą wektorami liniowo niezależnymi. Jeżeli A1 oraz A2 są macierzami skonstruowanymi tak jak A w Ad 2), odpowiednio dla b1 i b2 , to A1 ∈ A , A2 ∈ A oraz każda wypukła kombinacja liniowa tych macierzy należy do A. 3. Estymator najbardziej odporny Niech r ≤ n − 2. Zadanie wyznaczenia estymatora najbardziej odpornego będziemy rozwiązywali w dwóch etapach: najpierw wyznaczymy przekątną a0 = (a01 , . . . , a0n ) estymatora najbardziej odpornego, a następnie wyznaczymy macierz A tego estymatora. Jeżeli B ma postać (3), to diagB = m ∑ m ∑ βij δij , i=1 j=1 gdzie δij = diag(bi b′j + bj b′i ). Niech d będzie liczbą liniowo niezależnych wektorów δij (i = 1, . . . , m; j = i, . . . , m). Oczywiście liczba d nie zależy od wyboru bazy b1 , . . . , bm . Wyznaczenie przekątnej a0 sprowadza się do wyznaczenia, w przestrzeni liniowej rozpiętej przez wektory δij (i = 1, . . . , m; j = i, . . . , m), wektora 2 ∑ 0 ∑ a0 = (a01 , . . . , a0n ), dla którego ai = 1 oraz (a0i )2 = min. Jak wiadomo, zadanie to ma zawsze dokładnie jedno rozwiązanie. Niech ∆ będzie macierzą, której kolumnami są wektory δij (i = 1, . . . , m; j = i, . . . , m) i niech β ′ = (β11 , . . . , β1m , . . . , βm1 , . . . , βmm ). Zadanie wyznaczenia macierzy A postaci (3) dla estymatora najbardziej odpornego sprowadza się teraz do wyznaczenia rozwiązań β równania ∆β = a0 . (5) Niech AR ⊂ A oznacza zbiór macierzy A takich, że diagA = a0 . Ponieważ macierze A ∈ AR są jednoznacznie wyznaczone przez rozwiązania β równania (5), więc w przypadku d = 12 m(m + 1) zbiór AR jest jednoelementowy, a w przeciwnym przypadku, tzn. gdy d < 12 m(m+1), zawiera on nieskończenie wiele elementów. Każda z macierzy A ∈ AR wyznacza najbardziej odporny estymator y ′ Ay wariancji σ 2 . Spośród tych estymatorów możemy wybrać optymalny w sensie jakiegoś dodatkowego kryterium, np. kryterium minimalnej wariancji. 4. Minimalizacja wariancji w klasie AR Niech d < 12 m(m + 1). Wyznaczenie w klasie AR estymatora o minimalnej wariancji sprowadza się do rozwiązania zadania trA2 = min!, AX = 0, trAVi = a0i , i = 1, . . . , n, (i,i) (v) gdzie Vi = (δk,m )m,k=1,...,n , δu aii = α). jest deltą Kroneckera (warunek trAVi = α jest równoważny warunkowi Rozwiązanie tak sformułowanego zadania podane jest w monografii Rao [6], §1.6.3(ii). Rozwiązaniem jest macierz A∗ = (a∗ij ), i, j = 1, . . . , n, gdzie a∗ij = n ∑ λp qip qpj , Q = (qij ) = I − X(X ′ X)− X ′ , p=1 oraz λ = (λ1 , . . . , λn ) jest rozwiązaniem układu równań liniowych n ∑ 2 λp qpj = a0j , j = 1, . . . , n. p=1 5. Porównanie ze standardowym estymatorem wariancji W ogólnym przypadku estymator y ′ A∗ y nie musi pokrywać się ze standardowym estymatorem wariancji związanym z macierzą 1 S= (I − X(X ′ X)− X ′ ); n−r przykład podajemy niżej. Estymatory te pokrywają się na przykład wtedy, gdy przekątna macierzy S ma postać ( n1 , . . . , n1 )′ . Wynika to stąd, że taka macierz S jest macierzą o minimalnym kwadracie normy śladu ∑ a2ii w klasie macierzy A = (aij ) ∈ A i ponadto estymator z macierzą S jest estymatorem nieobciążonym o minimalnej wariancji (dowód tego faktu można znaleźć np. w [3], §8.19). Jako wniosek otrzymujemy, że w przypadku, gdy y1 , . . . , yn są niezależnymi zmiennymi losowymi o tym samym rozkładzie, najbardziej odporny estymator o minimalnej wariancji pokrywa się z estymatorem standardowym 1 ∑ (yi − ȳ)2 . s2 = n−1 Odnotujmy, że wtedy 2 γ2 )σ 4 V ars2 = ( + n n−1 3 oraz funkcja odporności jest równa 1 n (γ 2 − γ 2 ). W szczególności wynika stąd bardzo ważny wniosek, że zaobserwowanych przez Pearsona (1931) i badanych przez Boxa (1953), Boxa i Andersena (1955), Nur̈nberga (1982) i innych niestabilności testów na porównywanie wariancji nie da się usunąć przez oparcie statystyki testowej na bardziej odpornym estymatorze wariancji postaci y ′ Ay. 6. Przykład [ 1 0 0 Niech X = 1 1 1 ′ ] 0 . Wówczas 0 0 0 0 1/4 S= 0 −1/4 0 0 0 0 −1/4 0 , 1/4 0 0 1/2 0 0 0 1/3 A∗ = 0 −1/3 0 0 0 0 −1/3 0 1/3 0 0 1/3 oraz σ −4 V ary ′ Sy = 38 γ2 + 1, σ −4 V ary ′ A∗ y = 13 γ2 + 54 . Funkcja odporności dla tych estymatorów wynosi, odpowiednio, 38 (γ 2 − γ 2 ) oraz 13 (γ 2 − γ 2 ). Prace cytowane [1] G.E.P. Box, Non-normality and tests on variances, Biometrika 40 (1953),318-335. [2] G.E.P. Box, S.L. Andersen, Permutation theory in the derivation of robust criteria and the study of departures from assumptions, J.Roy. Statist. Society, Ser. B 17 (1955), 1-34. [3] D.R. Cox, D.V. Hinkley, Problems and solutions in theoretical statistics, Chapman and Hall, London, John Wiley and Sons, New York 1978 [4] G. Nürnberg, Beitrage zur Versuchsplannung fur die Schatzung von Varianzkomponenten und Rubustheitsuntersuchungen zum Vergleich zweier Varianzen, Probleme der angewandten Statistik 6 (1982). [5] E.S. Pearson, The analysis of variance in cases of non-normal variation, Biometrika 23 (1931),114-135. [6] C.R. Rao, Modele liniowe statystyki matematycznej, PWN, Warszawa 1982. [7] R. Zieliński, O mierzeniu odporności statystyk, Matematyka stosowana, XII (1978), 71-76. 4