Własności estymatora parametru lambda
Transkrypt
Własności estymatora parametru lambda
Własności estymatora parametru lambda transformacji potęgowej Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński 1. Wstęp Najczęstszym powodem transformowania zmiennej losowej jest jej normalizacja, czyli dążenie do otrzymania zmiennej losowej o rozkładzie normalnym. Jeżeli ograniczymy się do sparametryzowanej rodziny transformacji, to dobór odpowiedniej transformacji będzie zależał od wyboru właściwego parametru. Wybór ten może być ułatwiony dzięki apriorycznej znajomości rozkładu zmiennej losowej. Często jednak jedynym źródłem informacji jest próba. Jeżeli zamiast parametru używamy jego estymatora, to możemy mówić o tzw. transformacji próbkowej. Przykładem sparametryzowanej rodziny transformacji jest rodzina transformacji potęgowych xλ − 1 /λ, dla λ 6= 0, z= ln x, dla λ = 0 z parametrem λ (Box i Cox, 1964). Parametr λ może być estymowany na podstawie danych x1 , . . . , xn metodą największej wiarogodności. Sprowadza się to bądź do znalezienia maksimum funkcji !2 n n n X X X n 1 L(λ; x1 , . . . , xn ) = − ln ln xi , zi2 − zi + (λ − 1) 2 n i=1 i=1 i=1 bądź do rozwiązania równania n P P P ui zi − ( ui ) ( zi ) 1 X ln xi = 1, − λ P 2 P 2 n n zi − ( zi ) gdzie u = xλ ln x (Wagner, 1987). Otrzymany w powyższy sposób estymator λ̂ nie musi być dobrą oceną parametru λ (zakładamy oczywiście, że transformacja z parametrem λ normalizuje rozkład). Dzieje się tak na przykład wtedy, gdy wariancja estymatora λ̂ jest duża i w takiej sytuacji wątpliwa jest przydatność transformacji próbkowej. W pracy badane są niektóre własności estymatora λ̂. W szczególności przedstawiono próbę odpowiedzi na pytanie, od czego i w jaki sposób zależy wariancja tego estymatora. Zastosowano metodę polegającą na wykonaniu serii doświadczeń symulacyjnych wykorzystujących rzeczywiste dane będące wynikami pomiarów niektórych cech pnia jabłoni. 2. Opis doświadczenia symulacyjnego Jako materiał posłużyły wyniki pomiarów pni kilkunastoletnich jabłoni odmiany Oliwka Inflancka na siewce Antonówki rosnących w RZD SGGW w Łyczynie (dane zostały udostępnione przez Katedrę Sadownictwa SGGW). Wykonywane jesienią przez kilka kolejnych lat pomiary pni drzew pozwoliły na określenie następujących cech: - pole przekroju pnia w latach 1963, 64 i 65 (S1 , S2 , S3 ); - średnica pnia w tych samych latach (d1 , d2 , d3 ); - jednoroczny przyrost bezwzględny pola w latach 1964 i 65 (S12 , S23 ); - dwuletni bezwzględny przyrost pola w roku 1965 (S13 ); - przyrosty bezwzględne średnic (d12 , d23 , d13 ). Doświadczenie symulacyjne polegało na wielokrotnym losowaniu n-elementowej próby (n = 10, 20) spośród 262 wartości każdej z wyżej wymienionych cech. Po wylosowaniu pojedynczej próby x1 , . . . , xn wyznaczano: a) wartość statystyki Wx Shapiro- Wilka służącej do testowania hipotezy o normalności rozkładu (Shapiro i Wilk, 1965); b) estymator λ̂ parametru λ transformacji potęgowej; 1 c) wartość statystyki Wz Shapiro-Wilka dla danych z1 , . . . , zn otrzymanych z wartości x1 , . . . , xn dzięki zastosowaniu transformacji potęgowej z parametrem λ̂A. 3. Rozkład statystyki Shapiro-Wilka Próbę 10-elementową losowano 5000 razy. Umożliwiło to zbadanie rozkładu zarówno statystyki Wx jak i Wz . Tabela 1 podaje te rozkłady dla każdej z dwunastu cech. Końce przedziałów klasowych są wartościami krytycznymi statystyki Shapiro-Wilka na poziomie α = 0.01, 0.02, 0.05, 0.1 i 0.5. W ostatniej kolumnie tej tabeli podano oczekiwane liczebności wartości statystyki Shapiro-Wilka w poszczególnych przedziałach klasowych. Gdybyśmy do każdej próby n-elementowej stosowali transformację ze stałym parametrem λ takim, że transformacja z tym parametrem normalizuje rozkład danej zmiennej, to statystyka Wz miałaby dokładnie rozkład Shapiro-Wilka. Potwierdzają to również badania symulacyjne (Zieliński i Górczyński, 1991). Ponieważ jednak każda próba jest transformowana z innym λ (oszacowanym na podstawie tej próby), należy oczekiwać, że rozkład Wz będzie odbiegał od rozkładu Shapiro-Wilka. Interesujący jest wtedy kierunek przesunięcia tego rozkładu w stosunku do rozkładu Shapiro-Wilka. Tablica 1. Rozkłady empiryczne oraz oczekiwane liczebności statystyki Shapiro-Wilka (n = 10) przedziały 0.000; 0.781 Wx Wz 0.781; 0.806 Wx Wz 0.806; 0.842 Wx Wz 0.842; 0.869 Wx Wz 0.869; 0.938 Wx Wz 0.938; 1.000 Wx Wz S1 103 1 84 1 226 25 308 58 2283 1348 1996 3567 S2 112 0 63 0 217 16 328 44 2252 1291 2028 3649 S3 81 2 70 1 175 14 313 47 2181 1150 2180 3787 d1 53 2 53 2 158 27 248 64 2208 1366 2280 3539 d2 58 0 52 3 132 18 257 54 2236 1304 2265 3621 d3 44 1 44 1 151 18 240 52 2137 1182 2384 3746 S12 202 0 113 5 293 26 400 70 2380 1452 1612 3447 S23 68 0 52 1 194 19 281 44 2156 1264 2249 3681 S13 83 0 84 1 199 20 343 47 2187 1316 2104 3616 d12 238 56 156 82 427 178 559 337 2587 2410 1033 1937 d23 103 3 73 5 234 33 307 81 2286 1544 1997 3334 d13 oczek 74 50 2 68 50 6 212 150 32 320 250 98 2303 2000 1634 2023 2500 3228 Analiza tabeli 1 prowadzi do wniosku, że zastosowanie próbkowej transformacji potęgowej zmienia rozkład statystyki Shapiro-Wilka na korzyść dużych wartości tej statystyki, które pozwalają uznać rozkład danej cechy za normalny. Można więc powiedzieć, że próbkowa transformacja potęgowa normalizuje rozkład. Taki sam wniosek można otrzymać analizując wyniki dla prób 20-elementowych. Dokładniej mówiąc, można powiedzieć, że daną próbę po transformacji można uznać za pochodzącą z rozkładu normalnego. Na podstawie wyników przedstawionych w tabeli 1 daje się zaobserwować różne tempo normalizacji: o ile można uznać, że cechy d1 , d2 , d3 mają rozkład normalny, to cecha d13 nawet po zastosowaniu transformacji nie jest jeszcze normalna. Jest naturalną rzeczą przyjąć, że tempo normalizacji jest tym wolniejsze, im większe jest odchylenie danego rozkładu od rozkładu normalnego. Miernikiem tego odchylenia może być średnia wartość statystyki Shapiro-Wilka przed transformacją (im jest ona mniejsza, tym większe odchylenie). Tabela 2 przedstawia średnie wartości statystyki Wx oraz Wz dla serii prób 10- i 20-elementowych. Zgodnie z oczekiwaniami w każdym przypadku W̄x < W̄z . Zauważmy, że średnie W̄z stabilizują się na pewnym poziomie. Wyjątkiem jest cecha d12 . Sugerowałoby to możliwość iterowania transformacji potęgowych w przypadku cech, których rozkład znacznie różni się od normalnego. Można mówić także o stabilizacji statystyki Shapiro-Wilka dla ustalonej cechy, jeżeli przejdziemy na dane transformowane. Dało się mianowicie zaobserwować, że varWz < varWx dla każdej cechy. Obie te wariancje zmniejszają się także, jeżeli zwiększamy liczność próby. I tak dla prób o liczności 10 wariancja statystyki Wx była rzędu 2.5 · 10−3 , a dla prób o liczności 20 wariancja ta była rzędu 2 · 10−1 . 2 Tabela 2. cechy S1 S2 S3 d1 d2 d3 S12 S23 S13 d12 d23 d13 n = 10 W̄x W̄z 0.917 0.950 0.917 0.951 0, 921 0.952 0.925 0.949 0.925 0.950 0.927 0.951 0.906 0.948 0.923 0.951 0.919 0.951 0.892 0.918 0.917 0.945 0.918 0.944 n = 20 W̄x W̄z 0.939 0.966 0.940 0.967 0.945 0.968 0.950 0.968 0.951 0.967 0.953 0.968 0.922 0.962 0.950 0.968 0.943 0.966 0.911 0.937 0.946 0.964 0.945 0.962 4. Wariancja estymatora parametru lambda Zajmijmy się teraz wariancją estymatora parametru λ. Okazuje się, że istnieje związek pomiędzy tą wariancją a stopniem odchylenia, mierzonym średnią wartością statystyki Wx , rozkładu danej cechy od rozkładu normalnego. Tabela 3 przedstawia oszacowania wariancji estymatora λ̂ wyznaczone na podstawie prób 10- i 20-elementowych. Tabela 3. cecha n = 10 n = 20 S1 2.273 0.428 S2 2.377 0.439 S3 2.692 0.481 d1 7.756 1.708 d2 8083 1.747 d3 8.925 1.872 S12 0.797 0.154 S23 1.317 0.252 S13 1.737 0.364 d12 1.055 0.206 d23 1.845 0.313 d13 2.504 0.492 Na wykresach przedstawiono dwanaście badanych cech. Na osi poziomej pokazane są wartości średnie statystyki Wx , a na osi pionowej wariancje estymatorów λ̂. Łatwo zauważyć następującą prawidłowość: im bardziej rozkład danej cechy różni się od rozkładu normalnego (im mniejsze Wx ), tym mniejsza jest wariancja estymatora λ̂. Ma to ważne znaczenie praktyczne. Świadczy mianowicie o dobrych własnościach transformacji próbkowej, gdy stosowanie tej transformacji jest konieczne. Natomiast w przypadku, gdy cecha ma rozkład zbliżony do rozkładu normalnego, to wariancja estymatora λ̂ jest bardzo duża. Można by wyprowadzić stąd wniosek, że dla cech o rozkładzie ”prawie” normalnym można stosować omawianą transformację w zasadzie z dowolnym λ. Jest to oczywiście absurdalny wniosek, a w takiej sytuacji nie powinno się w ogóle stosować tej transformacji. W związku z tym, że w niektórych sytuacjach wariancja λ jest dość duża. nasuwa się pytanie, na ile estymator λ̂ może odbiegać od prawdziwej wartości parametru λ, by transformację próbkową można było uznać za normalizującą (np. w tym sensie, że test chi-kwadrat nie wykrywa rozbieżności między rozkładem statystyki Wz dla prób transformowanych z tym samym λ̂ a rozkładem Shapiro-Wilka). W niniejszej pracy nie zajmujemy się tym problemem. 5. Uwagi końcowe Omawiana w pracy transformacja potęgowa jest transformacją próbkową w tym sensie, że wymaga ona szacowania nieznanego parametru. Jak widać, jest to transformacja ”skuteczna”, tzn. przekształconą próbę można traktować jako pochodzącą z rozkładu normalnego. Głównym celem dokonywania tej transformacji jest jednak wykorzystanie przekształconej próby w takich postępowaniach jak analiza wariancji, regresji itp. I w tym momencie używanie transformacji próbkowej staje się problematyczne. Głównym powodem jest to, że nieznane są takie własności znanych postępowań statystycznych (analiza wariancji itp.) dla danych transformowanych, jak rzeczywiste rozkłady statystyk czy też prawdopodobieństwa błędów I i II rodzaju. Ponadto 3 stosowanie transformacji znacznie komplikuje i wydłuża obliczenia (oszacowanie λ wymaga numerycznego rozwiązania dość złożonego równania). Wydaje się więc, że dla prób ”dalekich od normalności” lepiej jest bezpośrednio stosować odpowiednie procedury nieparametryczne niż transformować je i wykorzystywać typowy aparat statystyczny. Literatura Shapiro S.S., Wilk M.B. (1965): An analysis ot variance test for normality (complete samples), Biometrika 52, 591-611. Box G.E.P., Cox D.R. (1964): An analysis of transformations, J.R.Statist.Soc. B, 26, 211-252. Wagner W. (1987): Zastosowanie przekształcenia potęgowego do obserwowalnych zmiennych losowych dla sprawdzenia założenia o rozkładzie normalnym błędów losowych w modelu liniowym, XVII Coll. Metod. z Agrobiom. PAN, 75-83. Zieliński A., Górczyński J. (1991): Density distributions of some variables considered in field experiments with fruit trees, Folia Horticulturae, w druku 4 5