Własności estymatora parametru lambda

Transkrypt

Własności estymatora parametru lambda
Własności estymatora parametru lambda transformacji potęgowej
Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński
1. Wstęp
Najczęstszym powodem transformowania zmiennej losowej jest jej normalizacja, czyli dążenie do otrzymania
zmiennej losowej o rozkładzie normalnym. Jeżeli ograniczymy się do sparametryzowanej rodziny transformacji, to dobór odpowiedniej transformacji będzie zależał od wyboru właściwego parametru. Wybór ten
może być ułatwiony dzięki apriorycznej znajomości rozkładu zmiennej losowej. Często jednak jedynym źródłem informacji jest próba. Jeżeli zamiast parametru używamy jego estymatora, to możemy mówić o tzw.
transformacji próbkowej.
Przykładem sparametryzowanej rodziny transformacji jest rodzina transformacji potęgowych
xλ − 1 /λ, dla λ 6= 0,
z=
ln x,
dla λ = 0
z parametrem λ (Box i Cox, 1964).
Parametr λ może być estymowany na podstawie danych x1 , . . . , xn metodą największej wiarogodności. Sprowadza się to bądź do znalezienia maksimum funkcji

!2 
n
n
n
X
X
X
n
1
L(λ; x1 , . . . , xn ) = − ln 
ln xi ,
zi2 −
zi  + (λ − 1)
2
n i=1
i=1
i=1
bądź do rozwiązania równania
n
P
P
P
ui zi − ( ui ) ( zi )
1 X
ln xi = 1,
− λ
P 2
P 2
n
n zi − ( zi )
gdzie u = xλ ln x (Wagner, 1987).
Otrzymany w powyższy sposób estymator λ̂ nie musi być dobrą oceną parametru λ (zakładamy oczywiście,
że transformacja z parametrem λ normalizuje rozkład). Dzieje się tak na przykład wtedy, gdy wariancja
estymatora λ̂ jest duża i w takiej sytuacji wątpliwa jest przydatność transformacji próbkowej.
W pracy badane są niektóre własności estymatora λ̂. W szczególności przedstawiono próbę odpowiedzi na
pytanie, od czego i w jaki sposób zależy wariancja tego estymatora. Zastosowano metodę polegającą na
wykonaniu serii doświadczeń symulacyjnych wykorzystujących rzeczywiste dane będące wynikami pomiarów
niektórych cech pnia jabłoni.
2. Opis doświadczenia symulacyjnego
Jako materiał posłużyły wyniki pomiarów pni kilkunastoletnich jabłoni odmiany Oliwka Inflancka na siewce
Antonówki rosnących w RZD SGGW w Łyczynie (dane zostały udostępnione przez Katedrę Sadownictwa
SGGW). Wykonywane jesienią przez kilka kolejnych lat pomiary pni drzew pozwoliły na określenie następujących cech:
- pole przekroju pnia w latach 1963, 64 i 65 (S1 , S2 , S3 );
- średnica pnia w tych samych latach (d1 , d2 , d3 );
- jednoroczny przyrost bezwzględny pola w latach 1964 i 65 (S12 , S23 );
- dwuletni bezwzględny przyrost pola w roku 1965 (S13 );
- przyrosty bezwzględne średnic (d12 , d23 , d13 ).
Doświadczenie symulacyjne polegało na wielokrotnym losowaniu n-elementowej próby (n = 10, 20) spośród
262 wartości każdej z wyżej wymienionych cech. Po wylosowaniu pojedynczej próby x1 , . . . , xn wyznaczano:
a) wartość statystyki Wx Shapiro- Wilka służącej do testowania hipotezy o normalności rozkładu (Shapiro i
Wilk, 1965);
b) estymator λ̂ parametru λ transformacji potęgowej;
1
c) wartość statystyki Wz Shapiro-Wilka dla danych z1 , . . . , zn otrzymanych z wartości x1 , . . . , xn dzięki
zastosowaniu transformacji potęgowej z parametrem λ̂A.
3. Rozkład statystyki Shapiro-Wilka
Próbę 10-elementową losowano 5000 razy. Umożliwiło to zbadanie rozkładu zarówno statystyki Wx jak i Wz .
Tabela 1 podaje te rozkłady dla każdej z dwunastu cech. Końce przedziałów klasowych są wartościami krytycznymi statystyki Shapiro-Wilka na poziomie α = 0.01, 0.02, 0.05, 0.1 i 0.5. W ostatniej kolumnie tej tabeli
podano oczekiwane liczebności wartości statystyki Shapiro-Wilka w poszczególnych przedziałach klasowych.
Gdybyśmy do każdej próby n-elementowej stosowali transformację ze stałym parametrem λ takim, że transformacja z tym parametrem normalizuje rozkład danej zmiennej, to statystyka Wz miałaby dokładnie rozkład
Shapiro-Wilka. Potwierdzają to również badania symulacyjne (Zieliński i Górczyński, 1991). Ponieważ jednak każda próba jest transformowana z innym λ (oszacowanym na podstawie tej próby), należy oczekiwać,
że rozkład Wz będzie odbiegał od rozkładu Shapiro-Wilka. Interesujący jest wtedy kierunek przesunięcia
tego rozkładu w stosunku do rozkładu Shapiro-Wilka.
Tablica 1. Rozkłady empiryczne oraz oczekiwane liczebności statystyki Shapiro-Wilka (n = 10)
przedziały
0.000; 0.781 Wx
Wz
0.781; 0.806 Wx
Wz
0.806; 0.842 Wx
Wz
0.842; 0.869 Wx
Wz
0.869; 0.938 Wx
Wz
0.938; 1.000 Wx
Wz
S1
103
1
84
1
226
25
308
58
2283
1348
1996
3567
S2
112
0
63
0
217
16
328
44
2252
1291
2028
3649
S3
81
2
70
1
175
14
313
47
2181
1150
2180
3787
d1
53
2
53
2
158
27
248
64
2208
1366
2280
3539
d2
58
0
52
3
132
18
257
54
2236
1304
2265
3621
d3
44
1
44
1
151
18
240
52
2137
1182
2384
3746
S12
202
0
113
5
293
26
400
70
2380
1452
1612
3447
S23
68
0
52
1
194
19
281
44
2156
1264
2249
3681
S13
83
0
84
1
199
20
343
47
2187
1316
2104
3616
d12
238
56
156
82
427
178
559
337
2587
2410
1033
1937
d23
103
3
73
5
234
33
307
81
2286
1544
1997
3334
d13 oczek
74
50
2
68
50
6
212
150
32
320
250
98
2303 2000
1634
2023 2500
3228
Analiza tabeli 1 prowadzi do wniosku, że zastosowanie próbkowej transformacji potęgowej zmienia rozkład
statystyki Shapiro-Wilka na korzyść dużych wartości tej statystyki, które pozwalają uznać rozkład danej
cechy za normalny. Można więc powiedzieć, że próbkowa transformacja potęgowa normalizuje rozkład. Taki
sam wniosek można otrzymać analizując wyniki dla prób 20-elementowych. Dokładniej mówiąc, można powiedzieć, że daną próbę po transformacji można uznać za pochodzącą z rozkładu normalnego.
Na podstawie wyników przedstawionych w tabeli 1 daje się zaobserwować różne tempo normalizacji: o ile
można uznać, że cechy d1 , d2 , d3 mają rozkład normalny, to cecha d13 nawet po zastosowaniu transformacji
nie jest jeszcze normalna. Jest naturalną rzeczą przyjąć, że tempo normalizacji jest tym wolniejsze, im
większe jest odchylenie danego rozkładu od rozkładu normalnego. Miernikiem tego odchylenia może być
średnia wartość statystyki Shapiro-Wilka przed transformacją (im jest ona mniejsza, tym większe odchylenie).
Tabela 2 przedstawia średnie wartości statystyki Wx oraz Wz dla serii prób 10- i 20-elementowych. Zgodnie
z oczekiwaniami w każdym przypadku W̄x < W̄z .
Zauważmy, że średnie W̄z stabilizują się na pewnym poziomie. Wyjątkiem jest cecha d12 . Sugerowałoby to
możliwość iterowania transformacji potęgowych w przypadku cech, których rozkład znacznie różni się od
normalnego.
Można mówić także o stabilizacji statystyki Shapiro-Wilka dla ustalonej cechy, jeżeli przejdziemy na dane
transformowane. Dało się mianowicie zaobserwować, że varWz < varWx dla każdej cechy. Obie te wariancje
zmniejszają się także, jeżeli zwiększamy liczność próby. I tak dla prób o liczności 10 wariancja statystyki Wx
była rzędu 2.5 · 10−3 , a dla prób o liczności 20 wariancja ta była rzędu 2 · 10−1 .
2
Tabela 2.
cechy
S1
S2
S3
d1
d2
d3
S12
S23
S13
d12
d23
d13
n = 10
W̄x
W̄z
0.917 0.950
0.917 0.951
0, 921 0.952
0.925 0.949
0.925 0.950
0.927 0.951
0.906 0.948
0.923 0.951
0.919 0.951
0.892 0.918
0.917 0.945
0.918 0.944
n = 20
W̄x
W̄z
0.939 0.966
0.940 0.967
0.945 0.968
0.950 0.968
0.951 0.967
0.953 0.968
0.922 0.962
0.950 0.968
0.943 0.966
0.911 0.937
0.946 0.964
0.945 0.962
4. Wariancja estymatora parametru lambda
Zajmijmy się teraz wariancją estymatora parametru λ. Okazuje się, że istnieje związek pomiędzy tą wariancją a stopniem odchylenia, mierzonym średnią wartością statystyki Wx , rozkładu danej cechy od rozkładu
normalnego. Tabela 3 przedstawia oszacowania wariancji estymatora λ̂ wyznaczone na podstawie prób 10- i
20-elementowych.
Tabela 3.
cecha
n = 10
n = 20
S1
2.273
0.428
S2
2.377
0.439
S3
2.692
0.481
d1
7.756
1.708
d2
8083
1.747
d3
8.925
1.872
S12
0.797
0.154
S23
1.317
0.252
S13
1.737
0.364
d12
1.055
0.206
d23
1.845
0.313
d13
2.504
0.492
Na wykresach przedstawiono dwanaście badanych cech. Na osi poziomej pokazane są wartości średnie statystyki Wx , a na osi pionowej wariancje estymatorów λ̂.
Łatwo zauważyć następującą prawidłowość: im bardziej rozkład danej cechy różni się od rozkładu normalnego
(im mniejsze Wx ), tym mniejsza jest wariancja estymatora λ̂. Ma to ważne znaczenie praktyczne. Świadczy
mianowicie o dobrych własnościach transformacji próbkowej, gdy stosowanie tej transformacji jest konieczne.
Natomiast w przypadku, gdy cecha ma rozkład zbliżony do rozkładu normalnego, to wariancja estymatora λ̂
jest bardzo duża. Można by wyprowadzić stąd wniosek, że dla cech o rozkładzie ”prawie” normalnym można
stosować omawianą transformację w zasadzie z dowolnym λ. Jest to oczywiście absurdalny wniosek, a w
takiej sytuacji nie powinno się w ogóle stosować tej transformacji.
W związku z tym, że w niektórych sytuacjach wariancja λ jest dość duża. nasuwa się pytanie, na ile estymator λ̂ może odbiegać od prawdziwej wartości parametru λ, by transformację próbkową można było uznać
za normalizującą (np. w tym sensie, że test chi-kwadrat nie wykrywa rozbieżności między rozkładem statystyki Wz dla prób transformowanych z tym samym λ̂ a rozkładem Shapiro-Wilka). W niniejszej pracy nie
zajmujemy się tym problemem.
5. Uwagi końcowe
Omawiana w pracy transformacja potęgowa jest transformacją próbkową w tym sensie, że wymaga ona
szacowania nieznanego parametru. Jak widać, jest to transformacja ”skuteczna”, tzn. przekształconą próbę
można traktować jako pochodzącą z rozkładu normalnego. Głównym celem dokonywania tej transformacji
jest jednak wykorzystanie przekształconej próby w takich postępowaniach jak analiza wariancji, regresji itp.
I w tym momencie używanie transformacji próbkowej staje się problematyczne. Głównym powodem jest to,
że nieznane są takie własności znanych postępowań statystycznych (analiza wariancji itp.) dla danych transformowanych, jak rzeczywiste rozkłady statystyk czy też prawdopodobieństwa błędów I i II rodzaju. Ponadto
3
stosowanie transformacji znacznie komplikuje i wydłuża obliczenia (oszacowanie λ wymaga numerycznego
rozwiązania dość złożonego równania). Wydaje się więc, że dla prób ”dalekich od normalności” lepiej jest bezpośrednio stosować odpowiednie procedury nieparametryczne niż transformować je i wykorzystywać typowy
aparat statystyczny.
Literatura
Shapiro S.S., Wilk M.B. (1965): An analysis ot variance test for normality (complete samples), Biometrika
52, 591-611.
Box G.E.P., Cox D.R. (1964): An analysis of transformations, J.R.Statist.Soc. B, 26, 211-252.
Wagner W. (1987): Zastosowanie przekształcenia potęgowego do obserwowalnych zmiennych losowych dla
sprawdzenia założenia o rozkładzie normalnym błędów losowych w modelu liniowym, XVII Coll. Metod. z
Agrobiom. PAN, 75-83.
Zieliński A., Górczyński J. (1991): Density distributions of some variables considered in field experiments
with fruit trees, Folia Horticulturae, w druku
4
5

Podobne dokumenty