Kamil Wilak

Transkrypt

Kamil Wilak
PRZEGLĄD STATYSTYCZNY
R. LXI – ZESZYT 4 – 2014
KAMIL WILAK
STRUKTURALNE MODELE SZEREGÓW CZASOWYCH W ESTYMACJI
STOPY BEZROBOCIA W DEZAGREGACJI NA WOJEWÓDZTWA,
PàEû I WIEK
1. WSTĉP
Jednym z podstawowych wskaĨników opisujących sytuacjĊ na rynku pracy
jest stopa bezrobocia, okreĞlona jako stosunek liczby osób bezrobotnych do liczby
osób aktywnych zawodowo. Gáównymi Ĩródáami wiedzy na temat stopy bezrobocia w Polsce są Badanie AktywnoĞci Ekonomicznej LudnoĞci (BAEL) oraz rejestr
osób bezrobotnych. W przypadku BAEL, za bezrobotne uwaĪa siĊ te osoby w wieku
15–74 lat, które w badanym tygodniu nie pracowaáy, lecz aktywnie poszukiwaáy
pracy i byáy gotowe podjąü ją w okresie 2 tygodni. Osobami aktywnymi zawodowo
wg BAEL są wszystkie osoby pracujące lub bezrobotne (GUS 2014a). Natomiast
w przypadku bezrobocia rejestrowanego, za bezrobotne uwaĪa siĊ osoby zarejestrowane w powiatowym urzĊdzie pracy, zaĞ osobami aktywnymi zawodowo są osoby
bezrobotne i pracujące w jednostkach sektora publicznego lub prywatnego (GUS
2014b). RóĪnice w de¿nicjach osób bezrobotnych i aktywnych zawodowo sprawiają,
Īe stopa bezrobocia rejestrowanego moĪe znacznie róĪniü siĊ od stopy bezrobocia
wg BAEL.
Do szacowania stopy bezrobocia na podstawie BAEL, Gáówny Urząd Statystyczny stosuje estymacjĊ bezpoĞrednią. Estymacja ta wykorzystuje tylko informacje z wylosowanej próby. Zaletą tego podejĞcia jest nieobciąĪonoĞü estymatorów,
natomiast wadą jest duĪa wariancja w przypadku maáej liczby jednostek z badanej
domeny, wylosowanych do próby. Estymatory o duĪej wariancji uznawane są za maáo
precyzyjne. Domeny, w których liczba wylosowanych do badania jednostek jest tak
maáa, Īe estymacja bezpoĞrednia cechujĊ siĊ zbyt maáą precyzją, nazywane są maáymi
domenami (ang. small domain).
Oszacowania stopy bezrobocia są publikowane przez GUS dla województw
w domenach okreĞlonych oddzielnie przez páeü, miejsce zamieszkania, poziom
wyksztaácenia. Ze wzglĊdu na zbyt duĪą wariancjĊ estymatorów bezpoĞrednich, GUS
nie publikuje m.in. oszacowaĔ dla województw w domenach okreĞlonych przez páeü
i wiek áącznie. W niniejszej pracy rozwaĪa siĊ estymacjĊ stopy bezrobocia w przekroju
województw dla trzech grup wieku (15–24 lat, 25–44 lat, 45–59/64 lat) z uwzglĊdnieniem páci, co stanowi áącznie 3 x 2 = 6 domen dla województwa. W badaniu przepro-
410
Kamil Wilak
wadzonym w niniejszym artykule ograniczono siĊ do estymacji na podstawie danych
z województwa wielkopolskiego.
Metodami szacowania w warunkach maáej liczebnoĞci próby zajmuje siĊ statystyka maáych obszarów (ang. small area estimation – SAE), inaczej zwana statystyką
maáych domen lub estymacją dla maáych domen. Sposobem na zwiĊkszenie precyzji
oszacowaĔ w maáych domenach jest zastosowanie bazującej na modelach statystycznych estymacji poĞredniej, która wykorzystuje informacje spoza czĊĞci próby,
wylosowanej z rozpatrywanej domeny. Są to m.in. dane administracyjne, dane spoza
badanej domeny, dane z wczeĞniej przeprowadzonych badaĔ. Zmienne wykorzystane
do zwiĊkszenia precyzji estymacji badanego parametru nazywane są zmiennymi
pomocniczymi. Estymacja poĞrednia charakteryzuje siĊ zazwyczaj mniejszą wariancją niĪ estymacja bezpoĞrednia, natomiast w przypadku Ĩle dobranego modelu moĪe
cechowaü siĊ znaczną obciąĪonoĞcią. Przegląd metod stosowanych w statystyce
maáych obszarów moĪna znaleĨü w pracach Rao (2003), DomaĔskiego, Pruski (2001).
Zastosowanie metod statystyki maáych obszarów w estymacji stropy bezrobocia na
polskim rynku pracy moĪna znaleĨü w publikacji Goáaty (2004).
W literaturze Ğwiatowej, w kontekĞcie estymacji poĞredniej charakterystyk rynku
pracy, popularne jest podejĞcie zwane poĪyczaniem mocy w czasie (ang. borrowing
strength across time). Polega ono na wykorzystaniu informacji z wczeĞniej przeprowadzonych badaĔ, poprzez modelowanie szeregów czasowych skáadających siĊ
z oszacowaĔ bezpoĞrednich. W tym celu stosowane są m.in. strukturalne modele szeregów, które moĪna przedstawiü w postaci dynamicznych modeli liniowych. Modele
te zbudowane są z trendu, sezonowoĞci i skáadnika systematycznego regresji liniowej.
Zastosowanie takich modeli moĪna znaleĨü m.in. w pracach Brakela, Kriega (2008,
2009, 2010), Pfeffermana i in. (2005), Pfeffermana, Tillera (2006). W artykule Wilaka
(2013) zastosowano strukturalny model szeregu czasowego do danych z Badania
AktywnoĞci Ekonomicznej LudnoĞci.
Celem niniejszego artykuáu jest ocena jakoĞci estymacji poĞredniej stopy bezrobocia wg BAEL w przekroju województw dla szeĞciu domen okreĞlonych przez
wiek i páeü, wykorzystującej strukturalne modele szeregów czasowych. Przedmiotem
badania jest takĪe korelacja pomiĊdzy stopą bezrobocia wg BAEL a stopą bezrobocia rejestrowanego. W niniejszej pracy rozwaĪa siĊ wykorzystanie tej drugiej jako
zmiennej pomocniczej. Wery¿kacji poddano hipotezĊ gáoszącą, Īe estymacja poĞrednia stopy bezrobocia w województwach dla maáych domen okreĞlonych wedáug páci
i wieku, wykorzystująca strukturalne modele szeregów czasowych, cechuje siĊ lepszą
jakoĞcią niĪ estymacja bezpoĞrednia. JakoĞü estymatorów rozwaĪa siĊ pod kątem ich
dokáadnoĞci i precyzji. Z dwóch estymatorów dokáadniejszy jest ten, który cechuje
siĊ mniejszą obciąĪonoĞcią, natomiast precyzyjniejszy jest ten, którego odchylenie
standardowe jest mniejsze.
Dla wery¿kacji postawionej hipotezy przeprowadzono eksperyment Monte Carlo
z wykorzystaniem danych jednostkowych z Badania AktywnoĞci Ekonomicznej
LudnoĞci z lat 2000–2009. Na podstawie tych danych stworzono pseudo-populacjĊ,
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
411
dla której szacowano stopĊ bezrobocia. Porównania jakoĞci estymatorów poĞrednich
i bezpoĞrednich dokonano na podstawie ich obciąĪeĔ, odchyleĔ standardowych,
báĊdów Ğredniokwadratowych i Ğrednich báĊdów bezwzglĊdnych, wyznaczonych na
podstawie eksperymentu.
Metoda estymacji poĞredniej wykorzystana w niniejszej pracy jest zaczerpniĊta ze
Ğwiatowej literatury. Wkáadem autora jest natomiast jej adaptacja do warunków polskich oraz ocena jakoĞci estymacji poĞredniej stopy bezrobocia w maáych domenach
okreĞlonych przez województwo, páeü i wiek, wykorzystującej tĊ metodĊ. WartoĞcią
dodaną jest równieĪ fakt, Īe autor pracuje na danych rzeczywistych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
2. PRZEDSTAWIENIE MODELU
Model opisany w tej czĊĞci pracy jest uproszczoną, jednowymiarową wersją
modelu przedstawionego przez Brakela, Kriega (2010). Uproszczenie to wiąĪe siĊ
z pominiĊciem w modelu korelacji miĊdzy skáadnikami trendów z róĪnych domen.
Niech șd,t oznacza parametr populacji w domenie d (d = 1, ..., D) w czasie
t (t = 1, ..., T), a Yd,t wartoĞü estymatora bezpoĞredniego tego parametru. MoĪna wtedy
zapisaü1:
Yd,t = șd,t + ed,t,
(1)
gdzie ed,t jest báĊdem estymacji. Na potrzeby badania zakáada siĊ, Īe próby w poszczególnych okresach losowane są niezaleĪnie. Z nieobciąĪonoĞci estymatora Yd,t wynika,
Īe wartoĞü oczekiwana báĊdu ed,t wynosi E (ed,t) = 0. WariancjĊ Var (ed,t) moĪna oszacowaü, uwzglĊdniając przy tym schemat losowania próby.
W modelu Brakela, Kriega (2010) zakáada siĊ, Īe parametr șd,t moĪna przedstawiü
za pomocą strukturalnego modelu szeregu czasowego:
ߠௗǡ௧ ൌ ‫ܮ‬ௗǡ௧ ൅ ܵௗǡ௧ ൅ ‫ݔ‬ௗǡ௧ ߚௗǡ௧ ൅ ߝௗǡ௧ ,
(2)
ଶ
ߝௗǡ௧ ̱ܰ‫ܦܫ‬൫Ͳǡ ߪఌǡௗ
൯.
(3)
gdzie Ld,t oznacza trend stochastyczny, Sd,t sezonowoĞü stochastyczną, xd,t zmienną
pomocniczą, ȕt wspóáczynnik regresji a İd,t reszty losowe, które odzwierciedlają
zmiennoĞü parametru populacji nietáumaczoną przez pozostaáe skáadniki.
W literaturze czĊĞciej uĪywa siĊ zapisu șd,t = Yd,t + ed,t, natomiast na potrzeby wyprowadzenia
estymatora poĞredniego stosuje siĊ zapis Yd,t = șd,t + ed,t.
1
412
Kamil Wilak
Pierwszy skáadnik modelu, trend stochastyczny Ld,t, jest postaci2:
‫ܮ‬ௗǡ௧ ൌ ‫ܮ‬ௗǡ௧ିଵ ൅ ܴௗǡ௧ ,
ܴௗǡ௧ ൌ ܴௗǡ௧ିଵ ൅ ߟோǡௗǡ௧ ,
(4)
ଶ
ߟோǡௗǡ௧ ̱ܰ‫ܦܫ‬൫Ͳǡ ߪோǡௗ
൯,
(5)
gdzie Rd,t jest skáadnikiem losowym, który odzwierciedla nachylenie krzywej trendu,
a ȘR,d,t jest skáadnikiem losowym odpowiedzialnym za zmiany tego nachylenia
w czasie.
Drugi skáadnik modelu, sezonowoĞü stochastyczna Sd,t , to kwartalna sezonowoĞü
trygonometryczna (trigonometric seasonal) postaci3:
ܵௗǡ௧ ൌ ܵௗǡ௧ǡଵ ൅ ܵௗǡ௧ǡଶ ,
(6)
gdzie dla j = 1,2:
௝గ
௝గ
௝గ
௝గ
‫כ‬
ܵௗǡ௧ǡ௝ ൌ …‘• ቀ ଶ ቁ ܵௗǡ௧ିଵǡ௝ ൅ •‹ ቀ ଶ ቁ ܵௗǡ௧ିଵǡ௝
൅ ߟௌǡௗǡ௧ǡ௝ ,
‫כ‬
‫כ‬
ܵௗǡ௧ǡ௝
ൌ െ•‹ ቀ ଶ ቁ ܵௗǡ௧ିଵǡ௝ ൅ …‘• ቀ ଶ ቁ ܵௗǡ௧ିଵǡ௝
൅ ߟௌ ‫ כ‬ǡௗǡ௧ǡ௝ ,
ଶ
ߟௌǡௗǡ௧ǡ௝ ̱ܰ‫ܦܫ‬൫Ͳǡ ߪௌǡௗǡ௝
൯,
ଶ
ߟௌ ‫כ‬ǡௗǡ௧ǡ௝ ̱ܰ‫ܦܫ‬൫Ͳǡ ߪௌǡௗǡ௝
൯,
(7)
(8)
Skáadniki losowe ȘS,d,t,j i ȘS*,d,t,j odpowiadają za zmiany w czasie wartoĞci skáadnika
sezonowoĞci.
W trzecim skáadniku modelu, systematycznym skáadniku regresji liniowej xd,t ȕd,t ,
wspóáczynnik regresji ȕd,t opisany jest są za pomocą báądzenia losowego:
ߚௗǡ௧ ൌ ߚௗǡ௧ିଵ ൅ ߟఉǡௗǡ௧ ,
ଶ
ߟఉǡௗǡ௧ ̱ܰ‫ܦܫ‬൫Ͳǡ ߪఉǡௗ
൯.
(9)
Zakáada siĊ brak zaleĪnoĞci pomiĊdzy skáadnikami ȘR,d,t , ȘS,d,t,1, ȘS*,d,t,1, ȘS,d,t,2,
ȘS*,d,t,2, Șȕ,d,t, a takĪe brak zaleĪnoĞci pomiĊdzy skáadnikami losowymi z róĪnych
domen.
Wstawiając równanie (2) do (1) otrzymuje siĊ strukturalny model dla szeregu
czasowego oszacowaĔ bezpoĞrednich Yd,1, ..., Yd,T (d = 1, ..., D):
ܻௗǡ௧ ൌ ‫ܮ‬ௗǡ௧ ൅ ܵௗǡ௧ ൅ ‫ݔ‬ௗǡ௧ ߚௗǡ௧ ൅ ߝௗǡ௧ ൅ ݁ௗǡ௧ .
(10)
Ideą estymacji poĞredniej parametrów populacji șd,t (d = 1, ..., D, t = 1, ..., T) za
pomocą strukturalnych modeli szeregów czasowych jest oczyszczenie oszacowaĔ bez2
3
W literaturze moĪna znaleĨü równieĪ inne propozycje trendu stochastycznego.
W literaturze moĪna znaleĨü równieĪ inne propozycje sezonowoĞci stochastycznej.
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
413
poĞrednich Yd,t z báĊdów oszacowaĔ ed,t. W celu estymacji parametrów modelu (10)
zakáada siĊ, Īe báĊdy oszacowaĔ ed,t mają rozkáad normalny. Wtedy suma skáadnika
resztowego i báĊdu oszacowania vd,t = İd,t + ed,t ma równieĪ rozkáad normalny. WartoĞü
oczekiwana skáadnika vd,t wynosi E (vd,t) = 0, natomiast o wariancji tego skáadnika
Brakel, Krieg (2010) zakáadali, Īe jest równa:
ଶ
ܸܽ‫ݎ‬൫‫ݒ‬ௗǡ௧ ൯ ൌ ߪ௩ǡௗ
ܸܽ‫ݎ‬൫ܻௗǡ௧ ൯.
(11)
ଶ
gdzie ߪ௩ǡௗ
jest staáą, którą naleĪy oszacowaü.
Oczyszczenie Yd,t z báĊdów oszacowaĔ ed,t, wiąĪe siĊ z usuniĊciem skáadnika vd,t .
A wiĊc oprócz báĊdów oszacowaĔ ed,t usuwa siĊ takĪe czĊĞü zmiennoĞci parametru
populacji w postaci skáadnika resztowego İd,t. Stąd waĪne jest, aby skáadnik vd,t byá
zdominowany przez ed,t. Wówczas wariancja skáadnika vd,t bĊdzie bliska wariancji
ଶ
jest bliska 1.
Var (ed,t) báĊdu estymatora bezpoĞredniego, co oznacza, Īe wartoĞü ߪ௩ǡௗ
JeĪeli przedstawimy strukturalny model szeregu czasowego opisanego równaniem
(1)–(11) za pomocą notacji macierzowej otrzymamy klasyczną postaü modelu przestrzeni stanów:
ܻௗǡ௧ ൌ ࢆࢻௗǡ௧ ൅ ‫ݒ‬ௗǡ௧ ,
(12)
ࢻௗǡ௧ ൌ ‫ࢻ܂‬ௗǡ௧ିଵ ൅ ࣁୢǡ୲ ,
(13)
gdzie Z to wektor znanych wspóáczynników regresji:
ࢆ ൌ ሺͳǡͲǡͳǡͲǡͳǡͲǡͳሻ,
(14)
Įt to wektor nieznanych parametrów stanu:
்
‫כ‬
‫כ‬
ࢻௗǡ௧ ൌ ൫‫ܮ‬ௗǡ௧ ǡ ܴௗǡ௧ ǡ ܵௗǡ௧ǡଵ ǡ ܵௗǡ௧ǡଵ
ǡ ܵௗǡ௧ǡଶ ǡ ܵௗǡ௧ǡଶ
ǡ ߚௗǡ௧ ൯ ,
(15)
T to macierz przejĞcia:
ௌ
ௌ
ఉ
‫ ܂‬ൌ „Ž‘…†‹ƒ‰ሺ‫ ܂‬ோ ǡ ‫ ܂‬భ ǡ ‫ ܂‬మ ǡ ‫ ܂‬ሻ,
ͳ ͳ
ቁ,
Ͳ ͳ
‫܂‬ோ ൌ ቀ
‫܂‬
ௌೕ
…‘•ሺ݆ߨȀʹሻ •‹ሺ݆ߨȀʹሻ
ൌ൬
൰,
െ•‹ሺ݆ߨȀʹሻ …‘•ሺ݆ߨȀʹሻ
ఉ
‫ ܂‬ൌ ͳ,
(16)
(17)
(18)
(19)
414
Kamil Wilak
Șd,t to wektor skáadników losowych, odzwierciedlających zmiany w czasie wartoĞci
parametrów stanu:
ࣁௗǡ௧ ൌ ሺͲǡ ߟோǡୢǡ௧ ǡ ߟௌǡୢǡ௧ǡଵ ǡ ߟௌ ‫כ‬ǡୢǡ௧ǡଵ ǡ ߟௌǡୢǡ௧ǡଶ ǡ ߟௌ ‫כ‬ǡୢǡ௧ǡଶ ǡ ߟఉǡୢǡ௧ ሻ,
(20)
ࣁௗǡ௧ ̱ܰሺ‫۽‬ǡ ‫ۿ‬ௗ ሻ,
(21)
‫ݒ݋ܥ‬൫ߟௗǡ௧ ǡ ߟௗǡ௧ ᇲ ൯ ൌ ൜
‫ۿ‬ௗ
‫۽‬
݃݀‫ ݐݕ‬ൌ ‫ ݐ‬ᇱ
,
‫݌݌ݓ‬
ଶ
ଶ
ଶ
ଶ
ଶ
ଶ
‫ۿ‬ௗ ൌ ݀݅ܽ݃ሺͲǡ ߪோǡௗ
ǡ ߪௌǡௗǡଵ
ǡ ߪௌǡௗǡଵ
ǡ ߪௌǡௗǡଵ
ǡ ߪௌǡௗǡଵ
ǡ ߪఉǡௗ
ሻ.
(22)
(23)
Ideą modeli przestrzeni stanów jest zaáoĪenie, Īe obserwowana zmienna Yd,t jest
zaleĪna od nieobserwowanego wektora parametrów stanu Įd,t . Równanie (12), nazywane równaniem pomiarowym, okreĞla zaleĪnoĞü miĊdzy zmienną Yd,t a wektorem
stanów Įd,t , zaĞ wektor Z w tym równaniu skáada siĊ ze wspóáczynników okreĞlających tĊ zaleĪnoĞü. Równanie (13), nazywane równaniem przejĞcia opisuje natomiast zmiany w czasie nieobserwowanego wektora parametrów stanu Įd,t. Równania
(12)–(19) opisują szczególny przypadek modelu z rodziny przestrzeni stanów, w którym równanie pomiarowe i równanie przejĞcia są liniowe a rozkáad skáadników losowych jest normalny. Taki model nazywany jest dynamicznym modelem liniowym.
W celu oszacowania wektora Įd,t zastosowaü moĪna metodĊ zaproponowaną
przez Kalmana (1960), zwaną ¿ltrem Kalmana. Rekurencyjna procedura szacowania
wektora Įd,t opierająca siĊ na informacjach dostĊpnych w okresie t nazywana jest
¿ltrowaniem. Natomiast estymacja wektora Įd,t z uwzglĊdnieniem danych dostĊpnych po okresie t nazywana jest wygáadzaniem. Filtrowanie stosuje siĊ do szacowania
w obecnym okresie T, natomiast wygáadzanie wykorzystuje siĊ do poprawy oszacowaĔ z wczeĞniejszych okresów 1, ..., T – 1.
Dla uĪycia filtru Kalmana potrzebna jest znajomoĞü hiperparametrów4
ଶ
ଶ
ଶ
ଶ
ଶ
(d = 1, ..., D). W praktyce najczĊĞciej ich wartoĞci nie
ǡ ߪௌǡௗǡଵ
ǡ ǥ ǡ ߪௌǡௗǡଵ
ǡ ߪఉǡௗ
ߪ௩ǡௗ ǡ ߪோǡௗ
są znane, naleĪy wiĊc je oszacowaü. DziĊki zaáoĪeniu o normalnoĞci reszt w przedstawionym wyĪej modelu, hiperparametry moĪna oszacowaü za pomocą metody
najwiĊkszej wiarygodnoĞci. NaleĪy takĪe przyjąü wartoĞci początkowe wektora Įd,05.
4
W literaturze anglojĊzycznej pojĊcie hiperparametr (ang. hyperparameter) stosuje siĊ dla parametrów rozkáadu a priori, w celu odróĪnienia ich od parametrów modelu. W przypadku modelu zastosowanego w artykule hiperparametry są wariancjami reszt parametrów stanów mających normalny rozkáad
a priori.
5 W obliczeniach przeprowadzonych w dalszej czĊĞci opracowania przyjĊto domyĞlne wartoĞci
paczki dlm w pakiecie statystycznym R: Įd,0 = (0,0,0,0,0,0,0), d = 1, ..., D.
415
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
WiĊcej na temat szacowania parametrów i hiperparametrów dynamicznych modeli
liniowych moĪna znaleĨü w pracach Harvey’a (1989), Durbina, Koopmana (2001),
Petrisa i in. (2007).
Oszacowanie parametru șd,t otrzymane za pomocą dynamicznego modelu liniowego opisanego równaniami (12)–(13) jest postaci:
ௌ
ௌ
ி
ෝ ிௗǡ௧ lub ܻௗǡ௧
ෝ ௗǡ௧
ܻௗǡ௧
ൌ ࢆહ
ൌ ࢆહ
,
(24)
ௌ
ෝ ிௗǡ௧ i હ
ෝ ௗǡ௧
gdzie હ
są oszacowaniami wektora Įd,t uzyskane odpowiednio poprzez
¿ltrowanie (F – ¿ltered) i wygáadzanie (S – smoothing).
3. KONSTRUKCJA PSEUDOPOPULACJI
W dalszej czĊĞci opracowania podjĊto próbĊ oceny jakoĞci estymacji poĞredniej
stopy bezrobocia z wykorzystaniem dynamicznych modeli liniowych. Oceny jakoĞci
dokonano na podstawie eksperymentu Monte Carlo. W tym celu wykorzystano dane
jednostkowe z Badania AktywnoĞci Ekonomicznej LudnoĞci z lat 2000–2009.
Na potrzeby eksperymentu utworzono pseudo-populacjĊ odpowiadającą ludnoĞci w wieku 15+ zamieszkującej województwo wielkopolskie. Wagi osób biorących
udziaá w BAEL z woj. wielkopolskiego zmody¿kowano w taki sposób, aby dla
kaĪdego kwartaáu t (t = 1, ..., 40) i dla kaĪdej domeny d (d = 1, ..., 6), okreĞlonej przez
páeü i wiek, sumowaáy siĊ do liczebnoĞci populacji z woj. wielkopolskiego w roku
odpowiadającym kwartaáowi t i domenie d. Niech wi,d,t oznacza wagĊ i-tej osoby
z domeny d w kwartale t. Zmody¿kowana waga i-tej osoby wyznaczona jest w nastĊpujący sposób:
‫כ‬
‫ݓ‬௜ǡௗǡ௧
ቈ‫ݓ‬௜ǡௗǡ௧
ே೏ǡ೟
೙೏ǡ೟
σ೔సభ ௪೔ǡ೏ǡ೟
቉,
(25)
gdzie wi,d,t to waga i-tej osoby, Nd,t to liczebnoĞü populacji6, nd,t to liczebnoĞü próby
wylosowanej do BAEL w domenie d i kwartale t, zaĞ operator [ ] oznacza zaokrąglenie do caáoĞci. NastĊpnie kaĪdą jednostkĊ i z domeny d i kwartaáu t zduplikowano
‫כ‬
‫ݓ‬௜ǡௗǡ௧
razy, zgodnie z zasadą, Īe osoba o wadze w reprezentuje w osób.
6
jako liczebnoĞci Nd,t przyjĊto oszacowania publikowane przez Gáówny Urząd Statystyczny.
416
Kamil Wilak
4. STOPA BEZROBOCIA REJESTROWANEGO JAKO ZMIENNA POMOCNICZA
Konstrukcja modelu statystycznego wiąĪe siĊ z wyborem zmiennej objaĞniającej (pomocniczej). Zasadniczym wymogiem w tej kwestii jest silne skorelowanie ze
zmienną objaĞnianą. Naturalnym kandydatem na zmienną pomocniczą do szacowania
stopy bezrobocia wg BAEL jest stopa bezrobocia rejestrowanego. Badając relacjĊ
miĊdzy tymi zmiennymi w skonstruowanej pseudo-populacji, zauwaĪyü moĪna duĪe
podobieĔstwo zmiennoĞci w przekroju domen (por. rys. 1). Model strukturalny, przedstawiony w drugiej czĊĞci tego opracowania, zawiera trend i sezonowoĞü. Wprowadzenie stopy bezrobocia rejestrowanego do tego modelu jako zmiennej pomocniczej
wymaga oczyszczenia jej z trendu i wahaĔ sezonowych. W tym celu wykorzystano
model opisany równaniami (12)–(23) z pominiĊciem skáadnika systematycznego regresji liniowej. Po oczyszczeniu z trendu i sezonowoĞci, a nastĊpnie po znormalizowaniu,
relacje miĊdzy stopą bezrobocia i stopą bezrobocia rejestrowanego wskazują na silną
korelacjĊ (rys. 2, rys. 3, tab. 1). Szczególnie silna zaleĪnoĞü wystĊpuje w domenach
kobiet w wieku 25–44 lat i mĊĪczyzn w wieku 25–44 lat.
Rysunek 1. Stopa bezrobocia wg BAEL i stopa bezrobocia rejestrowanego w pseudo-populacji
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
417
Rysunek 2. Stopa bezrobocia wg BAEL i stopa bezrobocia rejestrowanego w pseudo-populacji,
po oczyszczeniu z trendu i sezonowoĞci oraz znormalizowaniu
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
Rysunek 3.Wykres korelacyjny stopy bezrobocia wg BAEL i stopy bezrobocia rejestrowanego
w pseudo-populacji, po oczyszczeniu z trendu i sezonowoĞci
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
418
Kamil Wilak
Tabela 1.
Wspóáczynniki korelacji liniowej miĊdzy oczyszczonymi z trendu i sezonowoĞci stopami bezrobocia
wg BAEL i bezrobocia rejestrowanego
Wspóáczynnik korelacji
liniowej
Domena
1: mĊĪczyĨni 15–24 lat
0,69
2: mĊĪczyĨni 25–44 lat
0,86
3: mĊĪczyĨni 45–64 lat
0,82
4: kobiety 15–24 lat
0,72
5: kobiety 25–44 lat
0,90
6: kobiety 45–59 lat
0,76
ħródáo: opracowanie wáasne na podstawie Badania AktywnoĞci Ekonomicznej LudnoĞci.
5. EKSPERYMENT MONTE CARLO
Wery¿kując przydatnoĞü strukturalnych modeli szeregów czasowych do szacowania stopy bezrobocia, przeprowadzono eksperyment Monte Carlo. W eksperymencie
tym szacowanymi parametrami są kwartalne stopy bezrobocia w pseudo-populacji
w nastĊpujących szeĞciu domenach:
1. mĊĪczyĨni w wieku 15–24 lat,
2. mĊĪczyĨni w wieku 25–44 lat,
3. mĊĪczyĨni w wieku 45–64 lat,
4. kobiety w wieku 15–24 lat,
5. kobiety w wieku 25–44 lat,
6. kobiety w wieku 45–59 lat.
Jako zmienną pomocniczą w estymacji poĞredniej stopy bezrobocia wg BAEL wykorzystano stopĊ bezrobocia rejestrowanego w pseudo-populacji.
W obliczeniach stosowano losowanie proste bez zwracania. Do bezpoĞredniej
estymacji stopy bezrobocia wykorzystano estymator postaci:
௡ಳ
ܻௗǡ௧ ൌ ௡೏ǡ೟
ಲ ,
(26)
೏ǡ೟
஻
஺
i ݊ௗǡ௧
to odpowiednio liczba osób bezrobotnych i liczba osób aktywnych
gdzie ݊ௗǡ௧
zawodowo w wylosowanej próbie w kwartale t w domenie d. Oszacowanie wariancji
tego estymatora, przy losowaniu prostym bez zwracania, jest dane wzorem:
ಳ
ܸܽ‫ݎ‬൫ܻௗǡ௧ ൯ ൌ
ಲ
ಳ
ሺே೏ǡ೟ ି௡೏ǡ೟ ሻ௡೏ǡ೟ ௡೏ǡ೟ ሺ௡೏ǡ೟ ି௡೏ǡ೟ ሻ
ே೏ǡ೟ ሺ௡೏ǡ೟ ିଵሻ
ಲ ൯య
൫௡೏ǡ೟
.
(27)
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
419
Eksperyment przeprowadzono wedáug nastĊpującej procedury:
1. Dla kaĪdego kwartaáu t z lat 2000–2009 (t = 1, ..., 40) za pomocą niezaleĪnego
losowania prostego bez zwracania pobrano próbĊ o rozmiarze 40007.
2. Na podstawie wylosowanej próby z wykorzystaniem estymatora bezpoĞredniego
danego wzorem (26) oszacowano stopĊ bezrobocia dla 6 domen. W ten sposób
ସ଴
otrzymano 6 szeregów czasowych ൛ܻௗǡ௧ ൟ௧ୀଵ (d = 1, ..., 6) ocen estymatorów bezpoĞrednich.
ସ଴
3. Na podstawie szeregów ൛ܻௗǡ௧ ൟ௧ୀଵ (d = 1, ..., 6) oszacowano hiperparametry
ଶ
ଶ
ଶ
ଶ
ଶ
ߪ௩ǡௗ
ǡ ߪோǡௗ
ǡ ߪௌǡௗǡଵ
ǡ ǥ ǡ ߪௌǡௗǡଵ
ǡ ߪఉǡௗ
(d = 1, ..., 6) dynamicznego modelu liniowego
(12)–(23).
ସ଴
4. NastĊpnie dla szeregu ൛ܻௗǡ௧ ൟ௧ୀଵ (d = 1, ..., 6) za pomocą wygáadzania oszacowano
wektory parametrów stanów Įt (t = 1, ..., 40) dynamicznego modelu liniowego.
5. Podstawiając oszacowania parametrów stanów Įt do estymatora poĞredniego
ସ଴
ௌ
ൟ௧ୀଵ (d = 1, ..., 6) ocen
danego równaniem (24) otrzymano szeregi czasowe ൛ܻௗǡ௧
estymatorów poĞrednich.
PowyĪszą procedurĊ powtórzono 500 razy, w wyniku czego dla kaĪdej domeny
d (d = 1, ..., 6) i dla kaĪdego kwartaáu t (t = 1, ..., 40) otrzymano po 500 ocen estymaௌ
torów bezpoĞrednich Yd,t oraz poĞrednich ܻௗǡ௧
(rys. 4). Na ich podstawie wyznaczono
miary jakoĞci estymatorów: obciąĪenie (B), odchylenie standardowe (S), pierwiastek
báĊdu Ğredniokwadratowego (RMSE) i Ğredni bezwzglĊdny báąd (MAE). Dla estymatora bezpoĞredniego Yd,t obliczono je za pomocą wzorów:
‫ܤ‬൫ܻௗǡ௧ ൯ ൌ ݉൫ܻௗǡ௧ ൯ െ ߠௗǡ௧ ǡ ݉൫ܻௗǡ௧ ൯ ൌ
ଵ
ହ଴଴
σହ଴଴
௜ୀଵ ܻௗǡ௧ǡ௜ ,
ଶ
ଵ
(28)
ܵሺܻௗǡ௧ ሻ ൌ ටହ଴଴ σହ଴଴
௜ୀଵ ൫ܻௗǡ௧ǡ௜ െ ݉ሺܻௗǡ௧ ሻ൯ ,
(29)
ܴ‫ܧܵܯ‬൫ܻௗǡ௧ ൯ ൌ ට‫ ܤ‬ଶ ൫ܻௗǡ௧ ൯ ൅ ܵ ଶ ሺܻௗǡ௧ ሻ,
(30)
‫ܧܣܯ‬ሺܻௗǡ௧ ሻ ൌ
ଵ
ହ଴଴
σହ଴଴
௜ୀଵ หߠௗǡ௧ െ ܻௗǡ௧ǡ௜ ห,
(31)
gdzie Yd,t,i to ocena estymatora bezpoĞredniego otrzymana w i-tej iteracji. Dla estymatorów poĞrednich wzory są analogiczne.
7
Zaokrąglona do tysiĊcy przeciĊtna wielkoĞü próby losowanej do BAEL z woj. wielkopolskiego
420
Kamil Wilak
W celu porównaĔ miĊdzy domenami, interpretacji poddano stosunki tych miar do
„prawdziwej” wartoĞci stopy bezrobocia: ஻൫௒೏ǡ೟ ൯ ௌ൫௒೏ǡ೟ ൯ ோெௌா൫௒೏ǡ೟ ൯ ெ஺ா൫௒೏ǡ೟ ൯
ఏ೏ǡ೟
,
ఏ೏ǡ೟
,
ఏ೏ǡ೟
,
ఏ೏ǡ೟
..
6. WYNIKI BADANIA
Estymacja poĞrednia cechują siĊ duĪym obciąĪeniem, siĊgającym nawet do 25%
wartoĞci stopy bezrobocia w domenach mĊĪczyzn w wieku 15–24 lat i 45–64 lat oraz
kobiet w wieku 15–24 lat i 45–59 lat (domeny 1, 3, 4 i 6) (por. rys 5 i 6). W tych
domenach obciąĪenie stanowi przeciĊtnie okoáo 7% wartoĞci stopy bezrobocia. Natomiast w przypadku domen mĊĪczyzn w wieku 25–44 lat oraz kobiet w wieku 25–44
lat (domeny 2 i 4) maksymalne obciąĪenie wyników estymacji poĞredniej wynosi
15% wartoĞci stopy bezrobocia, a Ğrednio stanowi okoáo 4% (por. tab. 2 i 3).
We wszystkich domenach estymacja poĞrednia cechuje siĊ mniejszym odchyleniem standardowym niĪ estymacja bezpoĞrednia, przeciĊtnie od 1,73 razy w domenach 2, 6 do 1,9 razy w domenach 3 i 5 (por. rys. 7, tab. 4).
Estymacja poĞrednia w wiĊkszoĞci przypadków cechuje siĊ mniejszym báĊdem
Ğredniokwadratowym niĪ estymacja bezpoĞrednia (por. rys. 8). Odmienną sytuacjĊ
zaobserwowano w domenach mĊĪczyzn w wieku 15–24 lat i kobiet w wieku 15–24
lat (domeny 1 i 4) dla dwunastu i dziewiĊciu kwartaáów, w domenach mĊĪczyzn
w wieku 44–64 lat i kobiet w wieku 44–59 lat (domeny 3 i 6) dla piĊciu kwartaáów,
zaĞ w domenach mĊĪczyzn w wieku 25–44 lat i kobiet w wieku 25–44 lat (domeny 2
i 5) tylko dla trzech kwartaáów. PrzeciĊtnie pierwiastek báĊdu Ğredniokwadratowego
w estymacji poĞredniej jest mniejszy niĪ w estymacji bezpoĞredniej od 1,29 razy
w domenie pierwszej do 1,59 razy w domenie piątej (por. tab. 5).
W wiĊkszoĞci przypadków estymacja poĞrednia cechuje siĊ mniejszym Ğrednim
báĊdem bezwzglĊdnym niĪ estymacja bezpoĞrednia (por. rys. 9). WiĊkszy Ğredni
báąd bezwzglĊdny w estymacji poĞredniej w domenach mĊĪczyzn w wieku 15–24
lat i kobiet w wieku 15–24 lat (domeny 1 i 4) wystĊpuje odpowiednio w piĊtnastu i dziewiĊciu kwartaáach, w domenach mĊĪczyzn w wieku 45–64 lat oraz kobiet
w wieku 45–59 lat (domeny 3 i 6) w szeĞciu kwartaáach, w domenach mĊĪczyzn
w wieku 25–44 lat i kobiet w wieku 25–44 lat (domeny 2 i 5) w czterech i piĊciu kwartaáach. PrzeciĊtny stosunek Ğredniego báĊdu bezwzglĊdnego do prawdziwej
stopy bezrobocia w estymacji bezpoĞredniej wynosi od 9% w domenie piątej do 14%
w domenach trzeciej i szóstej. Natomiast w estymacji poĞredniej stosunek ten wynosi
od 6% w domenie piątej do 11% w domenach trzeciej i szóstej (por. tab. 6). ĝredni
báąd bezwzglĊdny w estymacji poĞredniej jest mniejszy niĪ w estymacji bezpoĞredniej
przeciĊtnie od 1,26 razy w domenie pierwszej do 1,57 razy w domenie piątej.
BezpoĞredni
0,00
0,00
0,00
0,01
0,00
0,01
Kwartyl 1.
Mediana
Kwartyl 3.
Maximum
ĝrednia
Odch. stand.
0,00
0,00
0,01
0,00
0,00
0,00
-0,01
ħródáo: opracowanie wáasne.
-0,03
0,01
0,00
0,03
0,00
0,00
-0,01
-0,02
0,01
0,00
0,01
0,00
0,00
0,00
-0,01
1
2
3
4
M 15–24 M 25–44 M 45–64 K 15–24
Minimum
Domena
Estymator
0,01
0,00
0,01
0,00
0,00
0,00
-0,01
5
K 25–44
0,01
0,00
0,02
0,01
0,00
0,00
-0,02
0,09
-0,01
0,23
0,06
-0,02
-0,08
-0,17
0,05
-0,01
0,09
0,03
0,00
-0,05
-0,15
0,09
-0,02
0,16
0,04
-0,01
-0,08
-0,25
0,09
0,00
0,25
0,06
0,00
-0,06
-0,17
6
1
2
3
4
K 45–59 M 15–24 M 25–44 M 45–64 K 15–24
PoĞredni
0,05
-0,01
0,12
0,03
-0,01
-0,03
-0,11
5
K 25–44
Podstawowe statystyki stosunku obciąĪenia wyznaczonego na podstawie eksperymentu do „prawdziwej” stopy bezrobocia
0,09
-0,01
0,20
0,04
-0,03
-0,06
-0,25
6
K 45–59
Tabela 2.
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
421
BezpoĞredni
PoĞredni
0,00
0,00
0,01
0,03
0,01
0,01
Kwartyl 1.
Mediana
Kwartyl 3.
Maximum
ĝrednia
Odch. stand.
ħródáo: opracowanie wáasne.
0,00
0,00
0,00
0,01
0,01
0,00
0,00
0,00
0,01
0,01
0,03
0,01
0,00
0,00
0,00
0,00
0,00
0,01
0,01
0,00
0,00
0,00
0,00
0,00
0,01
0,01
0,00
0,00
0,00
0,01
0,01
0,02
0,01
0,01
0,00
0,00
0,05
0,07
0,23
0,10
0,06
0,03
0,00
0,03
0,04
0,15
0,07
0,04
0,02
0,00
0,06
0,07
0,25
0,10
0,06
0,02
0,00
0,05
0,07
0,25
0,10
0,06
0,03
0,00
0,03
0,04
0,12
0,05
0,03
0,02
0,00
0,05
0,07
0,25
0,09
0,06
0,03
0,00
1
2
3
4
5
6
1
2
3
4
5
6
M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59 M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59
Minimum
Domena
Estymator
Podstawowe statystyki stosunku wartoĞci bezwzglĊdnej obciąĪenia wyznaczonego na podstawie eksperymentu do „prawdziwej” stopy bezrobocia
Tabela 3.
422
Kamil Wilak
Tabela 4.
BezpoĞredni
PoĞredni
0,10
0,11
0,17
0,36
0,14
0,06
Kwartyl 1.
Mediana
Kwartyl 3.
Maximum
ĝrednia
Odch. stand.
ħródáo: opracowanie wáasne.
0,08
0,04
0,13
0,21
0,15
0,11
0,10
0,08
0,05
0,18
0,31
0,20
0,16
0,15
0,12
0,05
0,13
0,25
0,17
0,11
0,10
0,08
0,02
0,11
0,16
0,13
0,10
0,09
0,08
0,05
0,18
0,31
0,19
0,16
0,14
0,13
0,06
0,09
0,36
0,10
0,07
0,05
0,04
0,03
0,08
0,16
0,09
0,07
0,05
0,04
0,05
0,10
0,26
0,12
0,08
0,07
0,05
0,03
0,08
0,17
0,09
0,06
0,05
0,04
0,02
0,06
0,11
0,08
0,05
0,04
0,04
0,05
0,11
0,26
0,13
0,09
0,08
0,06
2
3
4
5
6
1
2
3
4
5
6
1
M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59 M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59
Minimum
Domena
Estymator
Podstawowe statystyki stosunku odchylenia standardowego wyznaczonego na podstawie eksperymentu do „prawdziwej” stopy bezrobocia
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
423
BezpoĞredni
PoĞredni
0,10
0,11
0,17
0,36
0,14
0,06
Kwartyl 1.
Mediana
Kwartyl 3.
Maximum
ĝrednia
Odch. stand.
ħródáo: opracowanie wáasne.
0,08
0,04
0,13
0,21
0,15
0,11
0,10
0,08
0,05
0,18
0,31
0,20
0,16
0,15
0,13
0,05
0,13
0,25
0,17
0,11
0,10
0,08
0,02
0,11
0,16
0,13
0,10
0,09
0,08
0,05
0,18
0,31
0,19
0,16
0,14
0,13
0,07
0,12
0,43
0,15
0,11
0,08
0,05
0,04
0,09
0,18
0,12
0,09
0,06
0,05
0,06
0,13
0,30
0,15
0,11
0,08
0,06
0,05
0,11
0,30
0,14
0,10
0,07
0,05
0,03
0,07
0,15
0,09
0,06
0,05
0,04
0,06
0,13
0,32
0,15
0,12
0,09
0,07
1
2
3
4
5
6
1
2
3
4
5
6
M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59 M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59
Minimum
Domena
Estymator
Podstawowe statystyki stosunku pierwiastka báĊdu Ğredniokwadratowego wyznaczonego na podstawie eksperymentu do „prawdziwej”
stopy bezrobocia
Tabela 5.
424
Kamil Wilak
Tabela 6.
BezpoĞredni
PoĞredni
0,08
0,09
0,13
0,29
0,12
0,05
Kwartyl 1.
Mediana
Kwartyl 3.
Maximum
ĝrednia
Odch. stand.
ħródáo: opracowanie wáasne.
0,07
0,03
0,10
0,17
0,12
0,09
0,08
0,06
0,04
0,14
0,25
0,15
0,13
0,12
0,10
0,04
0,11
0,20
0,14
0,09
0,08
0,06
0,02
0,09
0,13
0,10
0,08
0,07
0,06
0,04
0,14
0,25
0,16
0,13
0,11
0,10
0,06
0,10
0,36
0,13
0,09
0,06
0,04
0,03
0,08
0,15
0,10
0,07
0,05
0,04
0,05
0,11
0,25
0,12
0,09
0,07
0,05
0,05
0,09
0,26
0,12
0,08
0,06
0,04
0,02
0,06
0,13
0,07
0,05
0,04
0,03
0,05
0,11
0,27
0,13
0,10
0,08
0,06
1
2
3
4
5
6
1
2
3
4
5
6
M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59 M 15–24 M 25–44 M 45–64 K 15–24 K 25–44 K 45–59
Minimum
Domena
Estymator
Podstawowe statystyki stosunku Ğredniego báĊdu bezwzglĊdnego wyznaczonego na podstawie eksperymentu do „prawdziwej” stopy bezrobocia
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
425
426
Kamil Wilak
Rysunek 4. Oceny estymatorów otrzymane w wyniku eksperymentu
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
N
6
N E L
L
G
L
N
G
G L
M´
E
E L
Rysunek 5. Stosunek obciąĪenia wyznaczonego na podstawie eksperymentu do „prawdziwej”
stopy bezrobocia
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
427
Rysunek 6. Stosunek wartoĞci bezwzglĊdnej obciąĪenia wyznaczonego na podstawie eksperymentu do
„prawdziwej” stopy bezrobocia
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
Rysunek 7. Stosunek odchylenia standardowego wyznaczonego na podstawie eksperymentu do
„prawdziwej” stopy bezrobocia
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
428
Kamil Wilak
Rysunek 8. Stosunek pierwiastka báĊdu Ğredniokwadratowego wyznaczonego na podstawie
eksperymentu do „prawdziwej” stopy bezrobocia
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
Rysunek 9. Stosunek Ğredniego báĊdu bezwzglĊdnego wyznaczonego na podstawie eksperymentu do
„prawdziwej” stopy bezrobocia
ħródáo: opracowanie wáasne na podstawie danych z Badania AktywnoĞci Ekonomicznej LudnoĞci.
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
429
7. WNIOSKI I DALSZE KIERUNKI BADAē
W ogólnym przypadku estymacja poĞrednia cechuje siĊ mniejszą dokáadnoĞcią,
ale wiĊkszą precyzją niĪ estymacja bezpoĞrednia. W wiĊkszoĞci kwartaáów jakoĞü
estymacji mierzona za pomocą báĊdu Ğredniokwadratowego i Ğredniego báĊdu bezwzglĊdnego jest wiĊksza w przypadku estymacji poĞredniej. DuĪe obciąĪenia estymatorów poĞrednich w niektórych kwartaáach spowodowane byáy nie do koĔca dobrze
dopasowanym modelem. Oczyszczona z trendu i sezonowoĞci stopa bezrobocia
rejestrowanego bĊdąca zmienną pomocniczą, w niektórych kwartaáach przebiegaáa
znacząco odmiennie niĪ oczyszczona z trendu i sezonowoĞci stopa bezrobocia, co
powodowaáo, Īe systematyczny skáadnik regresji liniowej w tych kwartaáach pogarszaá dopasowanie modelu.
Najmniejsze báĊdy estymacji poĞredniej moĪna zaobserwowaü w domenach
mĊĪczyzn w wieku 25–44 lat i kobiet w wieku 25–44 lat (domeny 2 i 5), gdzie
zmienna pomocnicza byáa najsilniej skorelowana z „prawdziwą” stopą bezrobocia.
ZaĞ w domenach mĊĪczyzn 15–24 lat i kobiet w wieku 15–24 lat (domeny 1 i 4)
zmienna pomocnicza jest najsáabiej skorelowana z „prawdziwą” stopą bezrobocia, co
przekáada siĊ na wiĊksze báĊdy estymacji poĞredniej.
Oszacowania otrzymane metodą zastosowaną w niniejszym artykule charakteryzują siĊ niespójnoĞcią, a mianowicie Ğrednia waĪona oszacowaĔ z poszczególnych
domen nie jest równa oszacowaniu dla caáego województwa. W celu otrzymania
spójnych oszacowaĔ w literaturze stosuje siĊ techniki zwane „benchmarkingiem”.
Zastosowanie „benchmarkingu” moĪna znaleĨü m.in. w pracy Pfeffermanna i in.
(2005), Pfeffermanna, Tillera (2006). Jednym z dalszych kierunków badaĔ autora jest
zastosowanie tych technik w celu otrzymania spójnych oszacowaĔ charakterystyk
polskiego rynku pracy za pomocą estymacji poĞredniej.
Uniwersytet Ekonomiczny w Poznaniu
LITERATURA
Brakel J., Krieg S., (2008), Estimation of the Monthly Unemployment Rate through Structural Time
Series Modeling in a Rotating Panel Design, Statistics Netherlands, Hague.
Brakel J., Krieg S., (2009), Structural Time Series Modeling of the Monthly Unemployment Rate in
a Rotating Panel, Statistics Netherlands, Hague.
Brakel J., Krieg S., (2010), Estimation of the Monthly Unemployment Rate for Six Domains through
Structural Time Series Modeling with Cointegrated Trends, Statistics Netherlands, Hague.
DomaĔski C., Pruska K., (2001), Metody statystyki maáych obszarów, Wydawnictwo Uniwersytetu àódzkiego, àódĨ.
Durbin J., Koopman S. J., (2001), Time Series Analysis by State Space Methods, Oxford University
Press, Oxford.
430
Kamil Wilak
GUS (2014a), AktywnoĞü ekonomiczna ludnoĞci Polski, IV kwartaá 2013, Gáówny Urząd Statystyczny,
Warszawa.
GUS (2014b), Bezrobocie rejestrowane, I–IV kwartaá 2013, Gáówny Urząd Statystyczny, Warszawa.
Goáata E., (2004), Estymacja poĞrednia bezrobocia na lokalnym rynku pracy, Prace habilitacyjne,
Wydawnictwo Uniwersytetu Ekonomicznego w Poznaniu, PoznaĔ.
Harvey A. C., (1989), Forecasting, Structural Time Series Models and the Kalman Filter, Cambridge
University Press, Cambridge.
Kalman R. E., (1960), A New Approach to Linear Filtering and Prediction Problems, Journal of Basic
Engineering, 82 (Series D), 35–45.
Petris G., Petrone S., Campagnoli P., (2007), Dynamic Linear Models with R, Springer, New York.
Pfeffermann D., Tiller R., Brown S., (2005), Small Area Estimation with Stochastic Benchmark Constraints: Theory and Practical Application in US Labor Statistics, Statistical Of¿ce of the European
Communities (Eurostat) – Working papers and studies, Luxemburg.
Pfeffermann D., Tiller R., (2006), Small Area Estimation with State Space Models Subject to Benchamrk
Constraints, Journal of the American Statistical Association, 476 (101), 1387–1397.
Rao J. N. K., (2003), Small Area Estimation, John Wiley & Sons, Hoboken.
Wilak K., (2013), Wykorzystanie dynamicznych modeli liniowych w estymacji poĞredniej, Ekonometria,
2 (40), 126–138.
STRUKTURALNE MODELE SZEREGÓW CZASOWYCH W ESTYMACJI STOPY BEZROBOCIA
W DEZAGREGACJI NA WOJEWÓDZTWA, PàEû I WIEK
Streszczenie
Informacje publikowane przez Gáówny Urząd Statystyczny na podstawie Badania AktywnoĞci Ekonomicznej LudnoĞci cechują siĊ duĪym poziomem agregacji. Oszacowania w przekroju województw dla
maáych grup okreĞlonych przez cechy demogra¿czne nie są publikowane ze wzglĊdu na zbyt maáą precyzjĊ estymacji bezpoĞredniej, spowodowaną maáą liczebnoĞcią próby. Sposobem na zwiĊkszenie precyzji
oszacowania jest zastosowanie estymacji poĞredniej. W literaturze popularne jest podejĞcie, w którym do
estymacji poĞredniej charakterystyk rynku pracy stosuje siĊ strukturalne modele szeregów czasowych.
W niniejszym artykule zostaáa podjĊta próba oceny wykorzystania tej metody w kontekĞcie zwiĊkszenia
precyzji estymacji stopy bezrobocia w dezagregacji na województwa, páeü i wiek. Ocena ta zostaáa
dokonana na podstawie eksperymentu Monte Carlo z wykorzystaniem danych jednostkowych z Badania
AktywnoĞci Ekonomicznej LudnoĞci z lat 2000–2009. Wyniki tego badania pokazują, Īe zastosowany
estymator poĞredni w wiĊkszoĞci przypadków cechuje siĊ lepszą jakoĞcią niĪ estymacja bezpoĞrednia.
Sáowa kluczowe: statystyka maáych obszarów, estymacja poĞrednia, dynamiczne modele liniowe,
stopa bezrobocia
Strukturalne modele szeregów czasowych w estymacji stopy bezrobocia w dezagregacji...
431
STRUCTURAL TIME SERIES MODELS IN UNEMPLOYMENT RATE ESTIMATION
IN DISAGGREGATION ON VOIVODESHIP, SEX AND AGE
Abstract
Central Statistical Of¿ce in Poland publishes information on labour market derived from Labour
Force Survey at high level of aggregation. Estimates for small demographic domains on voivodeship
level are not published due to insuf¿cient precision of direct estimates, caused by small sample size. One
of possible approaches to the problem is to apply small area estimation. Taking into account that LFS
is panel research of households structural time series models can be used in order to borrow strength in
time. The aim of the article is to evaluate this method in the context of unemployment rate estimation on
voivodeship level including sex and age domains. Monte Carlo simulation study will be applied in order
to assess results of estimation and compare to direct estimation. Data obtained from the Labour Force
Survey in Poland between 2000–2009 will be used. Results of the study indicates that temporal small
area estimation have better quality of estimates compared to direct estimation.
Keywords: Small Area Estimation, direct estimation, dynamic linear models, unemployment rate