Autoreferat rozprawy doktorskiej obronionej na WNE UW
Transkrypt
Autoreferat rozprawy doktorskiej obronionej na WNE UW
Modelowanie makroekonometryczne a obserwacje nietypowe w danych Autoreferat Katarzyna Lada Uniwersytet Warszawski, Wydział Nauk Ekonomicznych 5 listopada 2008 W obliczu licznych przemian strukturalnych (takich jak te związane z dostosowaniami Polski do uwarunkowań funkcjonowania na wspólnym rynku Unii Europejskiej czy generalne zmiany w stosunkach międzynarodowych) potrzeba zrozumienia struktury makroekonomicznej kraju nabiera coraz większego znaczenia. W mojej opinii, modelowanie makroekonometryczne polskiej gospodarki zajmuje wciąż relatywnie niewiele miejsca we współczesnej literaturze. Powstało wprawdzie szereg modeli gospodarki polskiej, niemniej jednak, biorąc pod uwagę różnorodność technik ekonometrycznych oraz teoretycznych nurtów makroekonomii wykorzystywanych przy modelowaniu innych, rozwiniętych gospodarek, analiza procesów rządzących polską gospodarką pozostaje dalece niesatysfakcjonująca. Rozwój badań nad modelowaniem makroekonometrycznym gospodarki polskiej jest niezwykle istotny. Z jednej strony, modele pozwalają spojrzeć na procesy gospodarcze w sposób systematyczny i syntetyczny. Wiele założeń teorii makroekonomicznych nie bierze pod uwagę ważnych czynników, które odgrywają rolę w kształtowaniu procesów ekonomicznych. Identyfikacja tych czynników staje się możliwa poprzez analizy empiryczne, w tym, w szczególności, budowę modeli makroekonometrycznych. Modelowanie rzeczywistości gospodarczej może stać się ponadto punktem wyjścia do formułowania hipotez potencjalnie użytecznych w rozwijaniu nowych, bardziej adekwatnych koncepcji makroekonomii. Z drugiej strony, modele pozwalają na formułowanie prognoz gospodarczych. Jest niezwykle istotne, zwłaszcza, że większość decyzji ekonomicznych zależy od oczekiwań, co do przyszłych uwarunkowań. Wychwycenie adekwatnych do rzeczywistości prawidłowości w gospodarce może pomóc w identyfikowaniu najważniejszych celów, instrumentów i mechanizmów polityki. W powszechnie stosowanych modelach makroekonometrycznych zakłada się zwykle stałą liniową strukturę dynamiki danych w czasie. Niemniej jednak założenie to może być w praktyce niewłaściwe, ze względu na oczywiste zaburzenia liniowości wynikające z występowania różnego rodzaju szoków. Należy pamiętać, że w szeregach czasowych bardzo często występują obserwacje nietypowe. Proces rozwoju gospodarczego nieodłącznie wiąże się z występowaniem wyjątkowych wydarzeń, które mogą prowadzić do okresowych nietypowych zachowań wskaźników makroekonomicznych. Przykładami takich wydarzeń mogą być: kryzys paliwowy z 1973 roku, zamach na World Trade Center z 2001 roku, przystąpienie Polski do Unii Europejskiej w 2004 roku czy różnego rodzaju działania polityczne. Dodatkowo część obserwacji nietypowych wynika z błędów takich jak: błąd pomiaru, błąd doboru próby czy błąd w założeniach na temat rozkładu danych. Większość klasycznych metod modelowania ekonometrycznego nie jest w stanie uwzględnić wszystkich tych elementów. Uwzględnienie problemu obserwa1 cji nietypowych w modelowaniu makroekonometrycznym pozwala na lepsze zrozumienie wpływu szoków na gospodarkę i jednocześnie prowadzi do formułowania lepszych prognoz. Znaczenie przedstawionej w pracy analizy obserwacji nietypowych jest dwojakie. Z jednej strony został zaprezentowany aktualny stan wiedzy oraz wybrane procedury związane z pojęciem i wykrywaniem obserwacji nietypowych zarówno w modelach regresji liniowej jak i w modelach szeregów czasowych. Jest to o tyle istotne, że do tej pory powstało niewiele publikacji w języku polskim prezentujących w tak szerokim zakresie ten problem. Z drugiej strony zostały zaproponowane nowe zastosowania istniejących technik. Zaproponowane alternatywne wykorzystanie metod wykrywania obserwacji nietypowych pozwala na estymację modeli makroekonometrycznych, w których uwzględniane jest potencjalne nietypowe zachowanie wskaźników makroekonomicznych. Istotną cechą proponowanych przeze mnie metod jest ich obiektywizm. W procesie estymacji rezygnuje się z wykorzystania subiektywnej wiedzy eksperckiej, co pozwala na pełną formalizację i algorytmizację procesu uwzględniania obserwacji nietypowych w modelowaniu makroekonometrycznym. Celem pracy jest zwrócenie uwagi, jak istotną rolę w modelowaniu makroekonometrycznym odgrywają obserwacje nietypowe występujące w danych. Zasadnicza teza pracy jest następująca: Mimo wstrząsów spowodowanych transformacją systemową i następującym po niej procesem konwergencji, w Polsce ustaliła się ogólna struktura relacji między podstawowymi agregatami makroekonomicznymi. Trudno ją poprawnie wychwycić na podstawie tradycyjnych metod estymacji ze względu na obserwacje nietypowe, które wpływają w sposób istotny na wielkości estymatorów. Wobec tego estymacja uwzględniająca obserwacje nietypowe jest lepszym narzędziem modelowania makroekonomicznego w przypadku krajów transformujących się (takich jak Polska) niż tradycyjne metody estymacji. W badaniu uwaga została skupiona na dwóch zasadniczych celach, przy czym drugi z nich jest celem nadrzędnym: 1. Wskazaniu potencjalnego wpływu występowania obserwacji nietypowych na wyniki wstępnej obróbki danych. Dodatkowo, w pracy została zwrócona uwaga na niebezpieczeństwa jakie wiążą się ze stosowaniem mechanicznych metod we wstępnej analizie danych. 2. Wyestymowaniu konkretnego modelu makroekonometrycznego polskiej gospodarki z wykorzystaniem alternatywnych metod analizy danych makroekonomicznych biorących pod uwagę możliwość występowania obserwacji nietypowych. Drugorzędnym celem jest określenie momentów nietypowych w stosunku do wyestymowanych generalnych zależności i porównanie wyników zaproponowanych technik ekonometrycznych z wiedzą ekspercką na temat momentów nietypowych w polskiej gospodarce. Rozprawa składa się ze wstępu, podsumowania, czterech rozdziałów i trzech dodatków. Rozdział 1 powstał na podstawie (4). Celem tego rozdziału jest dokonanie przeglądu niektórych dotychczas stosowanych metod modelowania makroekonometrycznego gospodarek przechodzących przemiany społecznogospodarcze, ze szczególnym uwzględnieniem modeli stosowanych do analizy polskiej gospodarki. Ponieważ problematyka modelowania polskiej gospodarki jest obecnie często poruszana, dlatego przedstawiony przegląd 2 został ograniczony ze względu na cel badania. W szczególności zostały opisane jedynie te techniki, przy zastosowaniu których autorzy wskazują na nietypowe zachowania wskaźników makroekonomicznych, jako jedną z przyczyn zastosowania określonych metod do estymacji zaprezentowanych modeli. Rozdział skonstruowany jest następująco: podrozdział 1.1 opisuje estymację parametrów zmieniających się w czasie (ang. time-varying parameter (TVP) estimation). W następnym podrozdziale 1.2 przedstawiona została technika szacunkowego określania parametrów modelu (ang. guesstimation) zaproponowana w (1). W podrozdziale tym przedstawiony został również model długookresowych dostosowań (ang. long-run adjustment model (LAM)) zbudowany z wykorzystaniem tych technik. W kolejnym podrozdziale 1.3 przedstawione zostało zastosowanie modelowania panelowego przy konstrukcji modelu polskiej gospodarki. Natomiast podrozdział 1.4 opisuje metodę stosowaną przy konstrukcji modelu polskiej gospodarki W8-D, polegającą na rozciąganiu próby na różne systemy gospodarcze oraz krytykę tego podejścia. Rozdział 2 przedstawia podstawowe pojęcia i narzędzia związane z obserwacjami nietypowymi. Oprócz opisu własności teoretycznych prezentowanych pojęć, w rozdziale znajduje się szereg przykładów ilustrujących analizowane problemy, rysunków oraz odwołań do wyników analiz empirycznych, co pozwala na dogłębne wprowadzenie w tematykę. Konstrukcja tego rozdziału jest następująca: podrozdział 2.1 przedstawia pojęcie obserwacji nietypowych, ich źródła i rodzaje zarówno w modelach regresji jak i modelach szeregów czasowych. Podrozdział 2.2 opisuje wpływ obserwacji nietypowych na analizę ekonometryczną. W podrozdziale 2.3 opisane zostały niektóre techniki wykrywania obserwacji nietypowych występujących w modelach regresji oraz w modelach szeregów czasowych. Jedna z tych technik została wykorzystana w zaproponowanym przeze mnie badaniu, dlatego jest przedstawiona poniżej. Ta sekwencyjna procedura wykrywania obserwacji nietypowych składa się z wewnętrznej i zewnętrznej iteracji. W iteracji zewnętrznej, przy założeniu braku obserwacji nietypowych, dokonuje się estymacji parametrów modelu ARIMA φ(B)α(B)zt = θ(B)t , (1) gdzie: t to zmienne losowe wzajemnie niezależne o zerowej średniej i jednakowej wariancji σ2 , B oznacza operator opóźnień B j zt = zt−j , φ(B) jest wielomianem operatora opóźnień B związanym ze stacjonarnym procesem autoregresyjnym1 , α(B) jest wielomianem o pierwiastach jednostkowych związanych z różnicowaniem (również sezonowym) oraz θ(B) jest (odwracalnym) wielomianem związanym z procesem średniej ruchomej. Wyniki tej estymacji służą przeprowadzeniu iteracji wewnętrznej, której kolejne etapy przedstawiają się następująco: 1. dodawanie do podstawowego modelu ARIM A szeregu czasowego zt (danego równaniem 1) zmiennej reprezentującej określony rodzaj obserwacji nietypowej po kolei dla każdej obserwacji. Model takiego szeregu2 : (τ ) yt = zt + ωj ξj (B)It , j = AO, IO, T C, LS, (2) gdzie: 1 Wielomian φ(B) może również posiadać pierwiastki zespolone. - obserwacje nietypowe o charakterze jednorazowym, addytywne (ang. additive outliers), IO - innowacyjne obserwacje nietypowe (ang. innovative outliers)– wpływają na reszty modelu, TC - zmiany przejściowe (ang. temporary change)– jest zaburzeniem zanikającym przez kilka okresów, LS - przesunięcia poziomu (ang. level shift). 2 AO 3 ωj jest początkową wielkością wpływu obserwacji nietypowej j (j = AO, IO, T C, LS) w okresie t = τ , (τ ) (τ ) It jest zmienną zero-jedynkową taką, że It = 1 dla t = τ oraz 0 w przeciwnym przypadku, ξj (B) określa funkcję reakcji na wystąpienie obserwacji nietypowej z okresu t = τ , która ma postać, odpowiednio dla poszczególnych rodzajów obserwacji nietypowych: AO : ξAO = 1, IO : ξIO = θ(B) , α(B)φ(B) 1 , 0 < δ < 1, ξT C = 1 − δB 1 ξLS = . 1−B TC : LS : (3) 2. wyestymowanie kolejnych równań regresji: φ(B)α(B) φ(B)α(B) (τ ) yt = ωj ξj (B)It + t . θ(B) θ(B) (4) Definiując Yt oraz Xt jako φ(B)α(B) yt , θ(B) (5) φ(B)α(B) (τ ) ξj (B)It , θ(B) (6) Yt = ωj Xt + t . (7) Yt = Xt = równanie 4 jest równaniem regresji liniowej 3. sprawdzenie istotności otrzymanych statystyk testujących: Estymatorem potencjalnego wpływu obserwacji nietypowej z okresu τ jest PN Yt Xt , ω̂j (τ ) = Pt=1 N 2 t=1 Xt (8) natomiast estymatorem jego wariancji jest σ2 σ̂ωj (τ ) = PN t=1 Xt2 . (9) Statystyką służącą wykrywaniu obserwacji nietypowej z okresu τ jest wówczas λ̂j,τ = ω̂j (τ ) σ̂ωj (τ ) j = AO, IO, T C, LS, 4 (10) 4. wybranie największej spośród z nich λ̂τ = max j=AO,IO,T C,LS {|λ̂j,τ |} (11) i przyrównanie jej z określoną wartością krytyczną C. Jeśli λ̂τ > C, wówczas obserwacja nietypowa j zostaje wykryta w okresie τ . Jeżeli w okresie τ zostanie wykryta obserwacja nietypowa, wówczas jej efekt jest korygowany, tzn. obserwacja yt jest modyfikowana (τ ) w okresie t = τ , w celu uzyskania poprawionej wartości zt według wzoru 2, zt = yt − ω̂ j (τ )ξj (B)It . Kiedy wszystkie obserwacje nietypowe zostaną wykryte, a ich efekt skorygowany na podstawie powyższej iteracji wewnętrznej, następuje powrót do iteracji zewnętrznej i ponowna estymacja modelu ARIM A, tym razem na danych zmodyfikowanych z użyciem opercji podstawienia. Wyniki tej estymacji kolejny raz wykorzystuje się do przeprowadzenia iteracji wewnętrznej. Procedura powtarzana jest do momentu, w którym nie zostaną wykryte już żadne obserwacje nietypowe. W dalszej części pracy przedstawione zostały wyniki badań nad nowymi metodami uwzględniania obserwacji nietypowych, zarówno w analizie wstępnej makroekonomicznych szeregów czasowych (rozdział 3), jak i przy konstrukcji konkretnego modelu makroekonometrycznego polskiej gospodarki (rozdział 4). Rozdział 3 składa się z dwu podrozdziałów. Podrozdział 3.1 zawiera oryginalne wyniki licznych zaprojektowanych przeze mnie symulacji prezentujących wpływ podstawowych procedur wstępnej obróbki danych (pozbywania się trendu i wygładzania sezonowego) na własności szeregów czasowych. Na podstawie symulacji zostało pokazane, że zastosowanie filtru Hodricka-Prescotta do danych mających w reprezentacji ARIM A pierwiastek autoregresyjny, bliski bądź równy 1, a następnie zastosowanie KMNK do otrzymanych komponentów cyklicznych powoduje fałszywą autokorelację reszt modelu. To z kolei powoduje zmianę rozkładu statystyk t i może prowadzić do błędnych wniosków z analizy regresji liniowej (por. (3) oraz (6)). Ponadto symulacje (por. (5)) pozwalają wyciągnąć wniosek, że metoda dekompozycji sezonowej X12 − ARIM A może sztucznie generować obserwacje nietypowe. Szansa wykrycia obserwacji nietypowej, z użyciem opisanej powyżej procedury iteracyjnej, w szeregu odsezonowanym jest prawie dwukrotnie większa w stosunku do szeregu nie poddanego korekcie sezonowej. W kolejnym podrozdziale 3.2 została zaproponowana zmodyfikowana wersja testu pierwiastka jednostkowego (nazwanego zlinearyzowanym testem Dickey-Fullera). Bardzo ogólnie, test polega na tym, że w pierwszym kroku dokonuje się identyfikacji obserwacji nietypowych na podstawie testów ilorazu wiarogodności, stosując odpowiedni model regARIM A, zgodnie z procedurą opisaną powyżej. Następnie, na podstawie wyestymowanych wielkości i rodzajów obserwacji nietypowych oryginalny szereg zostaje oczyszczony, a w ostatnim kroku, do tak przekształconego szeregu stosuje się test Dickey-Fullera. Dzięki zaproponowanej przez mnie modyfikacji test ten może być stosowany w przypadku, gdy dane zawierają obserwacje nietypowe. Dodatkowo, zlinearyzowany test Dickey-Fullera jest lepszy od dotychczas stosowanych testów pierwiastka jednostkowego z kilku względów. Po pierwsze, dzięki wyeliminowaniu wpływu różnych typów obserwacji nietypowych, rozmiar statystyki jest bliski nominalnemu. Po drugie, moc testu jest bliska mocy standardowych testów, w przypadkach gdy dane nie zawierają obserwacji nietypowych (lub gdy ich wpływ jest niewielki). Po trzecie, metoda jest stosunkowo prosta i łatwa do zaimplemetowania przy zastosowaniu standardowych pakietów statystyczno-ekonometrycznych. Ponadto, zaproponowana procedura powinna być użyteczna w badaniach, w których jednocześnie bada się stacjonarność 5 szeregów oraz próbuje określić momenty możliwych wydarzeń szczególnych, nietypowych dla gospodarki (por. (2)). Rozdział 4 przedstawia główne badanie empiryczne, w którym zastosowane zostały metody opisane w poprzednich rozdziałach. Wykorzystany w tym rozdziale model polskiej gospodarki (NSA– Nowy Schemat Analityczny) oraz dane zostały udostępnione przez ekspertów Narodowego Banku Polskiego. Głównym celem badania jest weryfikacja powszechnie akceptowanej tezy, że trudno jest uzyskać lepsze prognozy metodami sformalizowanymi niż przy wykorzystaniu wiedzy ekspertów. Dodatkowo, w rozdziale tym została zaprezentowana autorska technika odpornej estymacji, mająca zastosowanie przy modelowaniu ekonometrycznym szeregów czasowych. Analiza przedstawiona w tym rozdziale dowodzi, że stosując zaproponowane metody możliwa jest poprawa jakości prognoz w podobnym stopniu jak przy wykorzystaniu wiedzy eksperckiej. W podrozdziałach 4.1 oraz 4.2 w sposób szczegółowy opisany został wykorzystywany model oraz motywacja zastosowania tego właśnie modelu. Następnie, w podrozdziale 4.3 przedstawione zostały proponowane metody estymacji. W badaniu porównane zostały cztery metody: (KMNK) klasyczna metoda najmniejszych kwadratów; (KM N K + dummies) klasyczna metoda najmniejszych kwadratów z wykluczeniem obserwacji nietypowych na podstawie wiedzy eksperckiej; (lin M N K) zlinearyzowana metoda najmniejszych kwadratów, polegająca na wstępnym wygładzeniu szeregów i pozbyciu się wpływu obserwacji nietypowych; (tramo − resid M N K) ważona metoda najmniejszych kwadratów, w której wagi dobierane są na podstawie wielkości i rodzaju wykrytych obserwacji nietypowych w szeregach reszt poszczególnych równań modelu. Dwie ostatnie metody prezentują nowatorskie podejście do problemu uwzględniania obserwacji nietypowych w procesie estymacji równań na szeregach czasowych. W metodzie tramo − resid M N K wielkość wag poszczególnych obserwacji zależy od: wybranej funkcji kryterium, rozkładu, rodzaju i wielkości obserwacji nietypowych wykrytych w resztach. Dobór wag odbywa się na podstawie procedury iteracyjnej. W tabeli poniżej przedstawione zostały okresy wyróżnione w analizowanych metodach jako nietypowe (metoda lin M N K i tramo − resid M N K) lub nie dające się opisać za pomocą zmiennych zawartych w modelu (metoda ekspercka, KM N K +dummies). Dodatkowo dla metod lin M N K oraz tramo−resid M N K pokazane zostały rodzaje uwzględnionych obserwacji nietypowych. Metoda estymacji lin M N K tramo − resid M N K nazwa zmiennej KM N K + dummies luka popytowa x x x inflacja netto 1998q1; 2004q1-q4 1998q1 (AO) 1998q1 (AO) dynamika cen żywności 2004q1-q4 x x dynamika cen paliw x x 1998q1 (AO) oczekiwania inflacyjne x 1998q2 (AO) x kurs walutowy USD/PLN x x x stopa WIBOR3M w ujęciu x 1999q4 (IO) 1999q4 (AO); 2003q1 (AO); okres wystąpienia i symbol rodzaju obserwacji nietypowej nominalnym 2005q2 (IO) Podrozdział 4.4 opisuje kryteria oceny stosowanych technik estymacji oraz wyniki badania. Przedstawiona w pracy analiza nie polega na porównaniu estymatorów pod względem standardowych własności takich jak: nieob6 ciążoność, efektywność, czy zgodność. W rezultacie dokonanego porównania zostało potwierdzone, że uwzględnienie wpływu obserwacji nietypowych prowadzi do bardziej dokładnych prognoz otrzymywanych na podstawie istniejącego modelu polskiej gospodarki stosowanego w Narodowym Banku Polskim. Spośród wielu dostępnych statystyk, na podstawie których możliwa jest ocena proponowanych metod, w pracy wybrałam trzy najczęściej stosowane: odchylenie standardowe składnika resztowego, błąd standardowy wektora estymatorów parametrów oraz pierwiastek z przeciętnego odchylenia kwadratowego oceniającego błąd prognozy wewnątrz próby. Poniżej przedstawiona została ocena proponowanych metod estymacji pod względem wybranych statystyk: • Średni spadek odchylenia standardowego reszt w stosunku do klasycznej metody najmniejszych kwadratów, dla metod: – eksperckiej: 6, 9% – zlinearyzowanej MNK: 9, 4% – ważonej MNK: 8, 5% • Średni spadek błędu standardowego wektora estymatorów parametrów w stosunku do klasycznej metody najmniejszych kwadratów, dla metod3 : – eksperckiej: 4, 7% (1/1) – zlinearyzowanej MNK: 4, 3% (4/3) – ważonej MNK: 6, 6% (3/0) • Średni spadek błędu prognozy (RMSE) w stosunku do klasycznej metody najmniejszych kwadratów, dla metod4 : – eksperckiej: 3% – zlinearyzowanej MNK: 2% – ważonej MNK: 2% Powyżej zaprezentowane wyniki badań wskazują na zasadność stosowania odpornych technik estymacji w procesie prognozowania gospodarczego. Celem dalszych moich badań będzie rozpatrzenie podobnych modeli dla innych krajów oraz innych klas modeli, aby uzyskane w pracy wnioski stały się jeszcze bardziej wiarygodne. Dodatkowo zamierzam jeszcze dokładniej przeanalizować własności statystyczne proponowanych estymatorów. W dodatku A zaprezentowane zostały dwa modele gospodarki polskiej. Pierwszy z nich to model ECMOD, stosowany przez Narodowy Bank Polski. Drugi, to polska adaptacja makroekonomicznego modelu typu HERMIN, stosowanego przez Ministerstwo Gospodarki. Z mojej wiedzy wynika, że w środowisku ekonomistów zajmujących się modelowaniem polskiej gospodarki modele te cieszą się uznaniem, ze względu na ich wysoki poziom. 3 Symbol (a/b) oznacza, że w a równaniach nastąpił spadek a w b wzrost błędu standardowego wektora estymatorów parametrów w stosunku do klasycznej metody najmniejszych kwadratów. 4 bez uwzględnienia prognozy stopy procentowej 7 Są one szeroko wykorzystywane w praktyce życia gospodarczego w Polsce. Dlatego ich opis został zawarty w pracy. Struktura rachunków narodowych została opisana w dodatku B. Natomiast dodatek C do rozprawy zawiera opis schematu Polskiej Klasyfikacji Działalności. Literatura [1] W. W. Charemza. Guesstimation. Journal of Forecasting, 21:417–433, 2002. [2] K. Lada. Prosty test pierwiastka jednostkowego odporny na obserwacje nietypowe. Przeglad , Statystyczny, 4:34–43, 2007. [3] K. Lada. Usuwanie trendu metoda, filtru Hodricka-Prescotta: konsekwencje dla metody najmniejszych kwadratów. Studia Ekonomiczne, 1-2/2007:113–121, 2007. [4] K. Lada. Wybrane metody modelowania makroekonometrycznego gospodarek przechodzacych transformacje, , , [w:] Dylematy teorii ekonomii w rzeczywistości gospodarczej XXI wieku. A. P. Balcerzak and D. Górecka, Wydawnictwo Adam Marszałek, 2007. [5] K. Lada. Wyrównywanie sezonowe szeregów czasowych zawierajacych obserwacje nietypowe. Wiadomości , Statystyczne, 10(557):33–42, 2007. [6] K. Lada. Hodrick-Prescott filter on nonstationary time series, [w:] Metody ilościowe w naukach ekonomicznych, s. 185–194. Aleksander Welfe, SGH, 2008. 8