Wykłady z Ekonometrii

Transkrypt

Wykłady z Ekonometrii
Wykłady z Ekonometrii
Dr Adam Kucharski
Spis treści
1 Ekonometria – pojęcia podstawowe
1.1 Idea modelu ekonometrycznego . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Równanie stochastyczne a deterministyczne . . . . . . . . . . . . . . . . . . . . .
1.3 Metoda Najmniejszych Kwadratów . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2
2
3
2 Model regresji liniowej
2.1 Schemat Gaussa-Markowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Klasyfikacja modeli ekonometrycznych . . . . . . . . . . . . . . . . . . . . . . . .
5
5
6
3 Statystyczna weryfikacja jakości modelu
3.1 Współczynnik determinacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Istotność oszacowań parametrów . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Autokorelacja składnika losowego . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
7
8
9
4 Weryfikacja merytoryczna
4.1 Interpretacja parametrów modelu . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Zmienne zero-jedynkowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
11
11
5 Modele ekonometryczne a prognozowanie
5.1 Prognozowanie na podstawie modelu jednorównaniowego . . . . . . . . . . . . . .
5.2 Modele trendu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
13
14
6 Przykład estymacji modelu jednorównaniowego
6.1 Sformułowanie problemu . . . . . . . . . . . . . .
6.2 Szacowanie parametrów modelu . . . . . . . . . .
6.3 Interpretacja otrzymanych wyników . . . . . . .
6.4 Ocena jakości otrzymanego modelu . . . . . . . .
6.5 Prognoza . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
15
15
16
17
20
7 Modele wielorównaniowe
7.1 Rodzaje modeli wielorównaniowych . . . . . . . . .
7.2 Identyfikacja . . . . . . . . . . . . . . . . . . . . .
7.3 Estymacja parametrów modeli wielorównaniowych
7.4 Przykład zastosowania Pośredniej MNK . . . . . .
7.5 Przykład zastosowania Podwójnej MNK . . . . . .
7.6 Analiza mnożnikowa . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
20
21
22
23
24
25
Wykłady z Ekonometrii
1
Opracował: dr Adam Kucharski
Ekonometria – pojęcia podstawowe
1.1
Idea modelu ekonometrycznego
Model stanowi uproszczony sposób opisywania skomplikowanych zjawisk. Odwzorowuje te elementy, które są ważne z punktu widzenia prowadzonej analizy. Pomija się te, które wydają się
nieistotne. Ma to swoje zalety, ale również wady. Oznacza bowiem konieczność przyjmowania
odnośnie badanych zjawisk silnych założeń, których spełnienie bywa utrudnione.
Punktem wyjścia modeli ekonomicznych są istniejące teorie ekonomiczne, często skomplikowane lub wręcz abstrakcyjne. Należy pamiętać, że same teorie podlegają zmianom w czasie (np
z powodu politycznego i społecznego zaangażowania samych ekonomistów) co rzutuje na samą
budowę modeli. „Techniczną” stroną tego procesu zajmuje się zaś ekonometria.
Ekonometria jako nauka wywodzi swoje korzenie z ekonomii matematycznej oraz statystyki
matematycznej – przede wszystkim ze zjawiska korelacji zmiennych. Model ekonometryczny
to równanie lub układ równań (wraz z towarzyszącymi założeniami) opisujące związki między
wybranymi zmiennymi. Cele, dla których sięga się po modele ekonometryczne dadzą się streścić
następująco:
1. poznanie zachowań i zależności łączących podmioty ekonomiczne oraz poznanie funkcjonowania układów gospodarczych;
2. porządkowanie informacji statystycznych pozwalające wyodrębnić trendy, wahania sezonowe i losowe;
3. testowanie hipotez ekonomicznych;
4. prognozowanie zjawisk ekonomicznych i przeprowadzanie analiz polityk gospodarczych;
Modele ekonometryczne zazwyczaj bazują na danych statystycznych, często zagregowanych,
zniekształconych przez błędy obserwacji. Dane te nie pochodzą z kontrolowanych eksperymentów.1 Ewentualne ich poprawienie nie jest możliwe, a stanowią jedyną dostępną rejestrację statystyczną zachowania się zjawisk lub podmiotów ekonomicznych. Dlatego musimy przyjmować
założenia, z których części nie da się nawet zweryfikować. Dane statystyczne mają zazwyczaj
postać szeregów należących do jednej z poniższych kategorii (najczęściej spotyka się pierwsze z
nich):
1. szeregi czasowe;
2. szeregi przekrojowe;
3. szeregi przekrojowo-czasowe;
1.2
Równanie stochastyczne a deterministyczne
Wykorzystanie danych statystycznych, zebranych jako obserwacje dokonane na konkretnych
obiektach powoduje, że przykładowa zależność między dochodem (Y) a konsumpcją (C) dla
kolejnych obserwacji może wyglądać jak na rysunku 1.
Na podstawie wykresu widać, że do jego opisu nie da się użyć żadnej elementarnej i deterministycznej funkcji matematycznej, choć chmura punktów wskazuje na istnienie zależności o
charakterze liniowym. Zachowanie się obu przedstawionych wielkości ekonomicznych względem
siebie wymaga wprowadzenia pewnej dodatkowej zmiennej, wyjaśniającej odchylenia punktów
1
Jak to jest możliwe w naukach eksperymentalnych takich jak fizyka czy chemia.
2 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
C 6
•
•
•
•
•
•
•
•
••
•
•
•
•
•
- Y
Rysunek 1: Przykładowa zależność między konsumpcją a dochodem
odpowiadających obserwacjom od funkcji liniowej. Dlatego równanie opisujące zależność między
konsumpcją a dochodem zapiszemy następująco:
Ci = α0 + α1 Yi + εi
(1)
Indeks i oznacza, że konsumpcja i dochód mają postać szeregów statystycznych. Symbol εi
nazywamy składnikiem losowym równania. Wprowadzenie go dało możliwość sięgnięcia po
prostą funkcję liniową, jako sposób opisania zależności między badanymi zmiennymi. Równanie,
w którym wprowadzono składnik losowy nazywamy stochastycznym. Przyczyny uwzględniania
składnika losowego w modelach ekonometrycznych są następujące:
1. indeterminizm zachowania się zjawisk (lub podmiotów) ekonomicznych;
2. niedoskonałości pomiaru, które zawierają się w εi ;
3. wady w konstrukcji modelu np błędy w specyfikacji czy niepoprawna postać funkcyjna;
1.3
Metoda Najmniejszych Kwadratów
Choć postać równania (1) jest poprawna, nie znamy jego parametrów. Każda z trzech zaprezentowanych na kolejnym wykresie funkcji jest liniowa i teoretycznie nadaje się do opisu zależności
między konsumpcją a dochodem. Należy znaleźć te parametry, które dadzą najbardziej satysfakcjonującą postać funkcji z punktu widzenia pewnego przyjętego kryterium. Ekonometria zajmuje
się głównie poszukiwaniem parametrów opisujących wpływ jednych zmiennych na inne.
Analizując rysunek 2 nasuwa się stwierdzenie, że najlepszą będzie funkcja przebiegająca jednocześnie „najbliżej” wszystkich punktów. Wydaje się, że jest to funkcja numer 2, ale powstaje
pytanie: jak zyskać pewność co do dokonanego wyboru? Należy zbadać odległości dzielące rzeczywiste punkty od naszej hipotetycznej prostej i wybrać wariant o najmniejszych zmierzonych
w ten sposób błędach. Minimalizuje się więc pewną funkcję kary, która przyjmuje wartości tym
większe im wspomniana odległość jest większa. Ponieważ jednak punkty leżą tak nad jak i pod
prostą, więc nie można użyć prostej sumy popełnianych błędów gdyż wartości dodatnie będą
znosić się z ujemnymi.
Spośród różnych dostępnych wariantów, niewątpliwie najpopularniejszą jest minimalizacja
sumy kwadratów odległości punktów od prostej. Stąd też wzięła się jej nazwa – Metoda Najmniejszych Kwadratów (MNK). Używając tej metody możliwa jest estymacja parametrów modelu stochastycznego. Nie wchodząc w matematyczne szczegóły dotyczące wyprowadzenia, wzór
3 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
(1)
C 6
•
•
(2)
•
(3)
•
• • • •
••
• •
•
•
•
- Y
Rysunek 2: Możliwe funkcje liniowe dla analizowanego przypadku
pozwalający otrzymać oszacowania parametrów równania przy pomocy MNK jest następujący:
α̂ = (XT X)−1 XT y
(2)
gdzie:
α̂ – wektor oszacowań parametrów równania;
X – macierz obserwacji na zmiennych objaśniających;
y – wektor obserwacji na zmiennej objaśnianej;
Wektor α̂ zawiera liczbowe wartości oszacowanych parametrów, które wskażą najkorzystniejszą dla danych obserwacji postać funkcji.
Estymacja to jednak tylko jeden (i to wcale nie pierwszy) z etapów analizy ekonometrycznej. Badanie tego typu da się podzielić na następujące fazy:
1. Specyfikacja zmiennych i relacji modelu:
• określenie celu badania;
• wybór zmiennych
• wybór postaci analitycznej modelu na podstawie:
– teorii ekonomii;
– zebranych danych i posiadanego doświadczenia;
– związków korelacyjnych między zmiennymi;
2. Gromadzenie danych statystycznych;
3. Estymacja parametrów;
4. Weryfikacja modelu:
• statystyczna;
• merytoryczna;
5. Praktyczne wykorzystanie modelu:
• analiza zależności;
• wnioskowanie o przyszłości;
4 z 26
Wykłady z Ekonometrii
2
Opracował: dr Adam Kucharski
Model regresji liniowej
2.1
Schemat Gaussa-Markowa
Naturalną tendencją podczas budowy modeli jest dążenie do możliwie najprostszego sposobu
opisu zjawiska. Stąd wzięło się częste sięganie po liniową postać regresji jako najlepiej odpowiadającą temu założeniu. Okazuje się, że w sporej liczbie przypadków takie podejście zdaje egzamin. Aby jednak można było użyć MNK do estymacji parametrów modelu liniowego, konieczne
jest spełnienie określonych założeń zwanych założeniami schematu Gaussa-Markowa:
1. model jest niezmienniczy ze względu na obserwacje (parametry i postać funkcji nie ulegają
zmianie);
2. model jest liniowy względem parametrów2 ;
3. zmienne objaśniające są nielosowe, a ich wartości są ustalonymi liczbami rzeczywistymi;
4. składnik losowy ma rozkład normalny;
5. wartość oczekiwana składnika losowego jest równa 0 (zakłócenia mają tendencję do wzajemnego znoszenia się);
6. składnik losowy jest sferyczny – macierz wariancji-kowariancji D2 (εi ) jest diagonalna, o
takich samych elementach na przekątnej głównej3 ;
7. informacje zawarte w próbie są jedynymi, na podstawie których estymuje się parametry
modelu;
8. liczba obserwacji powinna być wyższa niż liczba szacowanych parametrów.
Część powyższych założeń dotyczy (wprowadzonego wcześniej) składnika losowego, który
stanowi abstrakcyjny sposób wyjaśniania takiego a nie innego zachowania się obserwacji. W
konsekwencji nie jesteśmy w stanie poznać składnika wprost, znamy za to jego przybliżenie –
resztę z modelu.
Równanie po oszacowaniu (dla przypadku jednej zmiennej objaśniającej) ma postać:
Ŷi = α̂0 + α̂1 Xi
(3)
Daszek nad parametrami oznacza, że są to już konkretne wartości, dlatego w równaniu (3)
nie występuje składnik losowy. Podstawiając do równania obserwacje jakimi dysponujemy dla
zmiennej X otrzymamy wartości Y wynikające z równania (czyli Ŷi ) zwane wartościami teoretycznymi zmiennej objaśnianej. Oczywiście nie będą one dokładnie odpowiadać rzeczywistym
realizacjom tej zmiennej, ponieważ większość punktów leży powyżej lub poniżej linii regresji.
Występującą w tej sytuacji różnicę:
ei = Yi − Ŷi
(4)
nazywamy resztą z modelu. Można więc (choć praktykuje się to rzadko) zapisać równanie (3)
jako:
Ŷi = α̂0 + α̂1 Xi + ei
(5)
Zapis podany w (5) pokazuje, że reszty z modelu (a jest ich tyle ile obserwacji) mogą być traktowane jako przybliżona realizacja składnika losowego. Tak więc nie znamy składnika losowego
jako takiego, znamy natomiast reszty, które mają podobne własności.
2
Należy zauważyć, że model musi być liniowy względem parametrów, ale nie względem zmiennych. Dzięki temu
używa się modeli nieliniowych sprowadzanych przy pomocy stosownych przekształceń do postaci liniowej.
3
Mówimy, że składnik losowy jest homoskedastyczny i nieskorelowany
5 z 26
Wykłady z Ekonometrii
2.2
Opracował: dr Adam Kucharski
Klasyfikacja modeli ekonometrycznych
Same modele mogą być klasyfikowane według różnych kryteriów. Wymieńmy te najpowszechniej
spotykane:
1. Ze względu na formę związku między zmiennymi:
(a) liniowe;
(b) nieliniowe;
2. Ze względu na ilość zależności:
(a) jednorównaniowe;
(b) wielorównaniowe;
3. Ze względu na dynamikę:
(a) statyczne;
(b) dynamiczne (w tym autoregresyjne);
4. Ze względu na wartości poznawcze:
(a) przyczynowo-skutkowe;
(b) tendencji rozwojowej;
5. Ze względu na zakres badania:
(a) mikroekonomiczne;
(b) makroekonomiczne;
Nas najbardziej interesować będzie pierwsze kryterium. Przypomnijmy, że jedno z założeń
schematu Gaussa-Markowa wymaga, aby równanie było liniowe względem parametrów. Dlatego
do poniższego modelu:
Yi = eα0 Xiα1 eεi
(6)
nie można zastosować metody najmniejszych kwadratów. Zlogarytmujmy jednak (6) stronami:
ln Yi = α0 + α1 ln Xi + εi
(7)
Otrzymaliśmy równanie nieliniowe nadal względem zmiennych, ale za to liniowe względem
parametrów co było naszym celem. Sprowadzanie równań nieliniowych do postaci liniowej jest
często spotykaną praktyką ponieważ pozwala skorzystać z dobrodziejstw MNK. Oczywiście sama
sposób sprowadzania różni się w zależności od postaci funkcyjnej modelu.
3
Statystyczna weryfikacja jakości modelu
Fakt, że po użyciu MNK otrzymaliśmy estymatory parametrów modelu nie oznacza jeszcze,
że można spocząć na laurach. Otrzymane wyniki muszą zostać sprawdzone pod kątem jakości. Dokonuje się tego na dwóch poziomach: statystycznym i merytorycznym. Na początek
zajmijmy się weryfikacją statystyczną.
6 z 26
Wykłady z Ekonometrii
3.1
Opracował: dr Adam Kucharski
Współczynnik determinacji
Znając reszty z modelu można spróbować sobie odpowiedzieć czy zachowanie się zmiennych objaśniających dobrze odwzorowuje zachowanie zmiennej objaśnianej. Oczywiście można to zrobić,
analizując każdą resztę z osobna4 . Jednak jakiekolwiek wnioski jesteśmy w stanie wyciągnąć tylko dla szeregów o niewielkiej liczbie obserwacji, kiedy nie przytłacza nas duża ilość danych. W
pozostałych przypadkach konieczne staje się sięgnięcie po miary uśrednione.
Da się wykazać, że między wartościami empirycznymi, teoretycznymi a resztami zachodzi
związek:
X
X
X
(Yi − Ȳ )2 =
(Ŷi − Ȳ )2 +
e2i
(8)
i
i
i
co można zapisać:
SST = SSR + SSE
(9)
gdzie:
SST – zmienność całkowita (suma kwadratów odchyleń wartości empirycznych od średniej arytmetycznej Y);
SSR – zmienność objaśniona (suma kwadratów odchyleń wartości teoretycznych od średniej
arytmetycznej Y);
SSE – zmienność nieobjaśniona.
Dzieląc (9) stronami przez SST otrzymamy:
1=
SSR SSE
+
SST
SST
(10)
SSR
występujący w (10) nosi nazwę współczynnika determinacji i oznaczamy go
SST
2
symbolem: R . Jest to syntetyczna miara opisująca dopasowanie wartości teoretycznych do rzeczywistych. Przyjmuje wartości z przedziału h0, 1i5 . Im bliżej 1 (100%) tym lepsze dopasowanie
modelu do danych, a więc oszacowania są lepszej jakości. Dla R2 = 1 wszystkie punkty empiryczne należą do linii regresji (zaś wszystkie reszty są równe 0).
Tylko na pierwszy rzut oka wiadomo co to jest wysokie R2 , choć dążenie do jak najwyższych
jego wartości jest zupełnie zrozumiałe. Interpretacja współczynnika determinacji jest możliwa,
kiedy zachodzą następujące warunki:
Element
1. relacja między zmiennymi musi być liniowa;
2. parametry muszą być szacowane przy pomocy MNK, gdyż inaczej współczynnik może
przyjmować dowolne wartości;
3. model musi zawierać wyraz wolny, w przeciwnym razie zachodzi: R2 ∈ (−∞, 1i
W modelach o więcej niż jednej zmiennej objaśniającej R2 rośnie ze wzrostem liczby szacowanych parametrów. Aby uniknąć tej wady oblicza się skorygowany współczynnik determinacji:
R̄2 = 1 − (1 − R2 )
n−1
n−k
(11)
Różnica między R2 a R̄2 rośnie ze wzrostem liczby zmiennych objaśniających. Skorygowany
współczynnik determinacji ma następujące własności:
1. Jeżeli R2 = 1 wówczas R̄2 = 1.
4
5
Pamiętając, że różnice między wartościami: rzeczywistą i teoretyczną powinny być jak najmniejsze.
Często praktykuje się podawanie wartości R2 w procentach.
7 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
2. R̄2 może przyjmować wartości ujemne.
Poniższe rysunki prezentują wartości współczynnika determinacji w zależności od zachowania
się relacji między zmienną objaśniającą a objaśnianą przy założeniu, że użyto liniowej funkcji
regresji.
Y 6
Y 6
Y 6
•
•
•
•
•
•
•
•
•
•
• •
•
•
•
•
•
•
•
•
•
•
-X
Rysunek 3: R2 ≈ 1
-X
Rysunek 4: R2 ≈ 0
-X
Rysunek 5: R2 ≈ 0
Przypadki zaprezentowane na rysunkach (4) oraz (5) mimo podobnej wartości współczynnika
determinacji różnią się dość znacznie. W pierwszej sytuacji nie ma praktycznie żadnej zależności
między zmiennymi, w drugiej zaś występuje ona, lecz ma charakter nieliniowy (w tym wypadku
opisany parabolą).
3.2
Istotność oszacowań parametrów
Współczynnik determinacji jest komfortową w zastosowaniu miarą ponieważ odnosi się do całego
równania i ma wygodną interpretację. Z uwagi jednak na obarczenie pewnymi wadami, weryfikację statystyczną należy wzbogacić o inne elementy. Wiemy, że parametry modelu pokazują
wpływ jaki wywiera jedna zmienna na inną. Można więc sprawdzić, czy związki zachodzące w
równaniu są rzeczywiście istotne.
Jeżeli zmienne: objaśniania i objaśniająca nie są ze sobą powiązane wówczas, biorąc pod
uwagę założenia schematu Gaussa-Markowa, odpowiedni parametr powinien być równy zero6 .
Skonstruujmy w tej sytuacji następujący zespół hipotez statystycznych dotyczących dowolnego
z parametrów:
H0 : αi = 0
H1 : αi 6= 0
Tworzą one podstawę tzw. testu istotności t-Studenta należącego do grupy metod weryfikacji statystycznej. Sprawdzaniem powyższego zespołu hipotez jest statystyka:
tα i =
α̂i
σα̂i
(12)
gdzie:
σα̂i – średni błąd estymatora.
Statystyka dana wzorem (12) ma rozkład t-Studenta o n-k stopniach swobody. Z uwagi
na konstrukcję hipotezy alternatywnej, w teście tym występuje obustronny obszar odrzucenia
rozpatrywany względem odczytanej z tablic wartości krytycznej. Interpretacja wyników jest
następująca:
6
Z uwagi na obecność składnika losowego, praktycznie nie zdarza się sytuacja, w której parametr jest równy
zero.
8 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
1. Jeżeli |tαi | > tkryt wówczas (przy przyjętym z góry poziomie istotności) odrzucamy H0 na
korzyść H1 . Zmienna objaśniająca w istotny sposób wpływa na zmienną objaśnianą.
2. Jeżeli |tαi | < tkryt wówczas (przy przyjętym z góry poziomie istotności) nie mamy podstaw
do odrzucenia hipotezy zerowej, a więc uznajemy dany parametr za nieistotny statystycznie.
Konsekwencje braku istotności są bardzo poważne. Oznaczają bowiem, że umieszczona w
równaniu zmienna objaśniająca znalazła się tam niepotrzebnie. W takiej sytuacji należy ją usunąć i dokonać reestymacji równania.
3.3
Autokorelacja składnika losowego
Z autokorelacją mamy do czynienia, kiedy składniki losowe dotyczące różnych obserwacji są ze
sobą skorelowane. Z taką sytuacją spotykamy się najczęściej w przypadku szeregów czasowych.
Przyczyny występowania autokorelacji są różne:
1. natura procesów gospodarczych np serie klęsk trwające przez wiele okresów;
2. wpływ zdarzeń najbliższej przeszłości na podejmowane decyzje;
3. niepoprawna postać funkcyjna modelu np nie uwzględnienie cyklu gospodarczego;
4. wadliwa struktura dynamiczna modelu: brak opóźnionych zmiennych w charakterze zmiennych objaśniających;
5. pominięcie ważnej zmiennej objaśniającej.
Najpoważniejszą konsekwencją występowania autokorelacji jest obciążenie estymatora wariancji składnika losowego. Kierunek obciążenia bywa różny. Dla autokorelacji dodatniej wariancja ta jest niedoszacowana co prowadzi do pozornie większej dokładności ocen parametrów. W
konsekwencji otrzymujemy zawyżone statystyki t-Studenta.
Najczęściej zakłada się występowanie schematu autoregresyjnego pierwszego rzędu (tzw schemat AR(1)), w którym występuje powiązanie między składnikami losowymi z sąsiednich okresów:
εt = ρεt−1 + ηt
(13)
gdzie:
ρ – współczynnik autokorelacji;
ηt ∼ N (0, ση )
Szczególną własnością zjawisk ekonomicznych jest to, że pozostają one ze sobą zawsze w
jakimś związku. Z tego powodu autokorelacja, choć niepożądana, jest właściwie nie do uniknięcia.
Nasze działania zmierzają więc po pierwsze do określenia siły autokorelacji, a następnie do
podjęcia decyzji odnośnie przeciwdziałania jej skutkom.
Najprościej byłoby policzyć współczynnik autokorelacji, lecz należy pamiętać, iż nie znamy
wprost składnika losowego. Z tego powodu po raz kolejny wykorzystamy jego przybliżenie czyli
reszty z modelu. Niestety oznacza to, że możemy poznać jedynie estymator wartości ρ. Istnieje
kilka sposobów na obliczenie ρ̂:
n
X
et et−1
ρ̂1 =
t=2
n
X
t=1
9 z 26
(14)
e2t
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Ponieważ w (14) tracimy w liczniku jeden stopień swobody, można estymator ρ̂ policzyć
inaczej:
n−k
ρ̂2 =
ρ̂1
(15)
n−1
Najczęściej jednak dla schematu AR(1) wykonuje się test Durbina-Watsona. Zakłada się w
nim następujący zespół hipotez:
H0 : ρ = 0
H1 : ρ > 0
lub ρ < 0
Sprawdzianem testu jest statystyka:
n
X
d=
(et − et−1 )2
t=2
n
X
(16)
e2t
t=1
Jej wartości należą do przedziału h0, 4i. Z tablic odczytujemy dwie wartości krytyczne: dolną
dL i górną dU . Interpretacja wyników testu znalazła się w tabeli:
Tabela 1: Weryfikacja testu Durbina-Watsona
Kierunek autokorelacji
ρ̂ > 0
ρ̂ < 0
d ∈ hdU , 2i
d ∈ h2, 4 − dU i
d ∈ hdL , dU i
d ∈ h4 − dU , 4 − dL i
d ∈ h0, dL i
d ∈ h4 − dL , 4i
Decyzja
przyjąć H0
brak rozstrzygnięcia
odrzucić H0
Aby dało się zastosować test Durbina-Watsona muszą zachodzić następujące warunki:
1. w równaniu powinien występować wyraz wolny;
2. należy dysponować co najmniej 15 obserwacjami;
3. w modelu nie powinna występować opóźniona zmienna objaśniana w charakterze zmiennej
objaśniającej.
W wypadku kiedy ostatnie z założeń nie jest spełnione można sięgnąć po statystykę:
r
d
n
h= 1−
2
1 − nσ̂Y2
(17)
gdzie:
σ̂Y2 – estymator wariancji parametru przy opóźnionej zmiennej objaśnianej.
Statystyka h ma rozkład asymptotycznie normalny o wartości oczekiwanej równej 0 i odchyleniu standardowym równym 1.
Jeżeli test potwierdzi występowanie statystycznie istotnej autokorelacji w modelu należy
podjąć działania zmierzające do wyeliminowania jej skutków. Stosuje się jedno z poniższych
rozwiązań:
1. respecyfikacja modelu;
10 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
2. użycie innych niż klasyczna MNK metod estymacji np uogólnionej metody najmniejszych
kwadratów (UMNK);
3. wprowadzenie opóźnionych zmiennych.
4
Weryfikacja merytoryczna
4.1
Interpretacja parametrów modelu
Jeżeli współczynnik R2 oraz statystyki t-Studenta mają zadowalające wartości, wówczas można
przejść od weryfikacji statystycznej do merytorycznej. Ma ona na celu sprawdzenie zgodności
otrzymanych wyników z poczynionymi wcześniej założeniami. Podczas weryfikacji merytorycznej
wyodrębnimy dwa etapy:
1. określenie poprawności znaków przy parametrach;
2. interpretacja wartości oszacowanych parametrów.
W obu przypadkach pomoc może stanowić teoria ekonomii. Często (choć nie zawsze) z góry znamy znak stojący przy relacjach między konkretnymi wartościami ekonomicznymi. Jako
przykład może posłużyć uzależnienie popytu na dobra podstawowe od dochodu czy ceny.
Nieco bardziej skomplikowana jest interpretacja oszacowanych parametrów. Nie zawsze bowiem znamy rząd wielkości odpowiadający sile wpływu zmiennej objaśniającej na objaśnianą.
Spotyka się tu raczej wskazówki (np elastyczność względem zmiennej powinna być mniejsza od
1) niż konkretne, sztywne zasady. Dodatkowo sprawę komplikuje fakt, że inaczej interpretuje się
parametry w równaniu liniowym niż w którymkolwiek z nieliniowych.
Osobnego zwrócenia uwagi wymaga wyraz wolny. Z jednej strony jego obecność jest wymagana np ze względu na własności współczynnika determinacji. Z drugiej nie zawsze ma on sens
merytoryczny, jak dzieje się na przykład w przypadku zlinearyzowanych modeli nieliniowych.
4.2
Zmienne zero-jedynkowe
Jeśli chodzi zarówno o weryfikację merytoryczną jak i statystyczną problem może stanowić niekiedy samo zachowanie się danych. Przyjrzyjmy się sytuacji przedstawionej na rysunku 6.
Y 6
•
•
•
•
•
•
•
-X
Rysunek 6: Nietypowe zachowanie danych
Jedna z obserwacji przyjęła wartość nietypowo wysoką w porównaniu do pozostałych danych.
Zastosowanie MNK w tej sytuacji doprowadzi do modelu o bardzo niskim R2 a nawet do przyjęcia
hipotezy o braku istotności oszacowań. Z uwagi na skromną liczbę obserwacji nie jest możliwa
rezygnacja z części spośród nich, aby uniknąć wymienionych wad.
11 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Jeżeli spojrzeć na to szerzej, nie powinniśmy sprawiać wrażenia zaskoczonych. Zjawiska ekonomiczne podlegają w niektórych okresach (takich jak wojny czy gwałtowne recesje lub boom
gospodarczy) raptownym wahaniom. Przyjmują wtedy wartości skrajnie odbiegające od okresów, które w tej sytuacji można nazwać „normalnymi” lub typowymi. Wyróżnimy 3 grupy takich
nietypowych zachowań:
1. obserwacje nietypowe występujące w pojedynczych, nieregularnych okresach;
2. obserwacje nietypowe trwające przez kilka okresów z rzędu;
3. obserwacje nietypowe regularnie się powtarzające.
Zazwyczaj nie jesteśmy w stanie zrezygnować z danych dotyczących nietypowych okresów.
Ewentualne skrócenie próby ma daleko idące konsekwencje podczas estymacji. Z drugiej strony
brak kroków zaradczych oznacza modele o słabych własnościach statystycznych i merytorycznych. Jako wyjście proponuje się stosowanie zmiennych zero-jedynkowych. Zmienną taką
definiuje się następująco:
(
0, dla obserwacji typowych;
Ui =
(18)
1, dla obserwacji nietypowych.
Zmienne zero-jedynkowe tworzone są więc sztucznie, zgodnie z naszymi potrzebami7 . Wprowadza się je następnie do równania i szacuje parametry w tradycyjny sposób. W zależności od
użycia mogą one wywoływać zmianę któregoś z pozostałych parametrów w wybranych okresach.
Równanie (19) prezentuje korektę wyrazu wolnego:
Yi = α0 + αo∗ Ui + αi Xi + εi
(19)
Y 6
•
•
•
•
• •
•
-X
Rysunek 7: Zmienna zero-jedynkowa dla wyrazu wolnego
Niekiedy należy zmienić współczynnik kierunkowy równania:
Yi = α0 + (α1 + α1∗ Ui )Xi + εi
(20)
Sytuację z równania (20) ilustruje rysunek 8.
Możliwe jest również połączenie rozwiązań zaproponowanych w (19) oraz (20) dla jednego
modelu.
7
Należy jednak zachowywać umiar przy wprowadzaniu zmiennych zero-jedynkowych. Ich użycie musi być
odpowiednio umotywowane.
12 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Y 6
•
•
•
•
• •
•
-X
Rysunek 8: Zmienna zero-jedynkowa dla współczynnika kierunkowego
Oddzielnego omówienia wymaga wykorzystanie sezonowych zmiennych zero-jedynkowych. Ze
zjawiskiem sezonowości spotykamy się często korzystając z danych kwartalnych. Jest to sytuacja
regularnego powtarzania się obserwacji nietypowych8 . Zakładając, że mamy do czynienia właśnie
z sezonowością kwartalną proponuje się następujący sposób użycia zmiennych sztucznych:
Yt = α0 + α1 Xt + α2 U1t + α3 U2t + α4 U3t + εt
(21)
Równanie (21) stanowi rozszerzenie modelu z korektą wyrazu wolnego. Różnica polega na
tym, że w tym przypadku wyraz wolny jest korygowany w każdym kwartale przez inny parametr (przykładowo za sezonowość w pierwszym z nich odpowiada parametr przy U1t ). Powyższe
zmienne mierzą odchylenie sezonowe względem wybranego (w naszym przykładzie czwartego)
kwartału. Zachowanie się zmiennej Yt w czwartym kwartale oddaje wyraz wolny. Należy pamiętać, że w szeregach zmiennych tego typu wartość 1 regularnie się powtarza do końca okresu, z
którego pochodzą dane. Przykładowo dla równania (21) macierz X wyglądałaby następująco:


1 X1 1 0 0


1 X2 0 1 0




1 X3 0 0 1


1 X 0 0 0
4




1 X5 1 0 0


X=

1 X6 0 1 0


1 X7 0 0 1




1 X8 0 0 0


..
.. .. .. 
 ..
.
.
. . .


. . .
1 Xn .. .. ..
5
Modele ekonometryczne a prognozowanie
5.1
Prognozowanie na podstawie modelu jednorównaniowego
Aby wykonać prognozę na podstawie modelu ekonometrycznego, musi on charakteryzować się
dobrymi własnościami. Jego jakość ocenia się przy pomocy miar takich jak współczynnik determinacji czy istotność oszacowań. Równie ważna jest weryfikacja merytoryczna, czyli znaki a
8
Jako przykład może posłużyć wzrost spożycia napojów gazowanych w okresie letnim.
13 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
w przypadku modeli nieliniowych wartości elastyczności. Same prognozy mogą mieć charakter
punktowy (wynikiem jest konkretna wartość liczbowa) lub przedziałowy (otrzymujemy przedział,
który z określonym prawdopodobieństwem zawiera przyszłą realizację zmiennej prognozowanej).
Dodatkowo zakładamy, że relacje między zmiennymi pozostaną stałe w czasie. Oznacza to,
że postać funkcyjna modelu oraz wzajemne oddziaływanie zmiennych są stałe z okresem prognozy włącznie. To założenie (szczególnie w realiach ekonomicznych) jest bardzo silne. Podobne
założenia czynimy w przypadku omawianych poniżej modeli trendu.
Składnik losowy również pozostaje stały w czasie co oznacza, że nie powinny pojawić się nowe
zmienne wpływające na prognozowane zjawisko przy okazji zmieniając już ustalone relacje.
W okresie prognozowanym musimy znać wartości zmiennych objaśniających. Kiedy nie jest
możliwe, w sukurs przychodzą metody prognozowania szeregów czasowych. Można również konstruować dodatkowe równania, służące otrzymaniu przyszłych wartości pożądanych zmiennych.
Zazwyczaj takie postępowanie prowadzi do otrzymania układu powiązanych ze sobą równań.
Niekiedy zaś (w analizach określonych scenariuszy) zakłada się z góry wartości zmiennych egzogenicznych co upodabnia postępowanie do analizy mnożnikowej.
Prognozy na podstawie modeli ekonometrycznych, w których uwzględnia się fakt sezonowości zmiennych, zakładają istnienie sezonowości również w okresie prognozy. Sezonowość ta ma
zachowany dotychczasowy okres wahań.
5.2
Modele trendu
Niektóre zmienne mają skłonność do systematycznych zmian w czasie np. stale rosną lub maleją.
Mówimy, że zawierają trend i staramy się skonstruować możliwie najprostszą sztuczną zmienną
reprezentującą czas. Przy addytywnym wprowadzeniu składnika losowego otrzymujemy szczególny przypadek równania linii regresji. Potrzebujemy jedynie informacji o zmiennej objaśnianej,
nie zaś objaśniających co stanowi wielce korzystną okoliczność.
Postać modelu może być różna, a jej wybór zależy od przesłanek dotyczących mechanizmu
rozwojowego zmiennej. Przykłady postaci funkcji trendu:
• liniowa
yt = α + βt
Stały kierunek rozwoju zjawiska wyznacza współczynnik kierunkowy prostej. Wyraża on
stały przyrost wartości zmiennej prognozowanej.
• wykładnicza
yt = eα+βt ,
t
yt = αβ ,
β>0
β>1
W równaniu pierwszym β a w drugim ln β jest stopą wzrostu.
• wielomianowa
yt = α0 + α1 t + α2 t2
Kolejne trzy funkcje stosuje się w sytuacji, kiedy stwierdzamy występowanie zmniejszających się przyrostów np. dla względnego nasycenia rynku z powodu pojawiających się
produktów konkurencyjnych.
• logarytmiczna
yt = α + β ln t, β > 0
• potęgowa
yt = αtβ ,
14 z 26
0<β<1
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
• ilorazowa
yt =
αt
,
β+t
α, β > 0
W przypadku malejącego przyrostu ryzyko prognozowania jest mniejsze bo zmienne zachowują się dość stabilnie.
• logistyczna
α
,
1 + β exp−δt
yt =
α, δ > 0, β > 1
Funkcji logistycznej używamy kiedy zjawisko jest ograniczone do pewnej przestrzeni (np.
rozwój nowych gałęzi przemysłu). Najpierw następuje szybki wzrost, potem tempo maleje
do asymptoty wyznaczonej przez parametr alfa.
Określenie rodzaju trendu wymaga sporej ilości obserwacji. Postać funkcji dobiera się empirycznie, na podstawie analizy wykresu. Kiedy obserwacji nie ma zbyt wiele, do szeregu da
się dopasować więcej niż jedną funkcję. W takiej sytuacji wybieramy tę o najprostszej postaci
analitycznej.
Używając KMNK do szacowania parametrów trzeba pamiętać o sprowadzeniu równania do
postaci liniowej względem parametrów. Modele trendu mogą być (jak każde modele ekonometryczne) rozszerzane o zmienne zero-jedynkowe. Poniższy prosty przykład stanowi ilustrację
sposobu, w jaki wykonuje się prognozy w oparciu o model trendu.
Przykład prognoz dla funkcji ŷt = 2 + 3t w kilku wybranych okresach:
6
6.1
Okres (t)
Prognoza
1
2+3*1=5
3
2+3*3=11
10
2+3*10=32
12
2+3*12=38
Przykład estymacji modelu jednorównaniowego
Sformułowanie problemu
Należy oszacować parametry liniowego modelu jednorównaniowego opisującego popyt na pewne
dobro (Y) w zależności od dochodów (X). Równanie to ma postać:
Yt = α0 + α1 Xt + εt
(22)
Zbadać jego jakość przy pomocy współczynnika determinacji oraz testu istotności. Zebrane dane
na temat zmiennych: objaśnianej (Y) i objaśniającej (X) w kolejnych okresach (t) są następujące:
6.2
Yt
5
6
7
7
8
9
Xt
3
3
5
4
6
7
Szacowanie parametrów modelu
Dane do zadania można zapisać w postaci macierzowej. Ponieważ w modelu występuje wyraz
wolny (α0 ) więc pierwsza kolumna macierzy obserwacji na zmiennych objaśniających składać
15 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
się będzie z samych jedynek.






Y=




5





6 




7 

X = 

7 




8 

9
1 3


1 3 

1 5 


1 4 


1 6 
1 7
Powyższe dane zostaną wykorzystane do estymacji parametrów modelu przy pomocy metody
najmniejszych kwadratów. Wzór na estymator parametrów jest następujący:
α = (XT X)−1 XT y
(23)
Na początek wyznaczymy macierz XT X:



"
#
1 1 1 1 1 1 

XT X =

3 3 5 4 6 7 



1 3


1 3 
 "
#
1 5 
6 28

=
1 4 
28 144


1 6 
1 7
W następnym kroku należy macierz odwrócić. Skorzystamy w tym celu ze wzoru na odwracanie
macierzy dwa na dwa. Wyznacznik macierzy XT X jest równy 80 (6 ∗ 144 − 28 ∗ 28). Stąd macierz
odwrotna jest następująca:
# "
#
"
144 −28
1,8 −0,35
1
T
−1
=
(X X) =
80 −28
6
−0,35 0,075
Jako kolejny wyznaczymy wektor XT y:

"
XT y =


#
1 1 1 1 1 1 


3 3 5 4 6 7 



5


6 
 "
#
42
7 

=
7 
207


8 
9
Możemy teraz przystąpić do ostatniego kroku czyli szacowania parametrów. Podstawiamy do
wzoru (23):
"
#"
# "
#
1,8 −0,35
42
3,15
α=
=
−0,35 0,075
207
0,825
6.3
Interpretacja otrzymanych wyników
Otrzymaliśmy następujące równanie:
Ŷt = 3,15 + 0,825Xt
16 z 26
(24)
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Parametr α0 = 3,15 oznacza, że w przypadku braku dochodu popyt wynosi 3,15 jednostki. Jest
to tzw. popyt autonomiczny. Parametr α1 = 0,825 oznacza, że wzrost dochodów o jednostkę
pieniężną spowoduje wzrost popytu o 0,825 jednostki przy pozostałych warunkach niezmienionych.
W tym miejscu warto przyjrzeć się znakowi parametru przy zmiennej objaśniającej. Jest on
dodatni. Jako, że objaśniamy popyt przy pomocy wydatków, wydaje się logiczne oraz ekonomicznie uzasadnione, że ze wzrostem wydatków rośnie popyt na dane dobro. Taki właśnie znak
stoi przy Xt .
Mając oszacowane parametry można wyznaczyć teoretyczne wartości zmiennej objaśnianej. Podstawiamy dochód z kolejnych okresów do (24). W efekcie obliczone zostaną wartości
wynikające z równania linii regresji. Poniżej znajdują się przykładowe obliczenia dla pierwszych
trzech okresów.
ŷ1 = 3,15 + 0,825 ∗ 3 = 5,625
ŷ2 = 3,15 + 0,825 ∗ 3 = 5,625
ŷ3 = 3,15 + 0,825 ∗ 5 = 7,275
Jak widać wartości popytu wynikające z równania linii regresji różnią się od wartości rzeczywistych. Różnica:
et = yt − ŷt
(25)
nosi nazwę reszty z modelu. Poniżej znalazły się wszystkie wartości teoretyczne zmiennej objaśnianej oraz wszystkie reszty.
6.4
Yt
Ŷt
et
5
5,625
-0,625
6
5,625
0,375
7
7,275
-0,275
7
6,450
0,550
8
8,100
-0,100
9
8,925
0,075
Ocena jakości otrzymanego modelu
Współczynnik determinacji (oznaczany jako R2 ) służy do oceny dopasowania całego modelu
do danych rzeczywistych. Może więc być wyliczany bezpośrednio z reszt modelu lub na podstawie cząstkowych wyliczeń poczynionych jeszcze na etapie szacowania parametrów. W tym
drugim wypadku wykorzystuje się następujący wzór (z niego właśnie skorzystamy w niniejszym
przykładzie):
αT XT y − nȳ 2
R2 =
(26)
yT y − nȳ 2
Wyznaczymy kolejne składowe wzoru (26).
T
T
h
α X y = 3,15 0,825
i
"
17 z 26
42
207
#
= 303,075
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
 
5
 
6
 
7
h
i
X
 
2
T
yt = 5 6 7 7 8 9   = 304
y y=
7
t
 
 
8
9
Średnia arytmetyczna ze zmiennej objaśnianej (ȳ) wynosi 7, zaś liczba obserwacji (czyli n) równa
się 6. Podstawiamy do wzoru (26):
R2 =
303,075 − 6 ∗ 72
= 0,9075
304 − 6 ∗ 72
Interpretacja 1: Model objaśnia zachowanie się zmiennej objaśnianej w 90,75%.
Interpretacja 2: Zmienność zmiennej objaśnianej została wyjaśniona zmiennością zmiennych
objaśniających w 90,75%.
Wartość współczynnika determinacji rośnie ze wzrostem liczby zmiennych objaśniających, nie
można opierać się tylko i wyłącznie na nim. Z tego powodu analizę jakości oszacowań rozszerza
się o zbadanie własności pojedynczych estymatorów. Wykorzystamy do tego celu test istotności
t-Studenta. W teście tym występuje następujący zestaw hipotez:
H0 : αi = 0
H1 : αi 6= 0
Stawiamy więc hipotezę, że dany parametr jest równy zero (statystycznie nieistotny) wobec
hipotezy alternatywnej, która zakłada iż istotnie różni się on od zera. Sprawdzianem tego testu
jest statystyka:
α̂i
tαi =
(27)
σαi
σαi to odchylenie standardowe danego parametru.
Aby jednak skorzystać ze wzoru (27) należy najpierw wyznaczyć wariancję reszt. Wykorzystany zostanie następujący wzór (k – liczba szacowanych parametrów):
σe2 =
1
(yT y − αT XT y)
n−k
(28)
Po podstawieniu otrzymamy:
σe2 =
1
(304 − 303,075) = 0,23
6−2
Odchylenie standardowe parametru oblicza się mnożąc wariancję reszt przez odpowiedni element
przekątnej główne macierzy (XT X)−1 , po czym wyciąga się pierwiastek. Jako, że oszacowano
dwa parametry, potrzebne będą dwa odchylenia standardowe.
p
σα0 = 0,23 ∗ 1,8 = 0,643
p
σα1 = 0,23 ∗ 0,075 = 0,131
Na ich podstawie obliczamy wartości statystyk t-Studenta:
3,15
= 4,9
0,643
0,825
=
= 6,3
0,131
tα0 =
tα1
18 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Aby zweryfikować hipotezy o istotności każdego z parametrów, z tablic rozkładu t-Studenta
odczytujemy wartość krytyczną. Potrzebne do tego są dwa parametry: poziom istotności i liczba
stopni swobody. Poziom istotności przyjmiemy na poziomie 0,05 a liczba swobody to różnica
między liczbą obserwacji a liczbą szacowanych parametrów. W naszym przypadku wynosi ona
6 − 2 = 4. Wartość krytyczna odczytana z tablic wynosi 2,78. Porównujemy moduły statystyk
t-Studenta z wartością krytyczną:
|4,9| > 2,78
|6,3| > 2,78
W obu przypadkach moduły statystyk dla parametrów okazały się większe od wartości krytycznej. Oznacza to iż obie statystyki znalazły się w obszarze odrzucenia. Powiemy, że odrzucamy
hipotezę zerową na korzyść hipotezy alternatywnej, która mówi, że dany parametr istotnie różni
się od zera. Oznacza to na przykład, że Xt ma istotny wpływ na zachowanie się Yt .
1. Znaki przy parametrach są poprawne.
2. Wartość współczynnika determinacji wskazuje na wysoki poziom objaśnienia modelu.
3. Obydwa parametry okazały się istotne statystycznie.
Otrzymano więc wiarygodny model o dobrych własnościach statystycznych.
Badanie występowania autokorelacji zostanie przeprowadzone przy pomocy testu DurbinaWatsona. Sprawdza się w nim następujący zestaw hipotez:
H0 : ρ = 0
H1 : ρ 6= 0
Hipoteza zerowa zakłada brak autokorelacji i jest to sytuacja dla nas pożądana. W odróżnieniu,
przyjęcie hipotezy alternatywnej oznacza, że współczynnik korelacji jest istotnie różny od zera
i występuje autokorelacja składnika losowego.
Test Durbina-Watsona opiera się o wektor reszt z modelu. Na ich podstawie dokonuje się
najpierw obliczeń cząstkowych, które znalazły się w tabeli poniżej:
et
e2t
(et − et−1 ) (et − et−1 )2
−0,625
0,391
−
−
0,375
0,141
1,000
1,000
−0,275
0,076
−0,650
0,423
0,550
0,303
0,825
0,681
−0,100
0,010
−0.650
0,423
0,075
P
0,006
0,175
0,031
0,927
−
2,558
Teraz wystarczy tylko podstawić do wzoru i obliczyć wartość statystyki DW.
P
(et − et−1 )2
2,558
P 2
DW =
=
= 2,76
0,927
et
Wartość DW jest większa od dwóch więc sprowadzimy ją poniżej tej wartości:
DW ∗ = 4 − DW = 4 − 2,76 = 1,24
19 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Przed dokonaniem interpretacji należy wyznaczyć, na podstawie tablic statystycznych, wartości
krytyczne rozkładu Durbina-Watsona. Potrzebne do tego parametry to:
1. liczba obserwacji (u nas n=6)
2. liczba szacowanych parametrów (u nas k=2)
UWAGA! Tablice konstruowane są od 15 obserwacji więc, z formalnego punktu widzenia, nie
możemy wykorzystać tego testu. Zrobimy to jednak, lecz wyłącznie w celu zapoznania się z
weryfikacją tego typu hipotez.
Przyjmijmy zatem, że dL = 0,98 a dU = 1,57. W takiej sytuacji wartość statystyki równa 1,24
znalazła się w obszarze niekonkluzywności testu (bo 0,98 < 1,24 < 1,57). Nie możemy stwierdzić, czy w modelu występuje autokorelacja czy nie. Gdyby statystyka obliczona na podstawie
reszt okazała się wyższa od dU wtedy stwierdzilibyśmy brak autokorelacji składnika losowego.
Statystyka DW mniejsza od dL oznacza występowanie autokorelacji składnika losowego.
6.5
Prognoza
Załóżmy teraz, że chcemy wykonać prognozę punktową na kolejne dwa okresy, czyli siódmy i
ósmy. Potrzebujemy do tego celu wartości dochodów w tych okresach. Niech będą dane9 : X7∗ = 9
a X8∗ = 12. Prognozy popytu we wspomnianych okresach wyglądają następująco:
Y7∗ = 3,15 + 0,825 × 9 = 10,575
Y8∗ = 3,15 + 0,825 × 12 = 13,05
Zwróćmy uwagę na to, że parametry i postać równania w okresach prognozowanych nie uległy
zmianie. Nie rozstrzygaliśmy również, skąd pochodzą wartości zmiennej objaśniającej w okresach
siódmym i ósmym, gdyż nie stanowi to przedmiotu zainteresowania naszego przykładu.
7
Modele wielorównaniowe
7.1
Rodzaje modeli wielorównaniowych
Istnieje stosunkowo niewielka grupa zjawisk (szczególnie ekonomicznych), które da się opisać w
całości przy pomocy pojedynczego równania regresji. Zazwyczaj opisuje ono zbyt mały wycinek
rzeczywistości zaś między zmiennymi tworzącymi takie równanie mogą zachodzić dodatkowe
związki, często jednoczesne. Z tego powodu sięga się po modele wielorównaniowe. Rozważmy
następujący układ równań:
y1t = α11 y2t + β10 + β11 x1t + ε1t
y2t = α21 y1t + β20 + β21 x1t + ε2t
y3t = α31 y2t + β30 + β31 x2t + ε3t
Powyższy zapis, analogiczny do tego występującego w modelach jednorównaniowych zastępuje
się często następującym:
y1t + α11 y2t + β10 + β11 x1t = ε1t
y2t + α21 y1t + β20 + β21 x1t = ε2t
y3t + α31 y2t + β30 + β31 x2t = ε3t
9
„Gwiazdka” oznacza, że mamy do czynienia z prognozą.
20 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
W modelach wielorównaniowych zmienne objaśniane w jednym równaniu mogą być zmiennymi objaśniającymi w innym. Oprócz tego występują tam także równania pozbawione składnika
losowego tzw. tożsamości. Z tego powodu konieczna staje się zmiana używanej dotychczas nomenklatury zmiennych. Wyodrębnimy następujące rodzaje zmiennych:
endogeniczne są one przez model objaśniane i wchodzą w interakcje z innymi zmiennymi;
egzogeniczne pochodzą spoza systemu. Nie są opisywane przez model, choć wpływają na
zmienne endogeniczne;
z góry ustalone tworzą je zmienne, których wartości nie są wyznaczone przez model. Chodzi
tu o zmienne egzogeniczne i endogeniczne opóźnione.
Z uwagi na to, że rozpatrywane modele mają często duże rozmiary (liczące sobie setki bądź
nawet tysiące równań) przyjęło się wykorzystywać do analiz zapis macierzowy. Ponieważ poruszać się będziemy w ramach modeli liniowych, w których opóźnienia zmiennych sięgają najdalej
jeden okres wstecz możemy zapisać:
AY + A1 Y1 + BX = E
W stosunku do modeli wielorównaniowych czyni się założenia podobnie jak w przypadku
wariantu jednorównaniowego. Składniki losowe dla poszczególnych równań powinny mieć wartość oczekiwaną równą zero oraz stałą wariancję. Nie powinna występować korelacja między
składnikami z różnych okresów. Nie można jednak wykluczyć skorelowania składników losowych
z tego samego okresu lecz z różnych równań.
Innym założeniem, tym razem charakterystycznym dla modelu wielorównaniowego jest założenie o kompletności układu. Uznajemy je za spełnione jeżeli macierz parametrów stojących
przy zmiennych endogenicznych jest nieosobliwa. Stanie się tak w sytuacji kiedy model liczy tyle
równań ile występuje w nim zmiennych endogenicznych.
Modele wielorównaniowe mogą być dzielone wg różnych kryteriów. Przykładowo na statyczne i dynamiczne czy liniowe i nieliniowe. Nas jednak najbardziej interesuje podział modeli na
klasy różniące się rodzajem powiązań między zmiennymi endogenicznymi z różnych równań.
Wyróżnimy więc modele:
proste brak powiązań jednoczesnych między zmiennymi endogenicznymi, co pozwala traktować
każde równanie oddzielnie. Macierz A jest diagonalna;
rekurencyjne zależności między zmiennymi endogenicznymi mają charakter sprzężeń jednokierunkowych. Równania można tak uporządkować, że macierz A będzie trójkątna;
współzależne zależności między zmiennymi endogenicznymi mają charakter sprzężeń zwrotnych. Macierzy współczynników nie da się uporządkować w żaden szczególny sposób.
Duże modele mogą mieć charakter modeli blokowo-rekurencyjnych. Zawierają one fragmenty
rekurencyjne i współzależne.
7.2
Identyfikacja
W ekonometrii zidentyfikować równa się stwierdzić, że parametr modelu jest tożsamy z parametrem teorii opisującej działanie systemu. Badanie identyfikacji powinno poprzedzać estymację z
uwagi na warunek zgodności estymatorów.
Rozważmy następujący model:
y1t = a11 y2t + b12 x1t + ε1t
(29)
y1t = a21 y2t + ε2t
(30)
21 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Po dodaniu stronami i podzieleniu przez 2 otrzymamy:
1
1
1
y1t = (a11 + a21 )y2t + b12 x1t + (ε1t + ε2t )
2
2
2
(31)
Otrzymane równanie jest stochastycznie nie do odróżnienia od równania (29). Po oszacowaniu
nie da się powiedzieć czy otrzymano ocenę a11 czy 1/2(a11 + a21 ). Szacujemy bowiem postać:
y1t = β1 y2t + β2 x1t + νt
(32)
y1t = γ1 y2t + ξt
(33)
Równanie (30) różni się od (31) więc wiadomo, że γ1 to a21 . Dlatego możemy powiedzieć, że
zidentyfikowaliśmy parametr a21 . Równanie (29) jest nieidentyfikowalne a (30) identyfikowalne.
Model uznajemy za identyfikowalny kiedy wszystkie jego równania są identyfikowalne, a
pojedyncze równanie jest identyfikowalne gdy jego parametry są identyfikowalne. Oznaczmy
przez M+ liczbę zmiennych endogenicznych występujących w równaniu z parametrem różnym
od zera, zaś przez K− liczbę zmiennych z góry ustalonych w równaniu z parametrem równym
zero. Na tej podstawie określimy kryterium identyfikowalności:
• równanie jest jednoznacznie identyfikowalne gdy wykluczono z niego tyle zmiennych z góry
ustalonych ile pozostawiono w nim objaśniających zmiennych endogenicznych (nie licząc
zmiennej objaśnianej). Zachodzi wtedy: M+ − 1 = K− ;
• równanie jest niejednoznacznie (nadmiernie) identyfikowalne gdy wykluczono z niego więcej
zmiennych z góry ustalonych niż pozostawiono endogenicznych zmiennych objaśniających.
Zachodzi wtedy: M+ − 1 < K− ;
• równanie jest nieidentyfikowalne gdy wykluczono z niego mniej zmiennych z góry ustalonych niż pozostawiono endogenicznych zmiennych objaśniających. (M+ − 1 > K− );
7.3
Estymacja parametrów modeli wielorównaniowych
Model przedstawiony w taki sposób, aby dokładnie odzwierciedlać stosowny fragment teorii
zapisywany jest w postaci strukturalnej, czyli:
AY + A1 Y1 + BX = E
Jeżeli jednak dokonamy następujących przekształceń:
AY = −A1 Y1 + −BX + E
Y = −A−1 A1 Y1 + −A−1 BX + A−1 E
Otrzymamy postać zredukowaną. Po stronie zmiennych objaśniających występują w niej tylko
zmienne z góry ustalone. Przyjmijmy oznaczenia:
D0 = −A−1 B
D1 = −A−1 A1
V = A−1 E
Po podstawieniu otrzymamy:
Y = D1 Y1 + D0 X + V
Modele wielorównaniowe, ze względu na swoją specyfikę wymagają przeważnie szczególnych
metod estymacji. Podstawowym kryterium jest tutaj klasa modelu. Jeżeli w modelu prostym
22 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
MNK-estymator jest zgodny wtedy można szacować parametry każdego równania oddzielnie,
w dowolnej kolejności. W modelu prostym każde równanie może być traktowane oddzielnie
ponieważ między zmiennymi endogenicznymi nie występują żadne związki. Należy pamiętać, że
zmienne egzogeniczne nie są związane z żadnym konkretnym równaniem i mogą występować
jednocześnie w kilku spośród równań tworzących model. Zresztą ta zasada dotyczy wszystkich
wersji modeli wielorównaniowych.
W przypadku modelu rekurencyjnego również da się szacować równanie po równaniu tyle,
że kolejność estymacji narzucają nam związki między zmiennymi endogenicznymi. W pewnych
szczególnych przypadkach trzeba użyć jednak 2MNK.
W przypadku modeli współzależnych problem stanowią jednoczesne sprzężenia między zmiennymi endogenicznymi z poszczególnych równań. Ogólnie spotykane tutaj estymatory dadzą się
podzielić na:
równaniowe szacuje się w nich parametry kolejnych równań bez wykorzystywania informacji
o tym jak wyglądają pozostałe równania, w szczególności tożsamości (do tej kategorii
zaliczyć można m.in. PMNK i 2MNK);
systemowe szacują model jako całość, uwzględniając postać równań oraz ograniczenia narzucone na parametry (zaliczymy tu 3MNK);
Estymatory systemowe mają sporo zalet, ale mają też wady:
1. ewentualne błędy w pojedynczym równaniu przerzucają się na pozostałe równania;
2. liczba obserwacji nie może być mniejsza od liczby parametrów całego modelu co wyklucza
te metody z zastosowania do modeli o dużych rozmiarach;
Ze względu na powyższe najczęściej używa się 2MNK i KMNK ponieważ nie udało się udowodnić, że dają one prognozy gorszej jakości od metod bardziej wyrafinowanych. Poniżej omówione zostaną dwie z metod estymacji modeli współzależnych: pośrednia i podwójna MNK.
Obie przebiegają dwuetapowo tyle, że pierwsza z nich wymaga jednoznacznej identyfikowalności
modelu. Zbiorczo da się je przedstawić następująco:
PMNK
2MNK
Etap I
Szacowanie parametrów postaci zredukowanej
Szacowanie parametrów postaci zredukowanej
Etap II
Rozwiązanie układu równań:
(
D0 = −A−1 B
Estymacja każdego równania oddzielnie z wykorzystaniem estymatorów dla tych zmiennych endogenicznych, które w danym równaniu
pełnią rolę zmiennych ”objaśniających”
D1 = −A−1 A1
7.4
Przykład zastosowania Pośredniej MNK
Oszacować parametry modelu:
y1t + α11 y2t + β10 + β11 x1t = ε1t
y2t + α21 y1t + β20 + β21 x2t = ε2t
wiedząc, że po oszacowaniu postaci zredukowanej otrzymano parametry:
y1t = 3 − x1t + x2t
y2t = 2 + 2x1t − 5x2t
23 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Łatwo sprawdzić, że model jest jednoznacznie identyfikowalny. Tworzymy macierze parametrów
obu postaci (strukturalnej i zredukowanej):
"
#
"
#
"
#
1 α11
β10 β11 0
3 −1 1
A=
B=
D0 =
α21 1
β20 0 β21
2 2 −5
Rozwiązanie układu w postaci podanej powyżej może nastręczać trudności, dlatego dokonamy
jego przekształcenia:
AD0 = −B
Stąd mamy:
"
1 α11
#"
α21 1
3 −1
1
#
2 −5
2
"
=−
β10 β11 0
#
β20 0 β21
Po wymnożeniu powstaje następujący układ równań:
3 + 2α11 = −β10
3α21 + 2 = −β20
−1 + 2α11 = −β11
−α21 + 2 = 0
1 − 5α11 = 0
α21 − 5 = −β21
Po jego rozwiązaniu otrzymamy:
α11 = 0,2
β10 = −3,4
β11 = 0,6
α21 = 2
β20 = −8
β21 = 3
Podstawiamy do postaci strukturalnej:
y1t + 0,2y2t − 3, 4 + 0,6x1t = e1t
y2t + 2y1t − 8 + 3x2t = e2t
7.5
Przykład zastosowania Podwójnej MNK
Oszacować parametry modelu:
y1t + α11 y2t + β10 + β11 x1t + β11 x2t = ε1t
y2t + α21 y1t + β20 + β21 x3t = ε2t
Dysponując danymi:
y1t
y2t
x1t
x2t
x3t
1
7
1
4
18
3
9
2
7
11
4
10
2
9
9
6
11
3
11
8
6
10
4
12
8
Powyższy model jest nadmiernie identyfikowalny, a więc nie można zastosować PMNK. Szacujemy parametry postaci zredukowanej, otrzymując:
y1t = −2,12 − 0,12x1t + 0,72x2t + 0,02x3t
y2t = 9,08 − 0,92x1t + 0,52x2t − 0,18x3t
Po wyznaczeniu wartości teoretycznych zmiennych endogenicznych na podstawie postaci zredukowanej otrzymamy:
24 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
ŷ1t
ŷ2t
1
7
2,90
8,9
4,30
10,3
5,60
10,6
6,20
10,2
Wartości teoretyczne obu zmiennych endogenicznych podstawiamy do postaci strukturalnej i
szacujemy parametry po raz drugi używając MNK. Oto oszacowania postaci strukturalnej:
y1t − 0,11y2t − 1,11 − 0,22x1t + 0,78x2t = e1t
y2t + 0,1y1t + 12,24 − 0,3x3t = e2t
7.6
Analiza mnożnikowa
Ekonomia interesuje się często zachowaniem zmiennych endogenicznych wywołanym zmianami
zmiennych egzogenicznych. Odpowiedzi na to pytanie można poszukać w postaci zredukowanej.
Y = D1 Y1 + D0 X + V
Dokonujemy eliminacji opóźnionych zmiennych endogenicznych podstawiając sekwencyjnie kolejne opóźnienia o jeden okres.
Y1 = D1 Y2 + D0 X1 + V1
Y = D1 (D1 Y2 + D0 X1 + V1 ) + D0 X + V
Kontynuując proces podstawiania i cofając się o t-S okresów otrzymujemy ostatecznie postać
końcową:
S−1
S−1
X
X
S
s
Y = D1 YS +
D1 D0 Xs +
Ds1 Vs
s=0
s=0
Mnożniki są pochodną zmiennych endogenicznych względem zmiennych egzogenicznych. Tworzą
one macierz:
∂y(m)t
Us =
= Ds1 D0
∂x(k)t−s
Wyróżniamy następujące rodzaje mnożników:
Bezpośrednie wyrażają natychmiastowy, realizujący się w bieżącym okresie wpływ zmiennych
egzogenicznych. Tworzą je elementy macierzy D0 . Występują również w postaci zredukowanej.
Pośrednie mierzą efekt zmiany zmiennych egzogenicznych w kolejnych okresach (s > 0). Tworzą je elementy macierzy: D1 D0 , D21 D0 , . . .
Skumulowane mierzą łączny skutek zmiany zmiennych egzogenicznych po S okresach. Są sumą
mnożników bezpośrednich i pośrednich.
Mnożniki wyrażają wpływ zmiennych egzogenicznych na endogeniczne wynikający z poszczególnych równań i ten, który jest rezultatem powiązań w całym modelu.
25 z 26
Wykłady z Ekonometrii
Opracował: dr Adam Kucharski
Załóżmy, że wyznaczono następującą macierz mnożników bezpośrednich:


2 1,5
1



D0 = 
0,3
−2,1
−0,8


0,4
1,1
0,5
Wiersze odpowiadają zmiennym endogenicznym (niech będą to y1t , y2t , y3t zaś kolumny wyrazowi wolnemu i zmiennym egzogenicznym x1t , x2t . W tej sytuacji interpretacja elementu (2,3)
równego −0,8 brzmi następująco:
Jeżeli zmienna x2 w okresie t wzrośnie o jednostkę wówczas y2 w tym samym okresie
spadnie o 0,8 jednostki przy pozostałych warunkach nie zmienionych.
Warto w tym miejscu podkreślić, że zmienna x2 nie musi występować w równaniu na y2 , lecz
jej wpływ może następować pośrednio, poprzez powiązania występujące w modelu.
Zinterpretujemy teraz dla porównania element (2,3) macierzy mnożników pośrednich dla s=1
tego samego modelu, zawarty w poniższej macierzy:


−1 2,5 1,2



D1 D0 = 
0,4
3,1
0,1


0,7 0,1 2,5
Jeżeli zmienna x2 w okresie t wzrośnie o jednostkę wówczas y2 w okresie t+1 wzrośnie
o 0,1 jednostki przy pozostałych warunkach nie zmienionych.
Na koniec dokonamy interpretacji mnożnika skumulowanego dla S=1 okresów:


1 4 2,2



D0 + D1 D0 = 
 0,7 1 −0,7 
1,1 1,2
3
Jeżeli zmienna x2 w okresie t wzrośnie o jednostkę wówczas y2 łącznie w okresach t
i t+1 spadnie o 0,7 jednostki przy pozostałych warunkach nie zmienionych.
Mnożniki skumulowane obliczone dla nieskończonej wartości S (mierzące globalny efekt
zmian) nazywamy mnożnikami całkowitymi:
G=
∞
X
Ds1 D0 = (I + D1 + D21 + . . .)D0 = (I + D1 )−1 D0
s=0
Obliczenie mnożników w powyższy sposób możliwe jest wyłącznie w przypadku modeli liniowych. Dla nieliniowych mnożniki wyznacza się poprzez symulację. Jest to proces numerycznego
rozwiązywania modeli, który polega na wyznaczeniu wartości zmiennych endogenicznych, przy
założeniu pewnych wartości zmiennych egzogenicznych.
26 z 26