wykład 1 - Wydział

Transkrypt

wykład 1 - Wydział
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
ZASTOSOWANIA EKONOMETRII
Budowa, estymacja, weryfikacja i interpretacja
modelu ekonometrycznego.
dr Dorota Ciołek
Katedra Ekonometrii
Wydział Zarządzania UG
http://wzr.pl/~dciolek
[email protected]
1
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Literatura
 Osińska M. (red.) (2007), Ekonometria współczesna,
TNOiK, Toruń.
 Strzała, K., T. Przechlewski (2006), Ekonometria inaczej,
wyd. III, Wydawnictwo Uniwersytetu Gdańskiego, Sopot.
 ” G.S Maddala (2006), Ekonometria, PWN, Warszawa.
 Kukuła, K. (red.) (2009), Wprowadzenie do ekonometrii
w przykładach i zadaniach, PWN, Warszawa.
 Greene, W.H. (2008), Econometric analysis, Macmillan,
New York.
 J.M.Wooldridge (2009), Introductory Econometrics. A
modern approach.
2
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
I Model ekonometryczny
Model ekonometryczny - jest podstawowym narzędziem w
ekonometrii, służącym do analizy zależności zachodzących
między różnymi zjawiskami.
Model - jest uproszczonym odwzorowaniem rzeczywistości,
uproszczoną reprezentacją realnego obiektu, realnej
sytuacji lub realnego procesu.
- uwzględnia tylko istotne cechy, najważniejsze z
punktu widzenia określonego celu.
- nie jest dokładną reprezentacją rzeczywistości.
(Pawłowski 1978):
„Model ekonometryczny jest to konstrukcja formalna,
która za pomocą jednego równania lub układu równań
przedstawia zasadnicze powiązania występujące pomiędzy
rozpatrywanymi zjawiskami ekonomicznymi.”
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Ogólna postać modelu:
y  f ( x,  )
y – zmienna objaśniana w modelu – endogeniczna,
x – zmienne objaśniające, wyjaśniają kształtowanie się
zmiennej endogenicznej,
 - składnik zakłócający,
f( ) - oznacza postać analityczną funkcyjnej zależności miedzy
zmienną endogeniczną i zmiennymi objaśniającymi.
Zmienne objaśniające
(w modelach jednorównaniowych):
- zmienne egzogeniczne,
- zmienne endogeniczne opóźnione w czasie.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Przykłady modeli o konkretnej postaci
analitycznej:
Model liniowy – regresja prosta:
y t   0   1 xt   t
Model liniowy – regresja wieloraka:
yt   0  1 xt1   2 xt 2  ...   k xtk   t
 - są to nieznane, stałe w czasie parametry strukturalne.
 0 - parametr strukturalny wyrazu wolnego,
 i - parametry strukturalne przy zmiennych odzwierciedlają siłę i kierunek wpływu zmiennej
objaśniającej na zmienną endogeniczną, i=1,2,…,k.
k – liczba zmiennych objaśniających w modelu.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Klasyfikacja zmiennych w modelu:
Zmienne egzogeniczne
1)
y t   0   1 ct   2 s t   3 d t   t
2)
ct   0  1ct 1   2 d t   t
Zmienne endogeniczne
1)
y t   0   1 ct   2 s t   3 d t   t
2)
ct   0  1ct 1   2 d t   t
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Składnik zakłócający - losowy
Przyczyny uwzględniania składnika losowego w modelu:
- pominięcie niektórych czynników objaśniających
(niektóre czynniki są nierozpoznane przez teorię, inne
są niemierzalne),
- wybór niewłaściwej postaci analitycznej funkcji; postać
analityczna modelu zwykle nie jest dokładnie
określona przez teorię ekonomii,
- błędy w pomiarze zmiennych ekonomicznych,
- losowy charakter zmiennych ekonomicznych.
Składnik zakłócający jest zmienną losową i jak każda zmienna
losowa charakteryzuje się pewnym rozkładem
prawdopodobieństwa.
Cechy rozkładu składnika zakłócającego są ważnym
elementem modelu ekonometrycznego.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Zapis macierzowy modelu ekonometrycznego
Dany jest liniowy model ekonometryczny:
yt   0  1 xt1   2 xt 2  ...   k xtk   t
t =1, 2, …, T,
Ogólnie postać macierzową tego modelu można zapisać jako:
gdzie:
y  X  
y – wektor obserwacji na zmiennej endogenicznej,
X – macierz obserwacji na zmiennych objaśniających,


- wektor parametrów strukturalnych,
- wektor składników losowych.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Zapis macierzowy modelu ekonometrycznego
 y1 
y 
 2
y   y3 
 
 
 yT 
T 1
1
1

X  1


1
x11  x1k 
 1 
 
x21  x2 k 
 2
x31  x3k 
   3 

 
   
 
 T 
xT 1  xTk  T  ( k 1) 
T  1
T – liczba obserwacji,
 0 
k – liczba zmiennych objaśniających,
 
k+1 – liczba parametrów strukturalnych.
1


  
 
  k  ( k 1) 1
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Klasyfikacja modeli ekonometrycznych
Przykład 2:
gdzie:
1
2
Qi   0 K i Li e
i
Li – nakład pracy w i-tym przedsiębiorstwie (w osobach);
Ki – wartość brutto zakładu lub fabryki (mln $);
Qi – wartość dodana brutto wypracowana w i-tym
przedsiębiorstwie (mln $).
Model: - opisowy,
- statyczny,
- stochastyczny,
- mikroekonomiczny,
- nieliniowy,
-*
- jednorównaniowy,
- przyczynowo–skutkowy.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Wybór postaci analitycznej modelu
Model nieliniowy – funkcja analityczna jest nieliniowa ze
względu na parametry.
Model liniowy:
Model nieliniowy:
ln yt   0  1 ln xt   2 ln z t   t
1
2
Qi   0 K i Li e
i
Wybór postaci analitycznej:
- Zgodny z konkretną teorią ekonomiczną,
- Wybierany metodą prób i błędów.
- Na podstawie wykresu – regresja prosta.
11
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Logarytmy, czy poziomy zmiennych?
logarytmy zmiennych, gdy:
 zmienna wyrażona jest w jednostkach pieniężnych (o
wartościach dodatnich) – wynagrodzenie, sprzedaż firmy,
wartość rynkowa firmy, Produkt Krajowy Brutto;
 zmienne o wysokich wartościach: wielkość populacji,
całkowita liczba pracowników, współczynnik skolaryzacji,
liczba kilometrów;
poziomy zmiennych, gdy:
 zmienna wyrażona w liczbie lat: liczba lat edukacji lub
doświadczenia, wiek;
 zmienna przyjmuje niewysokie wartości całkowite: liczba
pokoi w domu, liczba osób w gospodarstwie domowym,
liczba samochodów w gosp. domowym;
 zmienne sztuczne (zero-jedynkowe) reprezentujące
zmienne jakościowe: płeć, poziom wykształcenia,
przynależność do organizacji, położenie geograficzne.
12
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Logarytmy, czy poziomy zmiennych?
 Zmienne, które są proporcjami lub udziałami
procentowymi: stopa bezrobocia, procent studentów, którzy
zdali egzamin, stopień wykrywalności przestępstw
kryminalnych – mogą występować albo w postaci
poziomów, albo w logarytmach, chociaż częściej używa się
poziomów.
Uwaga: Przy interpretacji uważamy z procentami:
Jeżeli bezrobocie wzrasta z 8 do 9 procent, oznacza to wzrost o jeden
punkt procentowy, ale przyrost o 12,5 procent w stosunku do
wartości początkowej.
13
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Logarytmy, czy poziomy zmiennych?
Jedno ograniczenie:
Logarytm zmiennej nie może być użyty jeżeli zmienna
przyjmuje wartości ujemne lub jest równa zero. Dla zmiennej
przyjmującej wartości zero rozwiązaniem może być
zastosowanie log(1+y).
(!) Używając zlogarytmowanej zmiennej musimy pamiętać, że
wartości teoretyczne tego modelu są wartościami log(y) a nie y.
(!) Nie można porównywać R-kwadrat wyznaczonych dla
modeli, w których mamy różne zmienne objaśniające: log(y) i y.
14
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
II Interpretacja zależności (1)
Parametr przeciętny:
yt
PP( yt , xti ) 
xti
Parametr przeciętny określa ile jednostek zmiennej y
przypada (w danym okresie t) na jednostkę zmiennej xi.
Przykłady parametrów przeciętnych:
• przeciętna skłonność do konsumpcji – określa ile jednostek
konsumpcji przypada na jednostkę dochodu,
• przeciętny koszt jednostkowy - określa jaki jest koszt
przypadający w okresie t na jednostkę produkcji,
• przeciętna produktywność (wydajność) kapitału oraz
przeciętna wydajność pracy .
15
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja zależności (2)
Parametr krańcowy:
 yt
PK ( y t , xti ) 
 xti
Parametr krańcowy określa o ile jednostek wzrośnie
(spadnie) zmienna yt , gdy zmienna xti wzrośnie o
jednostkę.
Przykłady parametrów krańcowych:
• krańcowa skłonność do konsumpcji - określa o ile jednostek
wzrośnie konsumpcja, gdy dochód wzrośnie o jedną
jednostkę,
• koszt krańcowy , który określa przyrost kosztu całkowitego
przypadający na jednostkowy przyrost produkcji,
• krańcowa produktywność kapitału , która określa przyrost
produkcji na skutek wzrostu nakładów kapitału o jednostkę.
16
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja zależności (3)
Elastyczność różnicowa:
yt / yt PK ( yt , xti ) yt xti
E ( yt , xti ) 


xti / xti PP( yt , xti ) xti yt
Elastyczność zmiennej yt względem zmiennej xti, informuje
o ile % wzrośnie (zmaleje) zmienna yt jeśli zmienna xti
wzrośnie o 1%.
Przykłady elastyczności:
• elastyczność dochodowa konsumpcji,
• elastyczność kosztów względem produkcji,
• elastyczność produkcji względem kapitału,
• elastyczność produkcji względem pracy.
17
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja modelu liniowego
Ogólny zapis statycznego modelu liniowego:
yt  0  1 xt1   2 xt 2  ...   k xtk t ;
Przyrost krańcowy w tym modelu:
(t  1,...,T )
yt
PK ( yt , xt1 ) 
 1
xt1
Oznacza to, że:
Parametry strukturalne w modelu linowym są przyrostami
krańcowymi.
Interpretacja: Jeżeli zmienna egzogeniczna xt1 wzrośnie o 1
jednostkę, a pozostałe zmienne objaśniające nie ulegną
zmianie, to oczekujemy, że zmienna endogeniczna yt
wzrośnie (spadnie) średnio o
jednostek.
1
18
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja modelu liniowego cd.
Ogólny zapis statycznego modelu liniowego:
yt  0  1 xt1   2 xt 2  ...   k xtk t ;
(t  1,...,T )
Elastyczność w tym modelu:
yt xt1 1 xt1
E(yt , xt1 ) 

xt1 y t
yt
Oznacza to, że:
Elastyczność w modelu linowym jest zmienna i zależy od
początkowych wartości zmiennych modelu.
Interpretacja: Przy danych wartościach zmiennych
egzogenicznych, jednoprocentowy wzrost zmiennej xt1
spowoduje przyrost (spadek) zmiennej y średnio o E %,
przy założeniu niezmienności pozostałych zmiennych.
19
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja modelu potęgowego
Ogólny zapis statycznego modelu potęgowego:
1  2
 k t
yt   0 xt1 xt 2 ... xtk e
Przyrost krańcowy w tym modelu:
yt
yt
PK ( yt , xt1 ) 
 1
xt1
xt1
Oznacza to, że:
Przyrost krańcowy w modelu potęgowym jest zmienny i
zależy od początkowych wartości zmiennych modelu.
20
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja modelu potęgowego cd.
Ogólny zapis statycznego modelu potęgowego:
1  2
 k t
yt   0 xt1 xt 2 ... xtk e
Elastyczność w tym modelu:
yt xti
yt xti
E(y t , xti ) 
 i
 i
xti y t
xti yt
Oznacza to, że: Parametry strukturalne w modelu potęgowym
są elastycznościami cząstkowymi. Jest to model o stałych
elastycznościach.
Interpretacja: Jeżeli zmienna egzogeniczna xt1 wzrośnie o
1%, a pozostałe zmienne objaśniające nie ulegną zmianie,
to oczekujemy, że zmienna endogeniczna yt wzrośnie
(spadnie) średnio o
%.
1
21
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Linearyzacja modelu potęgowego
Ogólny zapis statycznego modelu potęgowego:
1  2
 k t
yt   0 xt1 xt 2 ... xtk e
Postać modelu logarytmiczno-liniowa:
ln yt  ln  0  1 ln xt1   2 ln xt 2  ...   k ln x tk t ;
(t  1,...,T )
(Postać liniowa ze względu na parametry)
22
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Zapis macierzowy modelu potęgowego
1 ln x11
 ln y1 
1 ln x
 ln y 
21
2


X  1 ln x31
y   ln y3 





  
1 ln xT 1
ln yT 
T 1
 0 
 
1


  
 
  k  ( k 1) 1
 ln x1k 
 1 
 
 ln x2 k 
 2
 ln x3k 
   3 

 

 
 
 ln xTk  T  ( k 1)   T  T  1
y  X  
T – liczba obserwacji,
k – liczba zmiennych objaśniających,
k+1 – liczba parametrów strukturalnych.
23
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja modelu wykładniczego
Ogólny zapis statycznego modelu wykładniczego:
yt  e
 0  1 xt 1   2 xt 2 ...  k xtk t
Przyrost krańcowy w tym modelu:
yt
PK ( yt , xt1 ) 
 1 yt
xt1
Oznacza to, że:
Przyrost krańcowy w modelu wykładniczym jest zmienny i
zależy od początkowych wartości zmiennych modelu.
24
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja modelu wykładniczego cd
Ogólny zapis statycznego modelu wykładniczego:
yt  e
 0  1 xt 1   2 xt 2 ...  k xtk t
Elastyczność w tym modelu:
yt xt1
xt1
E(yt , xt1 ) 
 1 yt
 1 x t1
xt1 y t
yt
Oznacza to, że:
Elastyczność w modelu wykładniczym jest zmienna i zależy
od początkowych wartości zmiennych modelu.
25
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Interpretacja modelu wykładniczego cd
Ogólny zapis statycznego modelu wykładniczego:
yt  e
 0  1 xt 1   2 xt 2 ...  k xtk t
Można wykazać, że:
Jeżeli zmienna egzogeniczna xt1 wzrośnie o 1 jednostkę, a
pozostałe zmienne objaśniające nie ulegną zmianie, to
oczekujemy, że zmienna endogeniczna yt wzrośnie
(spadnie) średnio o (e i  1)  100   i  100 %.
26
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Linearyzacja modelu wykładniczego
Ogólny zapis statycznego modelu wykładniczego:
yt  e
 0  1 xt 1   2 xt 2 ...  k xtk t
Postać modelu logarytmiczno-liniowa:
ln yt  0  1 xt1   2 xt 2  ...   k xtk  t
(Postać liniowa ze względu na parametry)
27
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Zapis macierzowy modelu wykładniczego
 ln y1 
 ln y 
2

y   ln y3 


  
ln yT 
T 1
1
1

X  1


1
 0 
 
1


  
 
  k  ( k 1) 1
x11  x1k 
 1 
 
x21  x2 k 
 2
x31  x3k 
   3 

 
   
 
 T 
xT 1  xTk  T  ( k 1) 
T  1
y  X  
T – liczba obserwacji,
k – liczba zmiennych objaśniających,
k+1 – liczba parametrów strukturalnych.
28
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
III Estymacja modelu - MNK
Oszacować (estymować) model oznacza znaleźć oceny
parametrów strukturalnych na podstawie konkretnej próby.
Metody szacowania parametrów strukturalnych:
- Metoda Momentów,
- Metoda Najmniejszych Kwadratów,
- Metoda Największej Wiarygodności,
- i wiele innych…
Twierdzenie Gaussa-Markowa:
W klasycznym modelu regresji liniowej najlepszym
nieobciążonym estymatorem linowym parametrów jest
estymator uzyskany Metodą Najmniejszych Kwadratów (MNK).
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Własności estymatorów
Nieobciążoność – g jest nieobciążonym estymatorem  ,
jeżeli E(g)=  , co znaczy, gdy wartość oczekiwana w
rozkładzie z próby g jest równa  .
Oznacza to, że gdybyśmy obliczali wartość g dla każdej z
prób, którymi dysponujemy i powtarzali ten proces
nieskończenie wiele razy, to średnia z uzyskanych ocen
byłaby równa  .
Efektywność – estymator jest efektywny, jeżeli wartości g
wyliczone dla różnych prób nie różnią się między sobą
znacznie tzn. jeżeli wariancja estymatorów jest mała.
Estymator z najmniejszą wariancją – najbardziej efektywny.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Własności estymatorów
Zgodność – (własność dużych prób) zwiększanie liczebności
próby umożliwia uzyskiwanie estymatora o wartości coraz
bliższej szacowanego parametru, z prawdopodobieństwem
bliskim jedności:
lim P g       1
n 
Można wykazać, że:
Metoda Najmniejszych Kwadratów jest estymatorem
- nieobciążonym,
- zgodnym,
- najbardziej efektywnym w klasie estymatorów nieobciążonych.
BLUE –Best Linear Unbiased Estimator
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Założenia MNK
Założenia numeryczne – warunki stosowalności:
1) T > (k+1), czyli liczba obserwacji musi być większa niż liczba
szacowanych parametrów.
2) r(X)=(k+1), czyli rząd macierzy X musi być równy liczbie
szacowanych parametrów.
Drugi warunek oznacza brak współlinowości zmiennych
objaśniających, tzn. że zmienne objaśniające są liniowo
niezależne, *(czyli nie tworzą ze sobą takiej kombinacji
liniowej, która w wyniku daje wektor zerowy).
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Przykład współlinowości zmiennych:
X1-liczba pracowników w przedsiębiorstwie,
X2-liczba pracowników na stanowiskach kierowniczych,
X3-liczba pracowników na stanowiskach niekierowniczych.
X1=X2+X3, czyli X1-X2-X3=0
1
1

X  1

1
1
30 4
56 8
47 6
20 3
60 10
26
48
41

17
50
Rząd macierzy X=3 < k+1=4
Nie da się zastosować MNK!
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Założenia MNK
Założenia stochastyczne (dotyczą składnika losowego):
1)
2)
E  t   0
dla wszystkich t - wartość oczekiwana składnika
losowego jest równa zero.
 2  t    2 dla wszystkich t – wariancja jest jednakowa dla
wszystkich obserwacji - homoscedastyczność.
3)  i i  j są niezależne dla
- składniki losowe dla różnych
i  j nie są skorelowane; brak
obserwacji nie zależą od siebie,
autokorelacji składników losowych.
4) xt i  t są niezależne dla wszystkich t – zmienne objaśniające
nie zależą od składnika losowego, tzn. zmienne objaśniające
są nielosowe.

5)  ~ N 0,  2
t
losowy dla każdej obserwacji ma
 - składnik
rozkład normalny.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Założenia MNK
Jeżeli nie są spełnione założenia numeryczne – nie jesteśmy w
stanie zastosować matematycznych formuł na MNK.
Jeżeli nie są spełnione stochastyczne założenia 1), 2), 3), 4)
estymator MNK, przestaje być BLUE, daje obciążone oceny
parametrów strukturalnych.
Założenie 5) nie ma znaczenia dla własności MNK. Jego
spełnienie jest konieczne, aby można było zastosować testy
statystyczne pozwalające sprawdzić wszystkie powyższe
założenia.
Większość testów statystycznych bazuje na złożeniu, że
analizowana zmienna losowa ma rozkład normalny.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Model z jedną zmienną objaśniającą:
yt   0  1 xt  t
to równanie opisuje, zachowanie rzeczywistych wartości
zmiennej endogenicznych.
MNK to metoda, która do punktów dopasowuje taką prostą,
która przechodzi najbliżej wszystkich punktów równocześnie.
Równanie prostej:
yˆ t  ˆ 0  ˆ1 xt
to równanie opisuje, teoretyczne wartości zmiennej
endogenicznych, (wartości, które leżą na dopasowanej
prostej).
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
y
yˆ t  ˆ 0  ˆ1 xt
ŷt
ˆt
yt
x
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Odległość rzeczywistego punktu od prostej nazywana jest
odchyleniem, albo resztą:
ˆt  yt  yˆ t
Reszta nie jest składnikiem losowym, jest to oszacowany
składnik losowy (błąd) w modelu.
Na szeregu reszt sprawdzane będą założenia stochastyczne.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Idea MNK
MNK dopasowuje prostą do punktów, w taki sposób, aby
odległości od wszystkich punktów były jednocześnie jak
najmniejsze.
Każda odległość podnoszona jest do kwadratu, ponieważ mają
różne znaki.
MNK minimalizuje sumę kwadratów odchyleń (reszt):

T
t 1
ˆ
t

2
 min
  yt  yˆ t   
T
t 1
2
T
t 1
y t  ˆ 0  ˆ1 xt

2
 min
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Estymator MNK
Po dokonaniu minimalizacji sumy kwadratów reszt otrzymujemy
następującą macierzową formułę pozwalającą wyznaczyć
oceny parametrów strukturalnych modelu liniowego MNK:

ˆ  X X
ˆ
T

1
T
X y
- wektor ocen parametrów strukturalnych
y – wektor obserwacji na zmiennej endogenicznej,
X – macierz obserwacji na zmiennych objaśniających.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
IV Weryfikacja modelu
Weryfikacja ekonomiczna:
- Sprawdzenie zgodności wyników oszacowania z teorią
ekonomiczną.
Weryfikacja ilościowa:
- Sprawdzenie dobroci dopasowania modelu do danych
rzeczywistych,
- Sprawdzenie poprawności doboru postaci analitycznej
modelu,
- Sprawdzenie istotności zależności między zmienną
endogeniczną a zmiennymi objaśniającymi.
Weryfikacja stochastyczna:
- Sprawdzenie prawdziwości założeń dotyczących składnika
losowego – badanie własności estymatora MNK w tym
modelu.
- Sprawdzenie własności prognostycznych modelu.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Miary dopasowania
1) Błędy szacunku parametrów strukturalnych
2) Średni błąd resztowy (odchylenie standardowe reszt):ˆ 
określa o ile jednostek (in plus; in minus), przeciętnie rzecz
biorąc, zaobserwowane wartości zmiennej objasnianej
odchylają się od wartości teoretycznych (wyznaczonych na
podstawie oszacowanego modelu) tej zmiennej.
3) Współczynnik zmienności losowej
V 
ˆ 
y
100
Informuje o tym, jaki jest procentowy udział średniego błędu reszt
w średniej wartości zmiennej endogenicznej.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Miary dopasowania
4) Współczynnik determinacji: R
2
informuje jaka część całkowitej zmienności zmiennej
endogenicznej została ,,wyjaśniona'' przez model empiryczny.
5) Współczynnik zbieżności (indeterminacji):
2
Informuje, jaka część rzeczywistej zmienności zmiennej
endogenicznej nie została ,,wyjaśniona'' przez model
empiryczny, tj. kształtuje się pod wpływem czynników
nieuwzględnionych w modelu empirycznym.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Efekt pozornego wyjaśniania
Suma kwadratów reszt zależy od liczby zmiennych
objaśniających w modelu – im większa liczba zmiennych
tym mniejsza suma kwadratów reszt.
W modelu z bardzo dużą ilością zmiennych objaśniających
możemy uzyskać sumę kwadratów reszt = 0.
Wartość współczynnik determinacji wzrasta wraz z dodawaniem
nowych zmiennych objaśniających, niezależnie od tego czy
nowe zmienne mają istotny wpływ na zmiany zmiennej
endogenicznej.
Oba współczynniki należy skorygować uwzględniając liczbę
zmiennych objaśniających w modelu.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Syntetyczne miary dopasowania
Korekta o liczbę stopni swobody:
6) Skorygowany współczynnik zbieżności (indeterminacji)
7) Skorygowany współczynnik determinacji
Po uwzględnieniu liczby stopni swobody w modelu, informuje, jaka
część całkowitej zmienności zmiennej endogenicznej została
,,wyjaśniona'' przez model empiryczny.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Syntetyczne miary dopasowania
Wartość zwykłego współczynnika determinacji wzrasta wraz z
dodawaniem do modelu nowej zmiennej objaśniającej.
Wartość skorygowanego współczynnika wzrasta tylko wówczas,
gdy dołączane zmienne mają istotny wpływ na zmienność
zmiennej endogenicznej.
Miary skorygowane:
wykorzystuje się do porównywania różnych modeli, z różną
liczbą zmiennych objaśniających.
2
Niewielka różnica miedzy R i
,,pozornego wyjaśnienia’’.
R 2 świadczy o braku efektu
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Model regresji bez wyrazu wolnego
Regresja przez początek układu współrzędnych:
- gdy wymaga tego teoria ekonomiczna,
- gdy wyraz wolny znika w wyniku przekształceń zmiennych.
Konsekwencje:
• Współczynnik determinacji może przyjmować wartości mniejsze
niż 0 i wartości większe niż 100%.
• Uzyskujemy niedoszacowane błędy szacunku parametrów
strukturalnych.
• Nie możemy korzystać z niektórych testów statystycznych.
Współczynnik determinacji powinno się liczyć jako kwadrat
współczynnika korelacji miedzy wartościami rzeczywistymi i
teoretycznymi zmiennej endogenicznej.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Istotność parametrów strukturalnych
1) Test t-Studenta
indywidualnej istotności parametru strukturalnego
Hipotezy:
 H 0 : i  0
(i  0,1,...,k )

H A :  i  0
Statystyka z próby:
ˆi
ti 
(i  0,1,...,k )
ˆ
ˆ (  i )
Iloraz ten na rozkład:
ti ~ tT k 1
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Istotność parametrów strukturalnych
W hipotezie zerowej mamy równość stąd:
obszar krytyczny jest obszarem dwustronnym
Pole obszaru krytycznego w każdym teście jest równe poziomowi
istotności  (stąd konieczność podzielenia  na 2).
W teście t-Studenta H0 odrzucamy gdy:
| t i | t / 2
Mówimy wówczas, że:
Parametr statystycznie różni się od zera, jest statystycznie istotny.
Zmienna objaśniająca stojąca przy tym parametrze ma
statystycznie istotny wpływ na zmienną endogeniczną.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Istotność parametrów strukturalnych
2) Test F
łącznej istotności parametru strukturalnego
Hipotezy:
H 0 :  *  1  2 ...  k   0

*
H
:

0

A
Statystyka z próby:
T  k 1 R2
F * 
2
k

Statystyka na rozkład:
F * ~ FTkk 1
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Estymacja przedziałowa
Otrzymujemy:


 i  ˆi


P  t / 2 
 t / 2   1  
ˆ)
ˆ



(

i



Pˆ  t

P  t / 2ˆ (ˆi )  i  ˆi  t / 2ˆ (ˆi )  1  
i

ˆ )    ˆ  t ˆ (ˆ )  1  
ˆ

(

 /2
i
i
i
 /2
i
Jest to przedział ufności dla parametru strukturalnego.
Z prawdopodobieństwem równym współczynnikowi ufności,
powyższy przedział zawiera nieznany parametr strukturalny  i
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Weryfikacja stochastyczna:
- Weryfikacja hipotezy o braku autokorelacji składników
losowych.
- Weryfikacja hipotezy o stałości wariancji składników
losowych.
- Weryfikacja hipotezy o normalności rozkładu składnika
losowego.
Jeżeli powyższe hipotezy są prawdziwe wówczas:
estymator MNK parametrów strukturalnych liniowego
modelu ekonometrycznego jest estymatorem
nieobciążonym, zgodnym i najbardziej efektywnym w klasie
estymatorów nieobciążonych – BLUE.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Skutki autokorelacja składników losowych
- MNK przestaje być BLUE – nadal jest estymatorem
nieobciążonym, ale przestaje być najefektywniejszy.
- Wariancja resztowa staje się obciążonym estymatorem
wariancji składników losowych.
- Obciążone i nieefektywne stają się estymatory błędów
szacunku parametrów strukturalnych.
- Błędne są wyniki testów istotności.
- Niewiarygodne syntetyczne miary dopasowania.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie występowania autokorelacji
Testowanie zachowania składników losowych przeprowadzamy
na szeregu reszt uzyskanych z modelu oszacowanego MNK.
3) Test Durbina-Watsona
- Służy do badania autokorelacji rzędu pierwszego
Statystyka z próby:
ˆ  ˆ ) 2
(

t 2 t t 1
T
DW 

T
t 1
ˆ 2
DW  0,4
t
Jeżeli DW  0,2 w modelu podejrzewamy występowanie
autokorelacji dodatniej, wówczas hipotezy testu:
 H 0 : 1  0

 H A : 1  0
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie występowania autokorelacji
Jeżeli DW  2, 4
w modelu podejrzewamy występowanie
autokorelacji ujemnej, wówczas hipotezy testu:
 H 0 : 1  0

 H A : 1  0
W takim przypadku wyliczamy nową wartość statystyki:
DW *  4  DW
W obu przypadkach z tablic testu Durbina-Watsona
odczytujemy dwie wartości krytyczne (dla liczby obserwacji
T i liczby zmiennych objaśniających k):
dl
du
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie występowania autokorelacji
Reguła decyzyjna:
*
- Jeżeli ( DW lub DW )  d l , to odrzucamy hipotezę zerową.
*
- Jeżeli ( DW lub DW )  du , brak podstaw do odrzucenia
hipotezy zerowej.
- Jeżeli d l  ( DW lub DW * )  d u , to wartość statystyki
znajduje się w tzw. obszarze niekonkluzywności testu, test
DW nie daje odpowiedzi, czy w modelu występuje
autokorelacja składników losowych.
Relacja między statystyką DW a współczynnikiem
autokorelacji:
DW  2(1  ˆ1 )
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie występowania autokorelacji
Warunki stosowania testu Durbina-Watsona:
- W modelu musi występować wyraz wolny.
- Zmienne objaśniające muszą być nielosowe.
- Wśród zmiennych objaśniających nie może znajdować się
zmienna endogeniczna opóźniona w czasie.
- Liczba obserwacji powinna być wystarczająco duża: im
mniejsza liczba obserwacji tym szerszy przedział
niekonkluzywności testu.
Należy pamiętać, że test DW bada tylko autokorelację rzędu
pierwszego (pomiędzy sąsiednimi obserwacjami).
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Sposoby eliminacji autokorelacji z modelu
1) Rozpoznanie przyczyn występowania autokorelacji i
odpowiednia zmiana konstrukcji modelu:
- dołączenie nowej zmiennej objaśniającej,
- zdynamizowanie modelu, bądź zmiana opóźnień,
- dołączenie zmiennej lub funkcji tej zmiennej, by
wyodrębnić nadzwyczajny efekt czynnika
losowego,
- zmianie postaci analitycznej modelu,
- redukcji liczby zmiennych objaśniających
(zmniejszenie efektów pozornego wyjaśnienia),
- dołączeniu zmiennej cyklicznej dwuokresowej.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Sposoby eliminacji autokorelacji z modelu
2) Zastosowanie innej niż MNK metody szacowania parametrów
strukturalnych – Uogólnione Metody Najmniejszych
Kwadratów.
Metody te polegają na odpowiednim przekształceniu
pierwotnych obserwacji zmiennych modelu, tak by
wyeliminować z nich autokorelację i następnie na
oszacowaniu modelu MNK
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie heteroskedastyczności
Z własności numerycznych MNK wynika, że reszty są
nieskorelowane ze zmiennymi objaśniającymi.
Dlatego bada się np. zależność reszt od wartości zmiennych
podniesionych do kwadratów, do potęgi trzeciej itd. –
różne testy.
4) Test White’a
W jednej z wersji wykorzystuje regresję kwadratów reszt ze
względu na stałą i kwadraty wartości teoretycznej zmiennej
endogenicznej:
2
2
ˆ
ˆ
 t   0  1 yt  ut
Badamy, czy parametr α1 jest statystycznie istotny.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie heteroskedastyczności
Hipotezy testu:
H o :  2t   2
t  1, 2,...,T
H A :  2t   2s
ts
Ho odrzucamy, gdy parametr α1 okaże się statystycznie istotny,
tzn. że wartości reszt wzrastają lub zmniejszają się wraz ze
wzrostem wartości wszystkich zmiennych objaśniających w
modelu – wariancja reszt nie jest stała.
Statystyka testu W wyliczana w pakietach komputerowych ma
dwie wersje:
2
2
Dla dużych prób:

 ~  1
Dla małych prób:
F ~ F (1, T  2)
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Skutki heteroskedastyczności
- Estymator MNK parametrów strukturalnych nadal jest
estymatorem nieobciążonym, ale staje się nieefektywny.
- Obciążone oceny błędów szacunku parametrów
strukturalnych.
- Niewiarygodne wyniki testów istotności.
Sposoby rozwiązania problemu
- Stosujemy Ważoną Metodę Najmniejszych Kwadratów
(WMNK).
- Wykorzystujemy tzw., deflatory, które zmieniają poziom
wartości zmiennych.
- Transformujemy dane do postaci logarytmicznej.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Normalność rozkładu składnika losowego
Stosując wszystkie powyższe testy zakładaliśmy, że badana
zmienna, a zatem składnik losowy, ma rozkład normalny.
Testowanie normalności rozkładu
t
Test Jarque,a-Bery
W rozkładzie normalnym: miara skośności S=0
miara kurtozy K=3
2
4
3
K 2
S 3
2
2




gdzie  2 ,  3 ,  4 - drugi, trzeci i czwarty moment centralny
rozkładu.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Normalność rozkładu składnika losowego
Hipotezy testu:
H 0 :t ~ N
H A :  t nie ma N
Statystyka z próby:
 S 2 K  32 
JB  T 


24 
 6
2

(2) .
Statystyka ma asymptotycznie rozkład
Prawostronny obszar krytyczny określony przez   (2) .
2
Test ma zastosowanie tylko dla dużych prób.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Normalność rozkładu składnika losowego
W przypadku niespełniania założenia o normalności:
- Zmodyfikować metody uwzględniając inny, lepszy w danym
przypadku rozkład: gamma, log-normalny, itd.
- Dokonać transformacji zmiennych (np. zlogarytmować,
podnieść do potęgi) tak, aby uzyskać rozkład normalny.
Przykładem takiej transformacji jest transformacja Boxa-Coxa.
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie poprawności wyboru postaci
analitycznej
Test Ramseya (RESET - test)
Testuje, czy postać liniowa jest poprawna, czy też należałoby
wybrać wielomian wyższego stopnia.
W jednej z wersji testu sprawdzane jest, czy podniesione do
kolejnych potęg wartości teoretyczne zmiennej
endogenicznej nie są pominiętymi zmiennymi w modelu.
p
yt   0  1 xt1  ...   k xtk   2 ( yˆ t )   3 ( yˆ t )  ....   p ( yˆ t )   t
2
Hipotezy testu:
H 0 :  2   3  ...   p  0
H :    0
 A i i
3
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Testowanie poprawności wyboru postaci
analitycznej
Statystyka dla dużych prób:
(k )
( k  p 1) asymp.
S

S
2
 2p 1 ( ) 
~

p 1
S (k ) / T
(k )
gdzie: ( S ) - suma kwadratów reszt z modelu bez wartości
teoretycznych y.
( S ( k  p 1) ) - suma kwadratów reszt z modelu poszerzonego.
Statystyka dla małych prób:
{S ( k )  S ( k  p 1) } /(k  p  1  k ) asymp. p 1
F 
~ FT k  p 2
( k  p 1)
S
/(T  k  p  2)
D. Ciołek
ZASTOSOWANIA EKONOMETRII – wykład 1
Do wszystkich testów statystycznych
Prawdopodobieństwo empiryczne – p-value, wartość-p
Jest to prawdopodobieństwo przyjęcia przez statystykę wartości
nie mniejszej od uzyskanej wartości statystyki z próby, przy
założeniu, że hipoteza zerowa jest prawdziwa.
Reguła decyzyjna:
p value  
- brak podstaw do odrzucenia H0.
p value  
- odrzucamy H0.
Inaczej p value oznacza poziom istotności powyżej którego należy
odrzucić hipotezę zerową.