Ekonometria Mirosław Wójciak

Transkrypt

Ekonometria Mirosław Wójciak
Literatura obowiązkowa
Barczak A, ST. Biolik J, Podstawy Ekonometrii, Wydawnictwo AE Katowice, Katowice 1998
Dziechciarz J. Ekonometria – Metody, przykłady, zadania (wyd. 2)
Kukuła K (redaktor naukowy): Wprowadzenie do ekonometrii w przykładach i zadaniach,
Wydawnictwo Naukowe PWN, Warszawa 1996
Jajuga K. : Ekonometria – metody i analiza problemów ekonomicznych
Borkowski B, Dudek H, Szczęsny W. :Ekonometria – wybrane zagadnienia
Ekonometria
Jest „unifikacją teorii ekonomii, statystyki i matematyki” (Ragnar Frish, 1926)
Zbigniew Pawłowski – ekonometria jest nauką o metodach badania ilościowych prawidłowościach
występujących w zjawiskach ekonomicznych za pomocą odpowiednie wyspecjalizowanego aparatu
matematyczno –statystycznego.
„Ekonometria jest nauką i sztuką stosowania metod statystycznych do mierzenia relacji
ekonomicznych” (Gregory C. Chow)
Celem ekonometrii jest dokładne rozpoznanie procesów gospodarczych oraz pomoc decydentom i
działaczom gospodarczym w przewidywaniu procesów ekonomicznych i sterowaniu nimi.
Jak? Ile?
Model ekonometryczny
Model zawsze musi być lepszą lub gorszą kopią oryginału (Zdzisław Hellwig).
Wady, zalety modeli:
- z jednej strony prostota modelu ułatwia jego zrozumienie
- z drugiej strony – nadmierne upraszczanie rzeczywistości
Modelem ekonometrycznym nazywać będziemy konstrukcję formalną, która za pomocą jednego
równania bądź też wielu równań odwzorowuje zasadnicze powiązania ilościowe zachodzące między
badanymi zjawiskami (Zbigniew Pawłowski).
Budowa tego modelu jest bardzo skomplikowana
Jednorównaniowy model ekonometryczny
y t= f  x 1t , x 2t ,... , x k−1 ; t 
Gdzie:
y t - zmienna objaśniana inaczej endogeniczna (zależna)
x 1t , x 2t , ... , x k −1 – zmienne objaśniające inaczej zmienne egzogeniczne (niezależne)
 - ksi - składnik losowy
f- postać analityczna modelu, np.: postać liniowa, potęgowa
Liniowa postać analityczna modelu:
1
y t= 1 x 1t  1 x 1t ...1 x 1t  0t
część deterministyczna
| część stochastyczna
Gdzie:
i – parametry strukturalne modelu
Elementy modelu ekonometrycznego
- Zmienne objaśniane – elementy które są wyjaśniane przez poszczególne równania modelu
- zmienne objaśniające – zmienne użyte do opisu, wyjaśnienie zmiennych endogemicznych
- składnik losowy- parametry strukturalne – są to wartości wyrażające ilościowy wpływ danej zmiennej przy której
występują na zmienną endogeniczną.
- parametry struktury stochastycznej – są to parametry składnika losowego – wariancja ,autokorelacja
Zmienne opóźnione – lub jednego okresu
Składnik losowy w modelu wynika z konieczności uwzględniania:
- wpływu wszystkich zmiennych, które wpływają na zmienną endogeniczną nie ujętych w modelu,
- różnic między przyjętą postacią analityczną modelu, a istniejącą zależnością w rzeczywistości,
- błędy pomiarów zmiennych
- czynników losowych wpływających na zmienną endogeniczną.
Specyfikacja modelu ekonometrycznego to:
- sprecyzowanie zmiennych objaśniających
- sprecyzowanie zmiennych objaśnianych (endogenicznych)
- podjęcie decyzji co do charakteru występujących w modelu związków pomiędzy zmiennymi m. in.
postać analityczna.
Specyfikacja modelu ekonometrycznego opiera się na informacjach a priori oraz informacjach
pochodzących z badań empirycznych.
Przykład 1
Zbudujmy model ekonometryczny popytu na nowe samochody segmentu B. Wyspecyfikujmy zmienną
endogeniczną oraz zmienne objaśniające.
y t - popyt na nowe samochody segmentu B w szt
x 1t - średnia cena nowego samochodu segmentu B w zł
x 2t – dochody ludności na osobą w zł
x 3t – cena benzyny (ceny dóbr komplementarnych) w zł
x 4t – cena przejazdu publicznymi środkami lokomocji za 1 km w zł (ceny dóbr substytucyjnych)
y t−1 – popyt na nowe samochody segmentu B w poprzednim roku w szt.,
 t ..- składnik losowy
f- postać analityczna modelu np. postać potęgowa




y t= x1t⋅x 2t⋅...⋅y t−1⋅e
1
2
5
t
Etapy budowy modelu ekonometrycznego
1.Wyznaczenie celu i zakresu badania
Etap 1 – specyfikacja modelu – określenie zmiennych – najtrudniejszy
2
Etap 2 – przygotowanie odpowiedniej bazy danych (zbiór danych statystycznych)- na ich podstawie –
parametry
Etap 3 – estymacja parametrów modelu – (zastosowanie ekonometrii)
Etap 4 – weryfikacja oszacowanego modelu pod względem formalnym (czy są spełnione założenia) i
merytorycznym
Etap 5 – praktyczne wykorzystanie modelu ekonometrycznego
Klasyfikacja modeli ekonometrycznych
1 Klasyfikacja modeli ekonometrycznych ze względu na postać analityczną
- liniowe
- nieliniowe sprowadzalne do liniowych (potęgowe)
- nieliniowe niesprowadzalne do liniowych
2 Ze względu na udział czynnika czasu:
- statyczne
- dynamiczne – to takie modele w którym występują zmienne opóźnione w czasie lub zmienna
czasowa t
3 Ze względu na poznawcze cechy modelu:
- modele przyczynowo-skutkowe – opisowe, (np, wzrost ceny - przyczyna, spadek sprzedaży - skutek)
- modele symptomatyczne
- modele tendencji rozwojowych – (inaczej funkcje trendu) jedyną zmienną objaśniającą jest zmienna
czasowa
Dane statystyczne w badaniach ekonometrycznych
Dane statystyczne wykorzystane w modelowaniu ekonometrycznym powinny
charakteryzować się:
- dokładnością – brak błędu powtarzalnego,
- wiarygodnością – muszą odzwierciedlać rzeczywisty stan,
- porównywalnością –
- kompletnością – brak braku danych
Rodzaje danych statystycznych
Dane statystyczne typu:
- makroekonomicznego
- mikroekonomicznego
Dane o charakterze:
- dane przekrojowe  y i
- szeregi czasowe  y t 
- dane przekrojowo – czasowe  y ti  np w różnych województwach od roku2003 do 2005
Liczba zmiennych egzogenicznych:
Czy powinno się wprowadzić jak najwięcej zmiennych czy tez zbiór ten ograniczyć do
najważniejszych cech?
Wstępnie ustalony zbiór zmiennych musi podlegać selekcji ze względu na:
- kryteria oceny merytoryczno-formalnych własności zmiennych
- kryteria wartości informacyjnej zmiennych
Pożądane własności zmiennych objaśniających
3
Zmienne objaśniające powinny charakteryzować się następującymi własnościami:
- zapewnienie dostatecznie dużej zmienności (czasowej lub przestrzennej)
- są nieskorelowane lub co najwyżej słabo skorelowane między sobą (postulat braku redundancji)
- są silnie skorelowane ze zmienną objaśnianą.
R i R0
Macierz
Współczynniki korelacji między zmiennymi objaśniającymi, a zmienną objaśnianą oznaczymy jako
r 0j i tworzą one wektor R0
Współczynniki korelacji pomiędzy zmiennymi objaśniającymi oznaczymy jako r ij i tworzą one
macierz R.
[]
[
r 01
R0= r 02
..
r 0q
1 r 12
R= r 21 1
..
..
r q1 r q2
tu współczynniki powinny być
jak największe,
.. r 1q
.. r 2q
.. ..
.. 1
]
a tu jak najmniejsze
@@ Zad. Dom I i II rozdział. Barczak
Metoda Z. Hellwiga
Nośnikiem informacji o zmiennej endogenicznej jest potencjalna zmienna objaśniająca.
Pojemnością indywidualnego nośnika informacji jest wyrażenie:
r 20j
h kj =
pk
1∑ ∣r ij∣
// od i =1 do ??
i=1
h kj ∈〈0 ; 1〉
Gdzie
r oj – współczynnik korelacji liniowej między Y a x j
r ij – współczynnik korelacji liniowej między x i a x j
Pojemnością integralną k tej kombinacji potencjalnych zmiennych objaśniających jest wyrażenie:
pk
H k =∑ h k , dla k =1,2 , ... , L , H k ∈〈0,1〉
j=1
Liczba możliwych kombinacji potencjalnych zmiennych objaśniających jest równa:
L=2 p−1
Pojemności integralna stanowi kryterium wyboru odpowiedniego zestawu zmiennych objaśniających.
Wady metody Z. Hellwiga (optymalnego wyboru predykant)
- pracochłonności obliczeń np. przy 5 potencjalnych zmiennych objaśniających jest do sprawdzenia
już 31 kombinacji
Zalety metody optymalnego wyboru predyktant
4
- metoda jednoznacznie wskazuje na najlepszą kombinacją spośród wszystkich możliwych kombinacji
@@ Dom – rozdział 3 Barczak
Uwagi wstępne – KMNK
Wyrażenia klasyczna metoda najmniejszych kwadratów KMNK będziemy używali w odniesieniu do
metody szacowania parametrów strukturalnych modelu liniowego
y i=1 x 1i  2 x 2i ...k x ki  0 i ; i=1,2 , ... , n
Będziemy używać następujących oznaczeń:
y i – i –ta obserwacja zmiennej objaśnianej
x ji – i –ta obserwacja j-tej zmiennej objaśniającej
[]
[]
[
y1
Y = y2
..
yn
x11
X = x12
..
x 1n
1
=  2
..
n
1
2
= ..
k
0
x 21
x 22
..
x 2n
...
...
...
...
x k1
x k2
..
x kn
1
1
1
1
x 26 to 6 obserwacja 2 zmiennej
]
[]
Przy tych oznaczeniach jednorównaniowy liniowy model ekonometryczny może być zapisany jako:
Y =X⋅
Założenia KMNK
Zastosowanie KMNK wymaga przyjęcia następujących założeń:
1.postać modelu jest liniowa względem parametrów (lub sprowadzalna do liniowej),
2.zmienne objaśniające są wielkościami nielosowymi (z góry ustalone – musimy je znać)
3.zmienne objaśniające są niezależne i wolne od współliniowości –nie istnieje między zmiennymi
dokładna zależność liniowa
4. r  X =k ≤ n (X- macierz obserwacji na zmiennych objaśniających) – warunek na liczebność
i współliniowość próby,
jeżeli 3 i 4 nie zostanie spełnione
5. E =0 , czyli składniki losowe dla wszystkich obserwacji mają wartości oczekiwane równe
zero
T
6. E  = 2 I , czyli składnik losowy dla każdej obserwacji ma skończoną wariancję  2 ,
natomiast cov i ,  j =0
7. składnik losowy  nie jest skorelowany ze zmiennymi objaśniającymi
IE
Estymacja parametrów modelu liniowego KMNK
Część deterministyczna modelu ekonometrycznego wyznacza nam wartości teoretyczną zmiennej y.
Zapiszmy model jako:
5
Y =X⋅
Y =X⋅a
S=Y −Xa T Y − Xa min
Trzeba wyznaczyć taki wektor a, dla którego powyższa funkcja osiągnie minimum
Otrzymujemy następujący estymator wektora a:
a= X T X −1 X T Y
wektor a jest nazywany wektorem ocen parametrów 
Postać modelu można zapisać jako:
y i=a1 x 1i a 2 x 2i ...a k x ki a 0
Lub
y i=a1 x 1i a 2 x 2i ...a k x ki a 0ui
gdzie
u i= y i− y i
Wartość oceny a j - interpretacja (parametry a informują o ile zmieni się y jeżeli ...
Własności estymatora KMNK
Przy spełnionych założeniach estymatory liniowe uzyskane KMNK są:
- zgodne - wraz ze wzrostem próby maleje błąd szacunku
- nieobciążone – estymator nie wykazuje błędów
- najefektywniejsze – mają najmniejszą wariancję, są najbardziej precyzyjne
Z macierzą wariancji i kowariancji daną wzorem:
D 2 a= 2  X T X −1
Założenia KMNK a własności estymatora:
- jeżeli zmienne objaśniające są współliniowe, to nie istnieje estymator KMNK
- jeżeli wariancja składnika losowego nie jest stała to estymator nie jest najefektywniejszy
- jeżeli składnik losowy jest zależny: cov  t , t ≠0 , a w zbiorze zmiennych objaśniających nie
ma Y t − .. to estymator KMNK nie jest najefektywniejszy
- jeżeli składnik losowy jest zależny: cov  t , t ≠0 , a w zbiorze zmiennych objaśniających
występuje Y t − . To estymator KMNK nie jest zgodny
- jeżeli wariancja składnika losowego jest funkcją zmiennych objaśniających, to estymator KMNK nie
jest zgodny.
Estymacja parametrów struktury stochastycznej
Innymi słowy miary dopasowania modelu do danych empirycznych.
1. nieobciążonym estymatorem wariancji składnika losowego jest wariancja resztowa zdefiniowana
następującym wzorem:
6
S 2u =
n
n
1
1
∑  y − y 2= n−k
∑ ui2
n−k i=1 i i
i =1
Lub wyrażona wzorem macierzowym:
2
Su=
1
[ Y T Y −Y T X a ]
n−k
Y T Y =∑ y 2
Y T X = X T Y T
2. odchylenie resztowe (odchylenie standardowe składnika losowego) zdefiniowane jako:
S u = S 2u
3. współczynnik zmienności przypadkowej (wyrazistości) zdefiniowany jako:
Su
⋅100
y
interpretacja ...
Jeśli wartość V u nie przekracza wartości V* (np. 10%), to przyjmuje się, że model jest
dopuszczalny
V u=
4. współczynnik zbieżności zdefiniowany jako:
n
∑  y i− yi 2
 2= i =1
n
 2∈〈 0 ; 1〉
∑  y i− yi 2
i =1
interpretacja:
 2=
n−k ⋅S 2u
2
n⋅S y
=
∑ ui2
2
2 ∑ yi 
∑y−
i
n
5. współczynnik determinacji (jaką część można wyjaśnić) zdefiniowany jako:
R2=1−2
R2 ∈〈 0 ; 1〉
6. Macierz wariancji i kowariancji ocen parametrów szacuje się na podstawie:
D 2 a=S 2u  X T X −1
W macierzy tej na głównej przekątnej są wariancje ocen parametrów
D2 a j 
D a j =  D2 a j 
interpretacja ...
I tu pewnie był przykład 1 na szacowanie parametrów strukturalnych modelu ekonometrycznego
//zał 1 str. 4
Ekonometria wykład 2/3 28.10.2006
7
Weryfikacja modelu
1. Testowanie istotności parametrów strukturalnych
- testowanie istotności parametrów testem t-Studenta
- testowanie istotności parametrów testem Fischera-Snedecora ( za pomocą współczynnika
korelacji wielorakiej)
2. Analiza własności reszt,
- autokorelacja składnika losowego
- jednorodność wariancji składnika losowego
- normalność składnika losowego
Test t-Studenta na istotność parametrów
Jeżeli spełnione są założenia KMNK to sprawdzianem hipotezy zerowej
H 0 :  j =0
wobec hipotezy alternatywnej
H 1 :  j ≠0
// jest istotny
jest statystyka t-Studenta o n-k stopniach swobody
t j=
a j− j
; j=1,2 , ... , k
D a j 
gdzie
a j - ocena parametru strukturalnego  j
D a j  - błąd szacunku parametru  j
jeżeli wartość statystyki:
∣t j∣ >= t  , n−k gdzie t  , n−k wartość krytyczna odczytana z tablic t-Studenta
to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej.
jeżeli
∣t j∣ < t  , n−k
to brak podstaw do odrzucenia hipotezy zerowej
Przyczyny nieistotności parametrów strukturalnych:
•
•
•
•
•
•
brak zależności pomiędzy X j i Y
mała dokładność lub nieodpowiednia jakość danych statystycznych
mało liczna próba
przyjęta niewłaściwa postać analityczna modelu
pominięcie w modelu innych ważnych zmiennych objaśniających
okoliczności przypadkowe, wynikające z losowości próby
przykład 1
Zbadaj czy dochody ludności i średnia cena nowego samochodu istotnie kształtują popyt na
samochody?
model z przykładu 1:
y t=1,470 x1t −0,629 x 2t 2,609u t
gdzie
y t popyt w tys,
x 1 dochody w setkach,
x 2 średnia cena samochodu
tzn: Sprawdź istotność parametrów stojących przy zmiennych x 1 i x 2 we wzorze są to 1 i 2 .
8
badamy zatem parametr 1 ( dochody)
H 0 : 1=0
wobec hipotezy alternatywnej
obliczamy wartość statystyki t-Studenta:
t s=
a j − j
1,470−0
= 0,217 = 6,774
D a j 
// skąd mamy 0,217 ?? nie mam tego przykładu
t 0,05;12−3=2,262
wartość statystyki jest większa od wartości krytycznej
|6,774|>2,262
więc hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej.
co oznacza, że parametr jest statystycznie istotny a więc dochody ludności istotnie kształtują popyt na
samochody
i analogicznie 2
|-3,901|
hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej, czyli parametr jest statystycznie istotny,
a więc średnia cena nowego samochodu kształtuje popyt na samochody.
Test Fischera-Snedecora istotności współczynnika korelacji wielorakiej.
H 0 : R w =0
H 1 : R w0
współczynnik jest istotny
// >
Sprawdzianem jest statystyka postaci:
R 2 n−k
F=
2.
1−R k −1
Statystyka F ma rozkład F Fischera-Snedecora o (k-1) i (n-k) stopniach swobody.
Jeżeli wartość statystyki
F ≥F  ;k −1, n−k
gdzie F  ;k −1, n−k wartość odczytana z tablic dystrybuanty rozkładu F Fischera-Snedecora o (k-1) i (nk) stopniach swobody oraz 
to hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej.
Jeżeli
F F  ;k −1, n−k
To nie ma podstaw do odrzucenia hipotezy zerowej
Test F Fischera-Snedecora istotności współczynnika korelacji wielorakiej przykład:
Sprawdź czy model dostatecznie opisuje sprzedaż samochodów.
H 0 : R w =0
H 1 : R w0
9
F=
R 2 n−k
0,945 12−3
=
.
=77,318
2.
k−1
1−0,945
3−1
1−R
F 0,05;2;9 = 4,26
77,318>4,26
Hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej.
Model statystycznie istotnie opisuje sprzedaż samochodów
Autokorelacja składnika losowego
Na ogół autokorelację można wyrazić w postaci relacji:
 t= f t −1 , t −2 , ... , t −
W związku z tym spełniona jest zależność
T ≠2 I
W praktyce przyjmuje się na ogół funkcję liniową, a maksymalne opóźnienie czasowe  wynosi
jeden lub dwa
t=1 t−1t autokorelacja rzędu pierwszego
Estymator współczynnika autokorelacji rzędu  dany jest wzorem:
n
∑
r =
t =1
u  . ut −
n
, r  należy <-1;1>
2
t
∑u
t =1
// pierwszego rzędu to  jest jeden
autokorelacja (...) - przyczyny
1. Błędy specyfikacji równania.
– pominięcie ważnej zmiennej objaśniającej – błąd specyfikacji statycznej
– pominięcie właściwego opóźnienia zmiennej objaśniającej, a w szczególności zmiennej
objaśnianej – błąd specyfikacji dynamicznej,
– niewłaściwa postać funkcyjna równania.
Badanie autokorelacji – test Durbina-Watsona
Hipoteza zerowa
H 0 : 1=0
Hipoteza alternatywna:
H 1 : 1 0
// lub 10 w zależności od d
Sprawdzianem hipotezy zerowej jest statystyka
n
∑ u t −u t−12
d = t =2
n
∑u
t=1
, d ∈〈 0 ; 4〉
2
t
// dopiero po policzeniu wartości statystyki wybieramy hipotezę alternatywną !!
jeżeli d>2 to hipoteza przyjmuje postać 10 i należy obliczyć d' ze wzoru
10
d'=4-d
bo tablice D-W są od 0 do 2
jeżeli d<2 to hipoteza przyjmuje postać 10
wtedy d' nie liczymy
Rozkład sprawdzianu d przy założeniu, że H 0 jest prawdziwa i składniki losowe mają rozkład
normalny N 0,  zależy od:
n-liczba obserwacji,
K-liczba zmiennych objaśniających !!!!//duże k
Z tablic wartości krytycznych testu D-W odczytuje się d L i d U dwie wartości krytyczne
Kiedy d<2, czyli hipoteza alternatywna przyjmuje postać 10 mamy możliwe sytuacji
1. d ≤d L to hipotezę zerową odrzucamy, - korelacja występuje
2. d L d d U to nie można podjąć decyzji czy autokorelacja jest istotna czy nie
3. d U ≤d to nie ma podstaw do odrzucenia hipotezy zerowej
Kiedy d>2 czyli hipoteza alternatywna przyjmuje postać 10 mamy możliwe sytuacje:
4. d ' ≤d L to hipotezę zerową odrzucamy, - korelacja występuje
5. d Ld ' d U to nie można podjąć decyzji czy autokorelacja jest istotna czy nie
6. d U ≤d ' to nie ma podstaw do odrzucenia hipotezy zerowej
Test Durbina-Watsona jest testem trójstronnym (posiada tzw. obszar niekonkluzywności – nie można
podjąć decyzji)
Pomiędzy estymatorem r 1 a statystyką Durbina-Watsona d zachodzi relacja:
d ≈2 1−r 1
W przypadku stwierdzenia autokorelacji mamy możliwości:
•
•
•
usunąć przyczyny autokorelacji
zastosować procedury estymacji w warunkach autokorelacji (np uogólnioną metodę najmniejszych
kwadratów)
pozostać przy metodzie najmniejszych kwadratów godząc się z mniejszą efektywnością
estymatorów
Test D-W przykład
Zbadaj czy występuje autokorelacja składnika losowego w modelu sprzedaży
samochodów
po obliczeniu statystyki d=2,741
d'=1,259
n=12 i K=2 liczba zmiennych objaśniających
d L =0,812 d U = 1,579
XERO Kukuła s. 58 zrobić
ponieważ <d' < to nie można podjąć decyzji czy autokorelacja jest istotna czy nie (powinniśmy
zastosować inny test na badanie autokorelacji)
11
oszacujemy estymator r 1 ze wzoru:
n
∑ u t . ut −1
r 1=
t =2
n
∑ u 2t
=
−1,60
=−0,431
3,71
t=1
Jednorodność wariancji
W związku z tym spełniona jest zależność
T = 2i I
2
i
 =k i. 
// w związku z czym?
// równe czy różne
2
gdzie k i współczynniki wyrażenia zmienności wariancji składnika losowego dla i-tej obserwacji
(i=1,2, ... n)
Jednorodność wariancji – test Goldfelda-Quandta
W teście tym próbę statystyczną dzieli się na dwie pod próby ( n 1 i n 2 ) tak, że:
1. n 1n 2=n tzn wszystkie obserwacje z próby statystycznej są uwzględnione
lub
2. n 1n 2n (liczba pominiętych obserwacji nie może przekraczać 1/3 obserwacji 0,33n)
//jeśli liczba n jest parzystą to nie pomija się żadnej??
//(na kolokwium poda jak ma być dzielona próba)
generalnie przyjmujemy że n 1=n 2
Dla obu pod prób szacowane są parametry strukturalne modelu
Dla tak oszacowanych modeli liczy się wariancje resztowe
S 2u1 i S 2u2
// i stosujemy zwykły test Fischera-Stedeckora na równość wariancji ( nie było?)
W teście Goldfelda-Quandta weryfikujemy hipotezę:
H 0 :  21=22 wobec hipotezy alternatywnej
H 1 : 1222
Jeżeli prawdziwa jest hipoteza zerowa wówczas stosunek wariancji reszt
S 2u1
F= 2
S u2
ma rozkład F Fischera-Snedecora o m 1=n 2−k i m 2 =n 1−k stopniach swobody
Jeżeli F ≥F  ;m1 , m2 to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej.
Przykład 1
Próbę statystyczną podzielono na n 1=5i n2=5
Dla obu pod prób oszacowano modele
S 2u1=0,338
S 2u2=1,053
//zał 2 do wykładu 2
12
F= 3,115
F 0,05 ,5−1,5−3=19,0
3,115 < 19
nie ma podstaw do odrzucenia hipotezy zerowej, możemy przyjąć że wariancje w obu podpróbach
n 1 i n 2 są równe.
Oznacza to że wariancja jest jednorodna.
Normalność
Poprawna interpretacja testu F i testu t – czyli testów istotności zmiennych objaśniających jest
możliwa pod warunkiem przyjęcia założenia stwierdzającego że rozkład składnika losowego modelu
jest rozkładem normalnym - N 0, 
w tym celu użyjemy testu asymetrii i kurtozy (kolejny moment centralny)
Normalność - test Jarque-Bera
Testowane są hipotezy:
H 0 : składnik losowy ma rozkład normalny
przy hipotezie alternatywnej
H 1 : składnik losowy modelu nie ma rozkładu normalnego
Do oszacowania wartości statystyki Jarque-Bera tego testu wyznaczamy najpierw

n
S = 1 ∑ u 2t
n t=1
Następnie obliczamy :

n
u 3t
1
B 1= ∑ 3
n t=1 S

2
asymetria
4
B2 =
n
ut
1
∑
n t =1 S 4
kurtoza
statystyka Jarque-Bera ma postać:
JB=n

B1  B2−3

6
24
2

JB rozkład chi-kwadrat z dwoma stopniami swobody.
2
Krytyczną wartością testu na poziomie istotności =0,05 odczytaną z tablic wartości rozkładu 
jest liczba : 5,991
Jeżeli
JB ≥5,991
to hipotezę H 0 o normalności rozkładu składnika losowego należy odrzucić
13
Przykład:
H 0 składnik losowy modelu ma rozkład normalny
H 1 składnik losowy modelu nie ma rozkładu normalnego
robimy tabelkę w arkuszu
u
u 2 u3 u 4
sumy: 3,71 -0,79 3,19
zatem

n
// z którego przykładu ??

S = 1 ∑ u 2t = 3,71 =0,556
n t=1
12

2


2
n
n
u 3t
1
1
3
B 1= ∑ 3 =
u = 0,147
3∑ t
n t=1 S
n S t=1
4
n
n
u
1
1
1
B2 = ∑ t4 = 4 ∑ u 4t =
⋅3,19 = 2,782
n t =1 S n S t=1
12⋅0,5564
ostatecznie otrzymujemy
B 1  B 2−32
JB =n  
=0,318
6
24
Ponieważ JB<5,991 nie ma podstaw do odrzucenia hipotezy zerowej głoszącej o normalności rozkładu
składnika losowego.
Możemy przyjąć, że rozkład jest normalny
dotąd na 3+ :)
Co to jest prognozowanie
Prognozowanie to przewidywanie przyszłych zdarzeń, a jego celem jest zmniejszenie ryzyka w
procesie podejmowania decyzji.
Funkcje prognozowania:
– tworzenie przesłanek do podejmowania decyzji
– aktywizująca
– informacyjna – przygotowuje nas na zmiany
Prognozy muszą być wiarygodne
Dokładność prognoz
Wyróżniamy dwa rodzaje mierników dokładności predykcji, a mianowicie:
•
mierniki dokładności ex ante (oceny błędu ex ante)
•
mierniki dokładności ex post (błędy ex post) // mówią o dokładności modelu
Zasada predykcji nieobciążonej
Zasada predykcji nieobciążonej polega na tym, że:
y Tp =E Y T 
T-horyzont prognozy
Y T zmienna prognozowana
y Tp prognoza zmiennej Y T w okresie T
E Y T  wartość oczekiwana rozkładu zmiennej prognozowanej Y T w okresie T
14
p
y T =E Y T / f  y t 
Własność zasady predykcji nieobciążonej dana jest wzorami:
E Y T − yTp =0
2
p 2
V =E Y T − y T   min
Zasada predykcji oparta na przedziale ufności
p
.. można sformułować w postaci następującej reguły – należy wskazać taki przedział I T aby
zachodziła równość
p
P  y T ∈I T =1− ; 1−≥0,90
p
gdzie I T – przedział predykcji
 poziom istotności ( 1− wiarygodność predykcji)
y T wartość zmiennej prognozowanej Y T w okresie T
Prognozowanie na podstawie klasycznych modeli trendu
W szeregach czasowych można wyróżnić dwie składowe:
•
składową systematyczną
•
składową przypadkową (zwaną też składnikiem losowym lub wahaniami przypadkowymi)
Składowa systematyczna może wystąpić w postaci
1. Trendu
2. Stałego (średniego) poziomu
3. Składowej periodycznej:
 wahania cykliczne, np tygodniowe
 wahania sezonowe (roczne)
Model tendencji rozwojowej
... można zapisać ogólnie
y t= F [ f t  , i t  ,t ]
gdzie f(t) – funkcja trendu
i t – wahania periodyczne,
 t – wahania przypadkowe
Jeżeli powiązania między składowymi szeregu czasowego są typu
n
y t= f t∑  i tt
i=1
to model nosi nazwę modelu addytywnego
// mówi o bezwzględnie stałych odchyleniach od modelu
w przypadku
n
y t= f t ∏ [1 i t ][1t ]
i=1
// mówimy wyższa o 10% - mówi o względnie stałych odchyleniach od trendu
15
to model nosi nazwę modelu multiplikatywnego
Modele tendencji rozwojowej
Najczęściej stosowane postacie analityczne funkcji trendu
funkcja liniowa
y t= 1⋅t0t
funkcja wykładnicza
y t=e
1⋅t 0t
lub
t
y t=0 1 e
1
funkcja logistyczna
y t=
0
11 e
2 t
 t
// wykres dochodzący
Przykład 2
zał 2 do wykładu
Prognoza punktowa, trend liniowy.
y Tp =a 1⋅T a0
(T=n+1, n+2, ...)
Trend liniowy
liczba studentów w szkole X prognoza na 2007
zatem po oszacowaniu otrzymujemy model
y t=0,770 t10,267u t
czyli z roku na rok ilość studentów rośnie o 0,770 tysiąca (interpretacja a 1 )
Czyli prognoza punktowa na n=12 (2007)
y Tp =12 = 0,770 12+10,267 = 19,503
Spodziewana liczba studentów w 2007 roku wynosi 19,503 tysiąca osób
Wahania sezonowe – model Kleina
Y t = f t 1 V 1t 2 V 2t ...m V mt i
 - to wskaźniki sezonowości
V - to zmienne przyjmujące wartości 0 a 1 w swoim okresie
Dla addytywnych wahań sezonowych zachodzi:
m
∑ i =0
i=1
wtedy więc
m−1
m =−∑ i
i =1
Podstawiając do modelu wyjściowego otrzymujemy:
Y T = f t 1 V 1t −V mt 2 V 2t−V mt ...m−1 V  m−1 t−V mt t
16
w przypadku danych półrocznych (wahań o długości cyklu 2) cała procedura wygląda następująco
Y t =1 t1 V 1t 2 V 2t 0 t
dla modelu zachodzi relacja
m−1
m =−∑ i tzn 2 =−1
i =1
Podstawiając relację do modelu otrzymujemy:
Y t =1 t1 V 1t −V 2t 0t
Model Kleina prognozowanie
Prognoza punktowa
P
Y T =a 1⋅T b⋅V 1T−V 2T a 0
(T=n+1, n+2, ...)
Błąd ex ante prognozy
* // jeszcze wróci
V = X TP D2  a X PS 2u
gdzie X p wektor wartości zmiennych objaśniających w okresie prognozowanym
D 2 a  macierz wariancji i kowariancji estymatorów,
S 2u wariancja resztowa
Przykład 3
przedsiębiorstwo budowlane
zał 2
parametry przy t: interpretacja
Z półrocza na półrocze sprzedaż budowlana przedsiębiorstwa rośnie o 0,375 mln złotych przy czym w
pierwszym półroczu sprzedaż budowlana jest mniejsza o 1,5 mln złotych a w drugim większa o 1,5
mln złotych niż by to wynikało z trendu
Prognoza na 2006:
Y I −2006=0,375⋅11 – 1,510,23 = 12,85 mln zł
Y II −2006=0,375⋅121,510,23 = 16,25 mln zł
czterookresowe są w xero – też będą na kolokwium
wykład ekonometria 3/3 12.12.2006
Predykcja na podstawie liniowego modelu jednorównaniowego
y= X 
Prognoza punktowa
y PT =a1 x 1Ta 2 x 2T...a k x kT a 0
gdzie x 1T , x 2T wartości zmiennych objaśniających w okresie prognozowanym
Błąd ex ante prognozy
17
V = X TP D2  a X PS 2u
X P – wektor wartości zmiennych objaśniających w okresie prognozowanym
Względny błąd prognozy wynosi
V
V *= P⋅100
yT
*
V ≤
Estymacja przedziałowa – przedział ufności
Przedział predykcji na okres lub moment T na podstawie omawianego modelu najczęściej buduje się
symetrycznie wokół prognozy
P  y PT – t  ;n− k⋅V  yT  y TP t  ;n−k⋅V =1−
Wartości zmiennych objaśniających
Ustalenie wartości zmiennych objaśniających w okresie prognozowanym
1. Na poziomie planowanym np wydatki na reklamę.
2. Poprzez zbudowanie odpowiednich funkcji trendu i ich ekstrapolacje.
3. Budowa osobnego modelu ekonometrycznego (przyczynowo-skutkowego)
4. Obliczenie zbioru prognoz zmiennej objaśnianej odpowiadającym różnym praktycznie
możliwym wartościom zmiennych objaśniających w okresie T
NP
Y T =3,45 x 1t −1,55 x 2t 15u t
gdzie
x 1t - dochody ludności w setkach zł
x 2t - cena przeciętna telewizora
Sprawdź czy prognoza jest dopuszczalna na poziomie 5% wiedząc że
S U =1,2 // a we wzorze ma być S 2U :)
a macierz wariancji i kowariancji estymatorów ma postać:
[
0,08
0,06 −0,40
D 2 a= 0,06
0,25 −1,20
−0,40 −1,20 2,00
]
Prognoza dla dochodów
P
0,1
X1T =1,48e ⋅14=6,002=6,00
Prognoza dla ceny:
wzrost 10% więc
P
X 2T=7⋅1,1=7,7
Prognoza dla y:
P
y T =3,45⋅6 – 1,55⋅7,715=23,765
18
Spodziewana sprzedaż telewizorów w 2006 roku wyniesie 23,765 tys. sztuk
Błąd prognozy ex ante

[]
6,0
V = X TP D2  a X PS 2u= [6,0 7,71] [ D2  a ]⋅ 7,7 1,22= 1,96651,44=1,846
1
^ tu wartości
na okres prognozowany!!
V
1,846
*
V = P⋅100 =
⋅100 =7,8
23,765
yT
Rzeczywista realizacja popytu na telewizory odchylać się będzie od postawionej prognozy +_ 1,846
tys sztuk co stanowi 7,8% zmiennej prognozowanej
Nasza prognoza nie jest dopuszczalna.
P 23,765 – 2,228⋅1,846 y T 23,7652,228⋅1,846=1−0,05
P 19,65 y T 27,88=0,95
Z prawdopodobieństwem 95% przedział o końcach (19,65; 27,88) pokryje nieznaną, rzeczywistą
realizację popytu na telewizory w tys. sztuk.
Elastyczność
Niech będzie dany model ekonometryczny
y= f  x1, x 2, ... , x k−1 
Model ten jest odzwierciedleniem relacji między procesami lub zdarzeniami gospodarczymi i
społecznymi
Interpretacja parametrów modeli liniowych – współczynniki proporcjonalności
nieliniowych – informacja jak zmienia się szybkość reakcji w zależności od zmian zmiennej
objaśniającej
Miary elastyczności są jednym ze sposobów wnioskowania na podstawie modeli ekonometrycznych
Elastyczność jest miarą względnych zmian zmiennej endogenicznej wywołanych określonymi,
względnymi zmianami zmiennej objaśniającej.
Jak zmieni się wartość zmiennej endogenicznej, przy założeniu względnej zmiany zmiennej
objaśniającej, lub o ile powinna zmienić się określona zmienna egzogeniczna, aby zmienna objaśniana
wzrosła o „p” procent.
NP firma chce zwiększyć sprzedaż o 10% - o ile trzeba zwiększyć wydatki na marketing?
W zależności od zaistniałej sytuacji lub warunków można wykorzystać
miernik elastyczności klasycznej, do 10%
miernik elastyczności różnicowej, powyżej 10%
miernik elastyczności całkowitej, modele wielorównaniowe
19
Elastyczność klasyczna:
1. Występują małe zmiany zmiennej x tzn  X  0
X
≤0,1
X
2. Zmiany wyróżnionej zmiennej objaśniającej nie wywołują zmian innych zmiennych
Elastyczność klasyczną zmiennej endogenicznej y względem
 xi =
x i definiujemy jako
xi
y
⋅
 xi f  x 1, ... , x k−1
Elastyczność klasyczna przyjmuje różne wartości w zależności od dziedziny modelu
ekonometrycznego zatem często nazywa się ją jako elastyczność punktową
Efekt względnych zmian zmiennej objaśnianej wywołanych określoną zmianą wyróżnionej zmiennej
objaśniającej można wyznaczyć ze wzoru:
 xi
y
= xi
y
xi
Łączny względny wpływ wszystkich zmiennych można zapisać jako
k−1
 xi
y
=∑  xi
y i =1
xi
Przykład 1
str 5 załącznik 2
trzeba znać punkt dziedziny żeby wyznaczyć elastyczność w tym punkcie
 x1 wraz ze wzrostem dochodów ludności o 1% popyt wzrośnie o 0,979% zakładając że dochody
wynoszą 300 a cena 4000 zł (punkt dziedziny dla którego policzone)
 x2 wraz ze wzrostem ceny samochodów o 1% popyt spadnie (zmaleje) o 0,559% zakładając -”-
Założenie: dochody wynoszą 300 a cena 4000:
a) jeżeli dochody ludności wzrosną o 2% popyt wzrośnie o 1,96%
b) zmaleje o 5,17%
c) zakładając zwiększenie dochodów o 2% aby sprzedaż wzrosła o 6% cena powinna zmaleć
przynajmniej o 7,23%
Przykład 2 str 7 zał 2
wykładniki modelu potęgowego są elastycznościami, elastyczności te są stałe w całej dziedzinie
Wraz ze wzrostem wartości maszyn i urządzeń o 1% wartość produkcji wzrośnie o 0,61% przy
założeniu że liczba zatrudnionych nie ulegnie zmianie
Wraz ze wzrostem liczby zatrudnionych o 1% wartość produkcji wzrośnie o 0,32% przy założeniu że
wartość maszyn i urządzeń nie ulegnie zmianie.
Przykład interpretacja:
Jeżeli liczba zatrudnionych spadnie o 3% a wartość maszyn i urządzeń wzrośnie o 5% to wartość
produkcji wzrośnie o 2,09%
Przykład 3 str 7
interpretacja wzoru
wydatki na rozrywkę mają miejsce gdy dochód przekroczy 713,41 zł
20
maksymalny poziom wydatków na rozrywkę wynosi 467,26
# Domek
jeżeli dochody wzrosną o 1% przy poziomie 1000 to wydatki na rozrywkę wzrosną o 3,27%
Jeżeli dochody wzrosną o 1% przy poziomie 3000 to wydatki na rozrywkę wzrosną o 0,86%
Elastyczność cenowa, elastyczność dochodowa
Jeżeli x i są to cena i dochód to mówimy:
 p=−1
to popyt na dane dobro jest popytem neutralnym lub też określany jest jako popyt jednostkowy
 p−1
to popyt elastyczny
 p−1
to popyt nazywamy popytem sztywnym
Przy wysokiej elastyczności dochodowej (dodatniej) rozwój gospodarczy jest czynnikiem korzystnym
dla przedsiębiorstwa
21

Ekonometria Mirosław Wójciak

Transkrypt

Podobne dokumenty

Dodatek – Algorytm k-NN

MIWS_Szacowanie parametrów strukturalnych modelu

Rozwiazanie_zad6a_ przedl_umowyT=200 - e

zmienną zależną

Konspekt – ekonometria część 1, 2 i 3 grudnia 2006 - E-SGH

Etapy procesu badawczego

ekonometria i - E-SGH

Miara odległości obiektów opisanych zmiennymi mierzonymi na

Zadanie Przedluzenie_umowyT=200 - e

AY = BAY •= BAY += BAY •=

Modele regresyjne w analizie wydatków gospodarstw domowych