Ekonometria Mirosław Wójciak
Transkrypt
Ekonometria Mirosław Wójciak
Ekonometria Mirosław Wójciak Literatura obowiązkowa Barczak A, ST. Biolik J, Podstawy Ekonometrii, Wydawnictwo AE Katowice, Katowice 1998 Dziechciarz J. Ekonometria – Metody, przykłady, zadania (wyd. 2) Kukuła K (redaktor naukowy): Wprowadzenie do ekonometrii w przykładach i zadaniach, Wydawnictwo Naukowe PWN, Warszawa 1996 Jajuga K. : Ekonometria – metody i analiza problemów ekonomicznych Borkowski B, Dudek H, Szczęsny W. :Ekonometria – wybrane zagadnienia Ekonometria Jest „unifikacją teorii ekonomii, statystyki i matematyki” (Ragnar Frish, 1926) Zbigniew Pawłowski – ekonometria jest nauką o metodach badania ilościowych prawidłowościach występujących w zjawiskach ekonomicznych za pomocą odpowiednie wyspecjalizowanego aparatu matematyczno –statystycznego. „Ekonometria jest nauką i sztuką stosowania metod statystycznych do mierzenia relacji ekonomicznych” (Gregory C. Chow) Celem ekonometrii jest dokładne rozpoznanie procesów gospodarczych oraz pomoc decydentom i działaczom gospodarczym w przewidywaniu procesów ekonomicznych i sterowaniu nimi. Jak? Ile? Model ekonometryczny Model zawsze musi być lepszą lub gorszą kopią oryginału (Zdzisław Hellwig). Wady, zalety modeli: - z jednej strony prostota modelu ułatwia jego zrozumienie - z drugiej strony – nadmierne upraszczanie rzeczywistości Modelem ekonometrycznym nazywać będziemy konstrukcję formalną, która za pomocą jednego równania bądź też wielu równań odwzorowuje zasadnicze powiązania ilościowe zachodzące między badanymi zjawiskami (Zbigniew Pawłowski). Budowa tego modelu jest bardzo skomplikowana Jednorównaniowy model ekonometryczny y t= f x 1t , x 2t ,... , x k−1 ; t Gdzie: y t - zmienna objaśniana inaczej endogeniczna (zależna) x 1t , x 2t , ... , x k −1 – zmienne objaśniające inaczej zmienne egzogeniczne (niezależne) - ksi - składnik losowy f- postać analityczna modelu, np.: postać liniowa, potęgowa Liniowa postać analityczna modelu: 1 y t= 1 x 1t 1 x 1t ...1 x 1t 0t część deterministyczna | część stochastyczna Gdzie: i – parametry strukturalne modelu Elementy modelu ekonometrycznego - Zmienne objaśniane – elementy które są wyjaśniane przez poszczególne równania modelu - zmienne objaśniające – zmienne użyte do opisu, wyjaśnienie zmiennych endogemicznych - składnik losowy- parametry strukturalne – są to wartości wyrażające ilościowy wpływ danej zmiennej przy której występują na zmienną endogeniczną. - parametry struktury stochastycznej – są to parametry składnika losowego – wariancja ,autokorelacja Zmienne opóźnione – lub jednego okresu Składnik losowy w modelu wynika z konieczności uwzględniania: - wpływu wszystkich zmiennych, które wpływają na zmienną endogeniczną nie ujętych w modelu, - różnic między przyjętą postacią analityczną modelu, a istniejącą zależnością w rzeczywistości, - błędy pomiarów zmiennych - czynników losowych wpływających na zmienną endogeniczną. Specyfikacja modelu ekonometrycznego to: - sprecyzowanie zmiennych objaśniających - sprecyzowanie zmiennych objaśnianych (endogenicznych) - podjęcie decyzji co do charakteru występujących w modelu związków pomiędzy zmiennymi m. in. postać analityczna. Specyfikacja modelu ekonometrycznego opiera się na informacjach a priori oraz informacjach pochodzących z badań empirycznych. Przykład 1 Zbudujmy model ekonometryczny popytu na nowe samochody segmentu B. Wyspecyfikujmy zmienną endogeniczną oraz zmienne objaśniające. y t - popyt na nowe samochody segmentu B w szt x 1t - średnia cena nowego samochodu segmentu B w zł x 2t – dochody ludności na osobą w zł x 3t – cena benzyny (ceny dóbr komplementarnych) w zł x 4t – cena przejazdu publicznymi środkami lokomocji za 1 km w zł (ceny dóbr substytucyjnych) y t−1 – popyt na nowe samochody segmentu B w poprzednim roku w szt., t ..- składnik losowy f- postać analityczna modelu np. postać potęgowa y t= x1t⋅x 2t⋅...⋅y t−1⋅e 1 2 5 t Etapy budowy modelu ekonometrycznego 1.Wyznaczenie celu i zakresu badania Etap 1 – specyfikacja modelu – określenie zmiennych – najtrudniejszy 2 Etap 2 – przygotowanie odpowiedniej bazy danych (zbiór danych statystycznych)- na ich podstawie – parametry Etap 3 – estymacja parametrów modelu – (zastosowanie ekonometrii) Etap 4 – weryfikacja oszacowanego modelu pod względem formalnym (czy są spełnione założenia) i merytorycznym Etap 5 – praktyczne wykorzystanie modelu ekonometrycznego Klasyfikacja modeli ekonometrycznych 1 Klasyfikacja modeli ekonometrycznych ze względu na postać analityczną - liniowe - nieliniowe sprowadzalne do liniowych (potęgowe) - nieliniowe niesprowadzalne do liniowych 2 Ze względu na udział czynnika czasu: - statyczne - dynamiczne – to takie modele w którym występują zmienne opóźnione w czasie lub zmienna czasowa t 3 Ze względu na poznawcze cechy modelu: - modele przyczynowo-skutkowe – opisowe, (np, wzrost ceny - przyczyna, spadek sprzedaży - skutek) - modele symptomatyczne - modele tendencji rozwojowych – (inaczej funkcje trendu) jedyną zmienną objaśniającą jest zmienna czasowa Dane statystyczne w badaniach ekonometrycznych Dane statystyczne wykorzystane w modelowaniu ekonometrycznym powinny charakteryzować się: - dokładnością – brak błędu powtarzalnego, - wiarygodnością – muszą odzwierciedlać rzeczywisty stan, - porównywalnością – - kompletnością – brak braku danych Rodzaje danych statystycznych Dane statystyczne typu: - makroekonomicznego - mikroekonomicznego Dane o charakterze: - dane przekrojowe y i - szeregi czasowe y t - dane przekrojowo – czasowe y ti np w różnych województwach od roku2003 do 2005 Liczba zmiennych egzogenicznych: Czy powinno się wprowadzić jak najwięcej zmiennych czy tez zbiór ten ograniczyć do najważniejszych cech? Wstępnie ustalony zbiór zmiennych musi podlegać selekcji ze względu na: - kryteria oceny merytoryczno-formalnych własności zmiennych - kryteria wartości informacyjnej zmiennych Pożądane własności zmiennych objaśniających 3 Zmienne objaśniające powinny charakteryzować się następującymi własnościami: - zapewnienie dostatecznie dużej zmienności (czasowej lub przestrzennej) - są nieskorelowane lub co najwyżej słabo skorelowane między sobą (postulat braku redundancji) - są silnie skorelowane ze zmienną objaśnianą. R i R0 Macierz Współczynniki korelacji między zmiennymi objaśniającymi, a zmienną objaśnianą oznaczymy jako r 0j i tworzą one wektor R0 Współczynniki korelacji pomiędzy zmiennymi objaśniającymi oznaczymy jako r ij i tworzą one macierz R. [] [ r 01 R0= r 02 .. r 0q 1 r 12 R= r 21 1 .. .. r q1 r q2 tu współczynniki powinny być jak największe, .. r 1q .. r 2q .. .. .. 1 ] a tu jak najmniejsze @@ Zad. Dom I i II rozdział. Barczak Metoda Z. Hellwiga Nośnikiem informacji o zmiennej endogenicznej jest potencjalna zmienna objaśniająca. Pojemnością indywidualnego nośnika informacji jest wyrażenie: r 20j h kj = pk 1∑ ∣r ij∣ // od i =1 do ?? i=1 h kj ∈〈0 ; 1〉 Gdzie r oj – współczynnik korelacji liniowej między Y a x j r ij – współczynnik korelacji liniowej między x i a x j Pojemnością integralną k tej kombinacji potencjalnych zmiennych objaśniających jest wyrażenie: pk H k =∑ h k , dla k =1,2 , ... , L , H k ∈〈0,1〉 j=1 Liczba możliwych kombinacji potencjalnych zmiennych objaśniających jest równa: L=2 p−1 Pojemności integralna stanowi kryterium wyboru odpowiedniego zestawu zmiennych objaśniających. Wady metody Z. Hellwiga (optymalnego wyboru predykant) - pracochłonności obliczeń np. przy 5 potencjalnych zmiennych objaśniających jest do sprawdzenia już 31 kombinacji Zalety metody optymalnego wyboru predyktant 4 - metoda jednoznacznie wskazuje na najlepszą kombinacją spośród wszystkich możliwych kombinacji @@ Dom – rozdział 3 Barczak Uwagi wstępne – KMNK Wyrażenia klasyczna metoda najmniejszych kwadratów KMNK będziemy używali w odniesieniu do metody szacowania parametrów strukturalnych modelu liniowego y i=1 x 1i 2 x 2i ...k x ki 0 i ; i=1,2 , ... , n Będziemy używać następujących oznaczeń: y i – i –ta obserwacja zmiennej objaśnianej x ji – i –ta obserwacja j-tej zmiennej objaśniającej [] [] [ y1 Y = y2 .. yn x11 X = x12 .. x 1n 1 = 2 .. n 1 2 = .. k 0 x 21 x 22 .. x 2n ... ... ... ... x k1 x k2 .. x kn 1 1 1 1 x 26 to 6 obserwacja 2 zmiennej ] [] Przy tych oznaczeniach jednorównaniowy liniowy model ekonometryczny może być zapisany jako: Y =X⋅ Założenia KMNK Zastosowanie KMNK wymaga przyjęcia następujących założeń: 1.postać modelu jest liniowa względem parametrów (lub sprowadzalna do liniowej), 2.zmienne objaśniające są wielkościami nielosowymi (z góry ustalone – musimy je znać) 3.zmienne objaśniające są niezależne i wolne od współliniowości –nie istnieje między zmiennymi dokładna zależność liniowa 4. r X =k ≤ n (X- macierz obserwacji na zmiennych objaśniających) – warunek na liczebność i współliniowość próby, jeżeli 3 i 4 nie zostanie spełnione 5. E =0 , czyli składniki losowe dla wszystkich obserwacji mają wartości oczekiwane równe zero T 6. E = 2 I , czyli składnik losowy dla każdej obserwacji ma skończoną wariancję 2 , natomiast cov i , j =0 7. składnik losowy nie jest skorelowany ze zmiennymi objaśniającymi IE Estymacja parametrów modelu liniowego KMNK Część deterministyczna modelu ekonometrycznego wyznacza nam wartości teoretyczną zmiennej y. Zapiszmy model jako: 5 Y =X⋅ Y =X⋅a S=Y −Xa T Y − Xa min Trzeba wyznaczyć taki wektor a, dla którego powyższa funkcja osiągnie minimum Otrzymujemy następujący estymator wektora a: a= X T X −1 X T Y wektor a jest nazywany wektorem ocen parametrów Postać modelu można zapisać jako: y i=a1 x 1i a 2 x 2i ...a k x ki a 0 Lub y i=a1 x 1i a 2 x 2i ...a k x ki a 0ui gdzie u i= y i− y i Wartość oceny a j - interpretacja (parametry a informują o ile zmieni się y jeżeli ... Własności estymatora KMNK Przy spełnionych założeniach estymatory liniowe uzyskane KMNK są: - zgodne - wraz ze wzrostem próby maleje błąd szacunku - nieobciążone – estymator nie wykazuje błędów - najefektywniejsze – mają najmniejszą wariancję, są najbardziej precyzyjne Z macierzą wariancji i kowariancji daną wzorem: D 2 a= 2 X T X −1 Założenia KMNK a własności estymatora: - jeżeli zmienne objaśniające są współliniowe, to nie istnieje estymator KMNK - jeżeli wariancja składnika losowego nie jest stała to estymator nie jest najefektywniejszy - jeżeli składnik losowy jest zależny: cov t , t ≠0 , a w zbiorze zmiennych objaśniających nie ma Y t − .. to estymator KMNK nie jest najefektywniejszy - jeżeli składnik losowy jest zależny: cov t , t ≠0 , a w zbiorze zmiennych objaśniających występuje Y t − . To estymator KMNK nie jest zgodny - jeżeli wariancja składnika losowego jest funkcją zmiennych objaśniających, to estymator KMNK nie jest zgodny. Estymacja parametrów struktury stochastycznej Innymi słowy miary dopasowania modelu do danych empirycznych. 1. nieobciążonym estymatorem wariancji składnika losowego jest wariancja resztowa zdefiniowana następującym wzorem: 6 S 2u = n n 1 1 ∑ y − y 2= n−k ∑ ui2 n−k i=1 i i i =1 Lub wyrażona wzorem macierzowym: 2 Su= 1 [ Y T Y −Y T X a ] n−k Y T Y =∑ y 2 Y T X = X T Y T 2. odchylenie resztowe (odchylenie standardowe składnika losowego) zdefiniowane jako: S u = S 2u 3. współczynnik zmienności przypadkowej (wyrazistości) zdefiniowany jako: Su ⋅100 y interpretacja ... Jeśli wartość V u nie przekracza wartości V* (np. 10%), to przyjmuje się, że model jest dopuszczalny V u= 4. współczynnik zbieżności zdefiniowany jako: n ∑ y i− yi 2 2= i =1 n 2∈〈 0 ; 1〉 ∑ y i− yi 2 i =1 interpretacja: 2= n−k ⋅S 2u 2 n⋅S y = ∑ ui2 2 2 ∑ yi ∑y− i n 5. współczynnik determinacji (jaką część można wyjaśnić) zdefiniowany jako: R2=1−2 R2 ∈〈 0 ; 1〉 6. Macierz wariancji i kowariancji ocen parametrów szacuje się na podstawie: D 2 a=S 2u X T X −1 W macierzy tej na głównej przekątnej są wariancje ocen parametrów D2 a j D a j = D2 a j interpretacja ... I tu pewnie był przykład 1 na szacowanie parametrów strukturalnych modelu ekonometrycznego //zał 1 str. 4 Ekonometria wykład 2/3 28.10.2006 7 Weryfikacja modelu 1. Testowanie istotności parametrów strukturalnych - testowanie istotności parametrów testem t-Studenta - testowanie istotności parametrów testem Fischera-Snedecora ( za pomocą współczynnika korelacji wielorakiej) 2. Analiza własności reszt, - autokorelacja składnika losowego - jednorodność wariancji składnika losowego - normalność składnika losowego Test t-Studenta na istotność parametrów Jeżeli spełnione są założenia KMNK to sprawdzianem hipotezy zerowej H 0 : j =0 wobec hipotezy alternatywnej H 1 : j ≠0 // jest istotny jest statystyka t-Studenta o n-k stopniach swobody t j= a j− j ; j=1,2 , ... , k D a j gdzie a j - ocena parametru strukturalnego j D a j - błąd szacunku parametru j jeżeli wartość statystyki: ∣t j∣ >= t , n−k gdzie t , n−k wartość krytyczna odczytana z tablic t-Studenta to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej. jeżeli ∣t j∣ < t , n−k to brak podstaw do odrzucenia hipotezy zerowej Przyczyny nieistotności parametrów strukturalnych: • • • • • • brak zależności pomiędzy X j i Y mała dokładność lub nieodpowiednia jakość danych statystycznych mało liczna próba przyjęta niewłaściwa postać analityczna modelu pominięcie w modelu innych ważnych zmiennych objaśniających okoliczności przypadkowe, wynikające z losowości próby przykład 1 Zbadaj czy dochody ludności i średnia cena nowego samochodu istotnie kształtują popyt na samochody? model z przykładu 1: y t=1,470 x1t −0,629 x 2t 2,609u t gdzie y t popyt w tys, x 1 dochody w setkach, x 2 średnia cena samochodu tzn: Sprawdź istotność parametrów stojących przy zmiennych x 1 i x 2 we wzorze są to 1 i 2 . 8 badamy zatem parametr 1 ( dochody) H 0 : 1=0 wobec hipotezy alternatywnej obliczamy wartość statystyki t-Studenta: t s= a j − j 1,470−0 = 0,217 = 6,774 D a j // skąd mamy 0,217 ?? nie mam tego przykładu t 0,05;12−3=2,262 wartość statystyki jest większa od wartości krytycznej |6,774|>2,262 więc hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej. co oznacza, że parametr jest statystycznie istotny a więc dochody ludności istotnie kształtują popyt na samochody i analogicznie 2 |-3,901| hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej, czyli parametr jest statystycznie istotny, a więc średnia cena nowego samochodu kształtuje popyt na samochody. Test Fischera-Snedecora istotności współczynnika korelacji wielorakiej. H 0 : R w =0 H 1 : R w0 współczynnik jest istotny // > Sprawdzianem jest statystyka postaci: R 2 n−k F= 2. 1−R k −1 Statystyka F ma rozkład F Fischera-Snedecora o (k-1) i (n-k) stopniach swobody. Jeżeli wartość statystyki F ≥F ;k −1, n−k gdzie F ;k −1, n−k wartość odczytana z tablic dystrybuanty rozkładu F Fischera-Snedecora o (k-1) i (nk) stopniach swobody oraz to hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej. Jeżeli F F ;k −1, n−k To nie ma podstaw do odrzucenia hipotezy zerowej Test F Fischera-Snedecora istotności współczynnika korelacji wielorakiej przykład: Sprawdź czy model dostatecznie opisuje sprzedaż samochodów. H 0 : R w =0 H 1 : R w0 9 F= R 2 n−k 0,945 12−3 = . =77,318 2. k−1 1−0,945 3−1 1−R F 0,05;2;9 = 4,26 77,318>4,26 Hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej. Model statystycznie istotnie opisuje sprzedaż samochodów Autokorelacja składnika losowego Na ogół autokorelację można wyrazić w postaci relacji: t= f t −1 , t −2 , ... , t − W związku z tym spełniona jest zależność T ≠2 I W praktyce przyjmuje się na ogół funkcję liniową, a maksymalne opóźnienie czasowe wynosi jeden lub dwa t=1 t−1t autokorelacja rzędu pierwszego Estymator współczynnika autokorelacji rzędu dany jest wzorem: n ∑ r = t =1 u . ut − n , r należy <-1;1> 2 t ∑u t =1 // pierwszego rzędu to jest jeden autokorelacja (...) - przyczyny 1. Błędy specyfikacji równania. – pominięcie ważnej zmiennej objaśniającej – błąd specyfikacji statycznej – pominięcie właściwego opóźnienia zmiennej objaśniającej, a w szczególności zmiennej objaśnianej – błąd specyfikacji dynamicznej, – niewłaściwa postać funkcyjna równania. Badanie autokorelacji – test Durbina-Watsona Hipoteza zerowa H 0 : 1=0 Hipoteza alternatywna: H 1 : 1 0 // lub 10 w zależności od d Sprawdzianem hipotezy zerowej jest statystyka n ∑ u t −u t−12 d = t =2 n ∑u t=1 , d ∈〈 0 ; 4〉 2 t // dopiero po policzeniu wartości statystyki wybieramy hipotezę alternatywną !! jeżeli d>2 to hipoteza przyjmuje postać 10 i należy obliczyć d' ze wzoru 10 d'=4-d bo tablice D-W są od 0 do 2 jeżeli d<2 to hipoteza przyjmuje postać 10 wtedy d' nie liczymy Rozkład sprawdzianu d przy założeniu, że H 0 jest prawdziwa i składniki losowe mają rozkład normalny N 0, zależy od: n-liczba obserwacji, K-liczba zmiennych objaśniających !!!!//duże k Z tablic wartości krytycznych testu D-W odczytuje się d L i d U dwie wartości krytyczne Kiedy d<2, czyli hipoteza alternatywna przyjmuje postać 10 mamy możliwe sytuacji 1. d ≤d L to hipotezę zerową odrzucamy, - korelacja występuje 2. d L d d U to nie można podjąć decyzji czy autokorelacja jest istotna czy nie 3. d U ≤d to nie ma podstaw do odrzucenia hipotezy zerowej Kiedy d>2 czyli hipoteza alternatywna przyjmuje postać 10 mamy możliwe sytuacje: 4. d ' ≤d L to hipotezę zerową odrzucamy, - korelacja występuje 5. d Ld ' d U to nie można podjąć decyzji czy autokorelacja jest istotna czy nie 6. d U ≤d ' to nie ma podstaw do odrzucenia hipotezy zerowej Test Durbina-Watsona jest testem trójstronnym (posiada tzw. obszar niekonkluzywności – nie można podjąć decyzji) Pomiędzy estymatorem r 1 a statystyką Durbina-Watsona d zachodzi relacja: d ≈2 1−r 1 W przypadku stwierdzenia autokorelacji mamy możliwości: • • • usunąć przyczyny autokorelacji zastosować procedury estymacji w warunkach autokorelacji (np uogólnioną metodę najmniejszych kwadratów) pozostać przy metodzie najmniejszych kwadratów godząc się z mniejszą efektywnością estymatorów Test D-W przykład Zbadaj czy występuje autokorelacja składnika losowego w modelu sprzedaży samochodów po obliczeniu statystyki d=2,741 d'=1,259 n=12 i K=2 liczba zmiennych objaśniających d L =0,812 d U = 1,579 XERO Kukuła s. 58 zrobić ponieważ <d' < to nie można podjąć decyzji czy autokorelacja jest istotna czy nie (powinniśmy zastosować inny test na badanie autokorelacji) 11 oszacujemy estymator r 1 ze wzoru: n ∑ u t . ut −1 r 1= t =2 n ∑ u 2t = −1,60 =−0,431 3,71 t=1 Jednorodność wariancji W związku z tym spełniona jest zależność T = 2i I 2 i =k i. // w związku z czym? // równe czy różne 2 gdzie k i współczynniki wyrażenia zmienności wariancji składnika losowego dla i-tej obserwacji (i=1,2, ... n) Jednorodność wariancji – test Goldfelda-Quandta W teście tym próbę statystyczną dzieli się na dwie pod próby ( n 1 i n 2 ) tak, że: 1. n 1n 2=n tzn wszystkie obserwacje z próby statystycznej są uwzględnione lub 2. n 1n 2n (liczba pominiętych obserwacji nie może przekraczać 1/3 obserwacji 0,33n) //jeśli liczba n jest parzystą to nie pomija się żadnej?? //(na kolokwium poda jak ma być dzielona próba) generalnie przyjmujemy że n 1=n 2 Dla obu pod prób szacowane są parametry strukturalne modelu Dla tak oszacowanych modeli liczy się wariancje resztowe S 2u1 i S 2u2 // i stosujemy zwykły test Fischera-Stedeckora na równość wariancji ( nie było?) W teście Goldfelda-Quandta weryfikujemy hipotezę: H 0 : 21=22 wobec hipotezy alternatywnej H 1 : 1222 Jeżeli prawdziwa jest hipoteza zerowa wówczas stosunek wariancji reszt S 2u1 F= 2 S u2 ma rozkład F Fischera-Snedecora o m 1=n 2−k i m 2 =n 1−k stopniach swobody Jeżeli F ≥F ;m1 , m2 to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej. Przykład 1 Próbę statystyczną podzielono na n 1=5i n2=5 Dla obu pod prób oszacowano modele S 2u1=0,338 S 2u2=1,053 //zał 2 do wykładu 2 12 F= 3,115 F 0,05 ,5−1,5−3=19,0 3,115 < 19 nie ma podstaw do odrzucenia hipotezy zerowej, możemy przyjąć że wariancje w obu podpróbach n 1 i n 2 są równe. Oznacza to że wariancja jest jednorodna. Normalność Poprawna interpretacja testu F i testu t – czyli testów istotności zmiennych objaśniających jest możliwa pod warunkiem przyjęcia założenia stwierdzającego że rozkład składnika losowego modelu jest rozkładem normalnym - N 0, w tym celu użyjemy testu asymetrii i kurtozy (kolejny moment centralny) Normalność - test Jarque-Bera Testowane są hipotezy: H 0 : składnik losowy ma rozkład normalny przy hipotezie alternatywnej H 1 : składnik losowy modelu nie ma rozkładu normalnego Do oszacowania wartości statystyki Jarque-Bera tego testu wyznaczamy najpierw n S = 1 ∑ u 2t n t=1 Następnie obliczamy : n u 3t 1 B 1= ∑ 3 n t=1 S 2 asymetria 4 B2 = n ut 1 ∑ n t =1 S 4 kurtoza statystyka Jarque-Bera ma postać: JB=n B1 B2−3 6 24 2 JB rozkład chi-kwadrat z dwoma stopniami swobody. 2 Krytyczną wartością testu na poziomie istotności =0,05 odczytaną z tablic wartości rozkładu jest liczba : 5,991 Jeżeli JB ≥5,991 to hipotezę H 0 o normalności rozkładu składnika losowego należy odrzucić 13 Przykład: H 0 składnik losowy modelu ma rozkład normalny H 1 składnik losowy modelu nie ma rozkładu normalnego robimy tabelkę w arkuszu u u 2 u3 u 4 sumy: 3,71 -0,79 3,19 zatem n // z którego przykładu ?? S = 1 ∑ u 2t = 3,71 =0,556 n t=1 12 2 2 n n u 3t 1 1 3 B 1= ∑ 3 = u = 0,147 3∑ t n t=1 S n S t=1 4 n n u 1 1 1 B2 = ∑ t4 = 4 ∑ u 4t = ⋅3,19 = 2,782 n t =1 S n S t=1 12⋅0,5564 ostatecznie otrzymujemy B 1 B 2−32 JB =n =0,318 6 24 Ponieważ JB<5,991 nie ma podstaw do odrzucenia hipotezy zerowej głoszącej o normalności rozkładu składnika losowego. Możemy przyjąć, że rozkład jest normalny dotąd na 3+ :) Co to jest prognozowanie Prognozowanie to przewidywanie przyszłych zdarzeń, a jego celem jest zmniejszenie ryzyka w procesie podejmowania decyzji. Funkcje prognozowania: – tworzenie przesłanek do podejmowania decyzji – aktywizująca – informacyjna – przygotowuje nas na zmiany Prognozy muszą być wiarygodne Dokładność prognoz Wyróżniamy dwa rodzaje mierników dokładności predykcji, a mianowicie: • mierniki dokładności ex ante (oceny błędu ex ante) • mierniki dokładności ex post (błędy ex post) // mówią o dokładności modelu Zasada predykcji nieobciążonej Zasada predykcji nieobciążonej polega na tym, że: y Tp =E Y T T-horyzont prognozy Y T zmienna prognozowana y Tp prognoza zmiennej Y T w okresie T E Y T wartość oczekiwana rozkładu zmiennej prognozowanej Y T w okresie T 14 p y T =E Y T / f y t Własność zasady predykcji nieobciążonej dana jest wzorami: E Y T − yTp =0 2 p 2 V =E Y T − y T min Zasada predykcji oparta na przedziale ufności p .. można sformułować w postaci następującej reguły – należy wskazać taki przedział I T aby zachodziła równość p P y T ∈I T =1− ; 1−≥0,90 p gdzie I T – przedział predykcji poziom istotności ( 1− wiarygodność predykcji) y T wartość zmiennej prognozowanej Y T w okresie T Prognozowanie na podstawie klasycznych modeli trendu W szeregach czasowych można wyróżnić dwie składowe: • składową systematyczną • składową przypadkową (zwaną też składnikiem losowym lub wahaniami przypadkowymi) Składowa systematyczna może wystąpić w postaci 1. Trendu 2. Stałego (średniego) poziomu 3. Składowej periodycznej: wahania cykliczne, np tygodniowe wahania sezonowe (roczne) Model tendencji rozwojowej ... można zapisać ogólnie y t= F [ f t , i t ,t ] gdzie f(t) – funkcja trendu i t – wahania periodyczne, t – wahania przypadkowe Jeżeli powiązania między składowymi szeregu czasowego są typu n y t= f t∑ i tt i=1 to model nosi nazwę modelu addytywnego // mówi o bezwzględnie stałych odchyleniach od modelu w przypadku n y t= f t ∏ [1 i t ][1t ] i=1 // mówimy wyższa o 10% - mówi o względnie stałych odchyleniach od trendu 15 to model nosi nazwę modelu multiplikatywnego Modele tendencji rozwojowej Najczęściej stosowane postacie analityczne funkcji trendu funkcja liniowa y t= 1⋅t0t funkcja wykładnicza y t=e 1⋅t 0t lub t y t=0 1 e 1 funkcja logistyczna y t= 0 11 e 2 t t // wykres dochodzący Przykład 2 zał 2 do wykładu Prognoza punktowa, trend liniowy. y Tp =a 1⋅T a0 (T=n+1, n+2, ...) Trend liniowy liczba studentów w szkole X prognoza na 2007 zatem po oszacowaniu otrzymujemy model y t=0,770 t10,267u t czyli z roku na rok ilość studentów rośnie o 0,770 tysiąca (interpretacja a 1 ) Czyli prognoza punktowa na n=12 (2007) y Tp =12 = 0,770 12+10,267 = 19,503 Spodziewana liczba studentów w 2007 roku wynosi 19,503 tysiąca osób Wahania sezonowe – model Kleina Y t = f t 1 V 1t 2 V 2t ...m V mt i - to wskaźniki sezonowości V - to zmienne przyjmujące wartości 0 a 1 w swoim okresie Dla addytywnych wahań sezonowych zachodzi: m ∑ i =0 i=1 wtedy więc m−1 m =−∑ i i =1 Podstawiając do modelu wyjściowego otrzymujemy: Y T = f t 1 V 1t −V mt 2 V 2t−V mt ...m−1 V m−1 t−V mt t 16 w przypadku danych półrocznych (wahań o długości cyklu 2) cała procedura wygląda następująco Y t =1 t1 V 1t 2 V 2t 0 t dla modelu zachodzi relacja m−1 m =−∑ i tzn 2 =−1 i =1 Podstawiając relację do modelu otrzymujemy: Y t =1 t1 V 1t −V 2t 0t Model Kleina prognozowanie Prognoza punktowa P Y T =a 1⋅T b⋅V 1T−V 2T a 0 (T=n+1, n+2, ...) Błąd ex ante prognozy * // jeszcze wróci V = X TP D2 a X PS 2u gdzie X p wektor wartości zmiennych objaśniających w okresie prognozowanym D 2 a macierz wariancji i kowariancji estymatorów, S 2u wariancja resztowa Przykład 3 przedsiębiorstwo budowlane zał 2 parametry przy t: interpretacja Z półrocza na półrocze sprzedaż budowlana przedsiębiorstwa rośnie o 0,375 mln złotych przy czym w pierwszym półroczu sprzedaż budowlana jest mniejsza o 1,5 mln złotych a w drugim większa o 1,5 mln złotych niż by to wynikało z trendu Prognoza na 2006: Y I −2006=0,375⋅11 – 1,510,23 = 12,85 mln zł Y II −2006=0,375⋅121,510,23 = 16,25 mln zł czterookresowe są w xero – też będą na kolokwium wykład ekonometria 3/3 12.12.2006 Predykcja na podstawie liniowego modelu jednorównaniowego y= X Prognoza punktowa y PT =a1 x 1Ta 2 x 2T...a k x kT a 0 gdzie x 1T , x 2T wartości zmiennych objaśniających w okresie prognozowanym Błąd ex ante prognozy 17 V = X TP D2 a X PS 2u X P – wektor wartości zmiennych objaśniających w okresie prognozowanym Względny błąd prognozy wynosi V V *= P⋅100 yT * V ≤ Estymacja przedziałowa – przedział ufności Przedział predykcji na okres lub moment T na podstawie omawianego modelu najczęściej buduje się symetrycznie wokół prognozy P y PT – t ;n− k⋅V yT y TP t ;n−k⋅V =1− Wartości zmiennych objaśniających Ustalenie wartości zmiennych objaśniających w okresie prognozowanym 1. Na poziomie planowanym np wydatki na reklamę. 2. Poprzez zbudowanie odpowiednich funkcji trendu i ich ekstrapolacje. 3. Budowa osobnego modelu ekonometrycznego (przyczynowo-skutkowego) 4. Obliczenie zbioru prognoz zmiennej objaśnianej odpowiadającym różnym praktycznie możliwym wartościom zmiennych objaśniających w okresie T NP Y T =3,45 x 1t −1,55 x 2t 15u t gdzie x 1t - dochody ludności w setkach zł x 2t - cena przeciętna telewizora Sprawdź czy prognoza jest dopuszczalna na poziomie 5% wiedząc że S U =1,2 // a we wzorze ma być S 2U :) a macierz wariancji i kowariancji estymatorów ma postać: [ 0,08 0,06 −0,40 D 2 a= 0,06 0,25 −1,20 −0,40 −1,20 2,00 ] Prognoza dla dochodów P 0,1 X1T =1,48e ⋅14=6,002=6,00 Prognoza dla ceny: wzrost 10% więc P X 2T=7⋅1,1=7,7 Prognoza dla y: P y T =3,45⋅6 – 1,55⋅7,715=23,765 18 Spodziewana sprzedaż telewizorów w 2006 roku wyniesie 23,765 tys. sztuk Błąd prognozy ex ante [] 6,0 V = X TP D2 a X PS 2u= [6,0 7,71] [ D2 a ]⋅ 7,7 1,22= 1,96651,44=1,846 1 ^ tu wartości na okres prognozowany!! V 1,846 * V = P⋅100 = ⋅100 =7,8 23,765 yT Rzeczywista realizacja popytu na telewizory odchylać się będzie od postawionej prognozy +_ 1,846 tys sztuk co stanowi 7,8% zmiennej prognozowanej Nasza prognoza nie jest dopuszczalna. P 23,765 – 2,228⋅1,846 y T 23,7652,228⋅1,846=1−0,05 P 19,65 y T 27,88=0,95 Z prawdopodobieństwem 95% przedział o końcach (19,65; 27,88) pokryje nieznaną, rzeczywistą realizację popytu na telewizory w tys. sztuk. Elastyczność Niech będzie dany model ekonometryczny y= f x1, x 2, ... , x k−1 Model ten jest odzwierciedleniem relacji między procesami lub zdarzeniami gospodarczymi i społecznymi Interpretacja parametrów modeli liniowych – współczynniki proporcjonalności nieliniowych – informacja jak zmienia się szybkość reakcji w zależności od zmian zmiennej objaśniającej Miary elastyczności są jednym ze sposobów wnioskowania na podstawie modeli ekonometrycznych Elastyczność jest miarą względnych zmian zmiennej endogenicznej wywołanych określonymi, względnymi zmianami zmiennej objaśniającej. Jak zmieni się wartość zmiennej endogenicznej, przy założeniu względnej zmiany zmiennej objaśniającej, lub o ile powinna zmienić się określona zmienna egzogeniczna, aby zmienna objaśniana wzrosła o „p” procent. NP firma chce zwiększyć sprzedaż o 10% - o ile trzeba zwiększyć wydatki na marketing? W zależności od zaistniałej sytuacji lub warunków można wykorzystać miernik elastyczności klasycznej, do 10% miernik elastyczności różnicowej, powyżej 10% miernik elastyczności całkowitej, modele wielorównaniowe 19 Elastyczność klasyczna: 1. Występują małe zmiany zmiennej x tzn X 0 X ≤0,1 X 2. Zmiany wyróżnionej zmiennej objaśniającej nie wywołują zmian innych zmiennych Elastyczność klasyczną zmiennej endogenicznej y względem xi = x i definiujemy jako xi y ⋅ xi f x 1, ... , x k−1 Elastyczność klasyczna przyjmuje różne wartości w zależności od dziedziny modelu ekonometrycznego zatem często nazywa się ją jako elastyczność punktową Efekt względnych zmian zmiennej objaśnianej wywołanych określoną zmianą wyróżnionej zmiennej objaśniającej można wyznaczyć ze wzoru: xi y = xi y xi Łączny względny wpływ wszystkich zmiennych można zapisać jako k−1 xi y =∑ xi y i =1 xi Przykład 1 str 5 załącznik 2 trzeba znać punkt dziedziny żeby wyznaczyć elastyczność w tym punkcie x1 wraz ze wzrostem dochodów ludności o 1% popyt wzrośnie o 0,979% zakładając że dochody wynoszą 300 a cena 4000 zł (punkt dziedziny dla którego policzone) x2 wraz ze wzrostem ceny samochodów o 1% popyt spadnie (zmaleje) o 0,559% zakładając -”- Założenie: dochody wynoszą 300 a cena 4000: a) jeżeli dochody ludności wzrosną o 2% popyt wzrośnie o 1,96% b) zmaleje o 5,17% c) zakładając zwiększenie dochodów o 2% aby sprzedaż wzrosła o 6% cena powinna zmaleć przynajmniej o 7,23% Przykład 2 str 7 zał 2 wykładniki modelu potęgowego są elastycznościami, elastyczności te są stałe w całej dziedzinie Wraz ze wzrostem wartości maszyn i urządzeń o 1% wartość produkcji wzrośnie o 0,61% przy założeniu że liczba zatrudnionych nie ulegnie zmianie Wraz ze wzrostem liczby zatrudnionych o 1% wartość produkcji wzrośnie o 0,32% przy założeniu że wartość maszyn i urządzeń nie ulegnie zmianie. Przykład interpretacja: Jeżeli liczba zatrudnionych spadnie o 3% a wartość maszyn i urządzeń wzrośnie o 5% to wartość produkcji wzrośnie o 2,09% Przykład 3 str 7 interpretacja wzoru wydatki na rozrywkę mają miejsce gdy dochód przekroczy 713,41 zł 20 maksymalny poziom wydatków na rozrywkę wynosi 467,26 # Domek jeżeli dochody wzrosną o 1% przy poziomie 1000 to wydatki na rozrywkę wzrosną o 3,27% Jeżeli dochody wzrosną o 1% przy poziomie 3000 to wydatki na rozrywkę wzrosną o 0,86% Elastyczność cenowa, elastyczność dochodowa Jeżeli x i są to cena i dochód to mówimy: p=−1 to popyt na dane dobro jest popytem neutralnym lub też określany jest jako popyt jednostkowy p−1 to popyt elastyczny p−1 to popyt nazywamy popytem sztywnym Przy wysokiej elastyczności dochodowej (dodatniej) rozwój gospodarczy jest czynnikiem korzystnym dla przedsiębiorstwa 21