ekonometria przestrzenna - Uniwersytet Ekonomiczny w Krakowie
Transkrypt
ekonometria przestrzenna - Uniwersytet Ekonomiczny w Krakowie
EKONOMETRIA PRZESTRZENNA Wstęp – podstawy ekonometrii Uniwersytet Ekonomiczny w Krakowie, 2012 1 EKONOMETRIA – wybrane definicje • (Osińska) Ekonometria – dziedzina ekonomii wykorzystująca modele i sposoby wnioskowania statystyki matematycznej do opisu i analizy zjawisk ekonomicznych; głównym celem ekonometrii jest analiza zjawisk w aspekcie teoretycznym oraz empirycznym 2 EKONOMETRIA – wybrane definicje • (Maddala) Ekonometria – zastosowanie metod statystycznych i matematycznych do analizy danych ekonomicznych w celu nadania teoriom ekonomicznym kontekstu empirycznego oraz ich potwierdzenia bądź odrzucenia 3 Podział ze względu na aspekt wykorzystywanych metod • teoria ekonometrii (metody dostosowane do potrzeb badań ilościowych w ekonomii) • ekonometria stosowana (zastosowania do konkretnych badaniach na podstawie danych statystycznych ) 4 Podział ze względu na charakter wykorzystywanych danych • ekonometria danych przekrojowych (obserwacje dotyczące wielu jednostek w jednym okresie czasowym) • ekonometria dynamiczna (dane szeregów czasowych, zależności w czasie opisane najczęściej za pomocą układów równań różnicowych) • ekonometria panelowa (powtarzane w czasie obserwacje tych samych jednostek) • ekonometria przestrzenna (wykorzystanie informacji przestrzennej dotyczącej położenia obiektu) 5 Podział ze względu na obszar zastosowań • • • • mikroekonometria makroekonometria ekonometria finansowa badania operacyjne (dziedzina pokrewna) 6 Podział ze względu na procedurę wnioskowania • wnioskowanie klasyczne (częstościowe – frequentist approach) • wnioskowanie bayesowskie (Bayesian Econometrics) 7 EKONOMETRIA PRZESTRZENNA • Modele przestrzenne są rozszerzeniem klasycznych modeli ekonometrycznych. • Wykorzystują one dane GIS (Geographic Information System) dotyczące geograficznego położenia jednostki. • W modelach uwzględniane są efekty przestrzenne: przestrzenna zależność i przestrzenna heterogeniczność. 8 Przykłady analiz przestrzennych • przestrzenna analiza rozwoju społeczno-gospodatczego jednostek terytorialnych (np. poziomu bezrobocia, wydatków itd.) • przestrzenna analiza cen (np. nieruchomości), • przestrzenna analiza wyników matur Przykładowe narzędzia (modele ekonometryczne) wykorzystywane w analizach przestrzennych: • model autoregresji przestrzennej (SAR - Spatial autoregressive model) • model VAR (vector autoregressive model) oraz VECM (vector error correction model) • metody analizy skupień (taksonometrii) 9 KLASYCZNY MODEL REGRESJI LINIOWEJ 10 Klasyczny model regresji liniowej (KMRL) • KMRL opisuje dla rozważanej populacji liniową zależność zmiennej zależnej (objaśnianej) Y od: 1) jednej zmiennej niezależnej (objaśniającej, regresora) X – w przypadku prostej regresji liniowej: Y 0 1 X 11 Klasyczny model regresji liniowej (KMRL) przy czym • 0 jest wyrazem wolnym modelu • 1 jest parametrem kierunkowym modelu • jest składnikiem losowym modelu (o rozkładzie normalnym – KMNRL) 12 Klasyczny model regresji liniowej (KMRL) 2) wielu zmiennych niezależnych Xj (j=1,2,…,k) - w przypadku wielorakiej regresji liniowej: Y 0 1 X 1 ... k X k przy czym • 0 jest wyrazem wolnym modelu • 1 ,..., k są parametrami kierunkowymi odpowiadającymi poszczególnym regresorom modelu • jest składnikiem losowym modelu 13 Regresja wieloraka – zapis skalarny • rozważmy zbiór obiektów i=1,2,…,n (np. przedsiębiorstw, powiatów itd.), • zależność liniową warunkowego rozkładu zmiennej zależnej Yi dla i-tego obiektu, opisanego przez wartości Xij (j=1,2,…,k) zmiennych niezależnych można zapisać: Yi 0 1 X i1 ... k X ik i i 1,2,..., n 14 Regresja wieloraka – zapis macierzowy y Xβ ξ y1 y y 2 yn n1 1 x11 1 x 21 X 1 xn1 x1k 0 x2 k β 1 xnk nk 1 k k 11 1 ξ 2 n n1 15 Regresja wieloraka – zapis macierzowy • gdzie • y – wektor (nx1) zmiennej zależnej • X – macierz (nx(k+1)) zmiennych objaśniających • β – wektor ((k+1)x1) parametrów modelu • ξ – wektor (nx1) składników losowych (w skrócie wektor losowy) 16 Warunkowa wartość oczekiwana zmiennej zależnej • przy założeniu, że E i 0 (i=1,2,…,n), mamy E Yi E Y X i1 xi1 ,..., X ik xik 0 1 xi1 ... k xik (i=1,2,…,n), • warunkowa wartość oczekiwana (wartość przeciętna) zmiennej objaśnianej E(Yi) zależy liniowo od wartości przyjmowanych przez zmienne objaśniające dla i-tego obiektu, tzn. xi1,…,xik 17 Twierdzenie Gaussa-Markowa o KMRL • Założenia (w skrócie): • 1) niezmienniczość modelu Yi=fi(Xi1,…,Xik) ze względu na kolejne obserwacje i=1,2,…,n, tzn. f1=f2=…=fn=f, • 2) model jest liniowy względem parametrów: Yi 0 1 X i1 ... k X ik i i 1,2,..., n • lub w zapisie macierzowym: y Xβ ξ • 3) zmienne objaśniające Xj (j=1,…,k) są nielosowe, w związku z czym są niekorelowane ze składnikiem losowym: EX T ξ X T Eξ 0 18 Twierdzenie Gaussa-Markowa o KMRL • Założenia c.d. • 4) macierz zmiennych objaśniających ma pełny rząd kolumnowy rz(X)=k+1 • 5) wektor losowy jest sferyczny, tzn. charakteryzuje się wielowymiarowym rozkładem normalnym ξ ~ N0, 2 I n gdzie In macierzą jednostkową n-tego stopnia, co jest równoznaczne z istnieniem heteroskedastyczności składników losowych oraz brakiem ich autokorelacji • 6) informacje zawarte w próbie są jedynymi informacjami, będącymi jedyną podstawą estymacji modelu 19 Teza twierdzenia Gaussa-Markowa o KMRL • Jeżeli spełnione są założenia schematu Gaussa-Markowa, to • Teza 1 T T ˆ • Estymator KMNK β X X X y jest najlepszym nieobciążonym estymatorem liniowym (BLUE – best linear unbiased estimator) parametrów modelu β 20 Założenia KMRL – ujęcie graficzne 21 Estymator Klasycznej Metody Najmniejszych Kwadratów (KMNK) • Wartość estymatora odpowiada wartości minimalizującej błąd średniokwadratowy (funkcję celu S): T βˆ arg min S β y Xβ y Xβ β • WK istnienia minimum lokalnego funkcji S (zerowanie się gradientu funkcji celu): 1 T T ˆ ˆ S β 0 β X X X y • WW istnienia minimum lokalnego (dodatnia określoność hesjanu w punkcie stacjonarnym): • Hβ 2XT X jest dodatnio określony w całej dziedzinie, więc w β̂ istnieje globalne minimum funkcji celu S 22 Idea KMNK - minimalizacja sumy kwadratów odchyleń: y yˆ y x n i 1 2 i i n i 1 i 0 1 i 23 2 Wykres rozrzutu danych empirycznych w przypadku istnienia zależności liniowej 24 Weryfikacja założeń po oszacowaniu modelu • Spełnienie założeń schematu Gaussa-Markowa weryfikuje się po oszacowaniu modelu • Brak ich spełnienia skłania do respecyfikacji modelu (bądź też w szczególnych przypadkach do zachowania bieżącego modelu i zastosowania estymatorów odpornych macierzy kowariancji w celach wnioskowania na temat wielkości parametrów w populacji) 25 Procedura budowy KMRL • 1) dobór zmiennych objaśniających modelu (m.in. metoda optymalizacji kryterium informacyjnego AIC lub BIC, metody krokowe – postępująca lub wsteczna) • 2) weryfikacja założeń modelu KMRL (przy braku ich spełnienia ewentualna jego respecyfikacja) • 3) badanie istotności wpływu regresorów oraz ocena stopnia dopasowania oszacowanego modelu do danych empirycznych • 4) analiza merytoryczna wartości oszacowań parametrów modelu 26 Wykorzystanie zbudowanego KMRL • Opis zależności warunkowej wartości zmiennej objaśnianej w zależności od wartości cech objaśniających zaobserwowanych dla obiektów należących do zbioru służącego za podstawę estymacji modelu • Prognozowanie na podstawie modelu (liniowa ekstrapolacja zależności dla innych obiektów nie wchodzących w skład próby użytej przy estymacji) 27 Oprogramowanie ekonometryczne • gretl • STATISTICA • R – język i środowisko programowania dla obliczeń statystycznych • Eviews • MATLAB • GAUSS • MS Excel + dodatki + VBA 28 Przykład – analiza regresji stopy bezrobocia w powiatach Obiektami analizy są powiaty województwa małopolskiego oraz śląskiego (tworzących region południowy w ramach klasyfikacji NUTS). Dane dla roku 2010 zaczerpnięto z Banku Danych Lokalnych GUS. n=58 – liczba obiektów (powiatów) Zmienna zależna: Y - stopa bezrobocia (w %) 29 Przykład – analiza regresji stopy bezrobocia w powiatach • Potencjalne regresory modelu: • X1 – województwo (zmienna zero-jedynkowa: 1 – małopolskie, 0 – śląskie) • X2 – przeciętne wynagrodzenie (w PLN) • X3 – udział osób zatrudnionych w rolnictwie (w %) • X4 – liczba jednostek gospodarczych przypadających na 10 tys. mieszkańców • X5 – inwestycje jednostek gospodarczych przypadające na 1 mieszkańca (w PLN) 30 Analiza w STATISTICA • Wykorzystujemy moduł Regresja wieloraka z menu Statystyka 31 Analiza w STATISTICA • W tym celu można również wykorzystać moduł Ogólne modele regresji z menu Statystyka podmenu Zaawansowane modele liniowe i nieliniowe 32 Analiza w STATISTICA • Przydatny w wizualizacji wyników analiz przestrzennych pomocny może być dodatek STATISTICA Mapy 33 Analiza w gretl • Wykorzystujemy funkcję Klasyczna metoda najmniejszych kwadratów z menu Model 34 Wykorzystanie danych GIS • Rozszerzenie analizy bezrobocia z wykorzystaniem danych przestrzennych (dane GIS w układzie xy): • Artykuł: Müller-Frączek I., Pietrzak M.B., Analiza stopy bezrobocia w Polsce z wykorzystaniem przestrzennego modelu MESS • Dane GIS: geoportal 35 Literatura – podstawy ekonometrii (m.in. KMRL) • Literatura podstawowa: • Kukuła K. (red.), Wprowadzenie do ekonometrii • Welfe A., Ekonometria. Metody i ich zastosowanie (KMRL – rozdział 1 i 2) • Górecki B., Podstawowy kurs nowoczesnej ekonometrii • Literatura dodatkowa: • Goldberger G.A., Teoria ekonometrii • Greene W.H., Econometric analysis, (wydanie szóste lub nowsze) (rozdziały 1-7 w wydaniu szóstym) 36 Literatura – podstawy ekonometrii (m.in. KMRL) • Analizy ekonometryczne z wykorzystaniem oprogramowania gretl: • Osińska M. (red.), Ekonometria współczesna • Kufel T., Rozwiązywanie problemów z wykorzystaniem programu GRETL • Analizy ekonometryczne z wykorzystaniem programu STATISTICA: • Kot S.M., Jakubowski J., Sokołowski A., Statystyka 37 Literatura – ekonometria przestrzenna • Literatura podstawowa: • Suchecki B., Ekonometria przestrzenna. Metody i modele analizy danych przestrzennych • • • • Literatura dodatkowa: LeSage J.P., Spatial Econometrics LeSage J.P., The Theory and Practice of Spatial Econometrics Suchecki B., Ekonometria przestrzenna II. Modele zaawansowane 38 Literatura – ekonometria przestrzenna • Analizy przestrzenne z wykorzystaniem programu statystycznego R: • Kopczewska K., Ekonometria i statystyka przestrzenna z wykorzystaniem programu R • CRAN Task Views: Spatial analysis 39 DZIĘKUJĘ ZA UWAGĘ 40