Zestaw zadań z Ekonometrii

Transkrypt

Zestaw zadań z Ekonometrii
Adam Kucharski
Zestaw zadań z Ekonometrii
Wstęp
Niniejszy zestaw zadań został pomyślany jako pomoc dydaktyczna do zajęć z Podstaw ekonometrii dla
kierunku Logistyka oraz z Ekonometrii dla kierunku Międzynarodowe Stosunki Gospodarcze. Zakres materiału
odpowiada więc programom nauczania na tych przedmiotach i pewne zagadnienia np. modele panelowe nie
zostały w zadaniach poruszone. Z tego samego powodu początkowe zadania zawierają polecenia pomagające w
opanowaniu obsługi pakietu GRETL, który jest wykorzystywany podczas zajęć. W dalszych zadaniach polecenia
te są już pominięte.
Aby móc rozwiązać poniższe zadania konieczne jest pobranie ze strony www.kbo.uni.lodz.pl pliku modele regresji v5.xls zawierającego dane wejściowe. Obowiązuje w nim zasada, że jeden arkusz zawiera jeden
zestaw danych. Zakładam wykorzystanie pakietu GRETL, ale dane te mogą być wczytane również do innych
pakietów ekonometrycznych. Część danych ma charakter fikcyjny. Niektóre arkusze zawierają ponadto zestawy
danych udostępnione przez autorów polskich i zagranicznych podręczników do ekonometrii.
Zadanie 1
W pewnej firmie zebrano dane na temat kwartalnych przychodów ze sprzedaży (PRZYCH [tys. zł]) oraz
kwartalnych wydatków na reklamę i promocję (PROM [tys. zł]). Dane te obejmują okres od 1 kwartału 2006
do 4 kwartału 2011 i znajdują się w arkuszu przychody.
1. Wczytać dane z arkusza przychody do programu GRETL a następnie zapisać je w formacie .gdt.
2. Wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 P ROMt + εt i zapisać model po oszacowaniu
parametrów. Czym różni się estymator od oszacowania parametru?
3. Zinterpretować oszacowane parametry. Zapisać wartości teoretyczne oraz reszty z modelu jako odrębne szeregi.
4. Zapisać wyniki estymacji jako ikonę sesji w pakiecie GRETL oraz jako plik .rtf.
5. Utworzyć wykres dopasowania wartości wyrównanych i empirycznych względem czasu. Wyjaśnić skąd wzięły
się różnice widoczne na wykresie. Zapisać go jako ikonę sesji oraz jako plik w wybranym formacie graficznym.
6. Utworzyć wykres porównujący wartości empiryczne z linią regresji otrzymaną na podstawie modelu. Zapisać
go jako ikonę sesji oraz jako plik w wybranym formacie graficznym. Jakie informacje dostarcza ten typ
wykresu?
7. Zinterpretować błąd standardowy reszt z modelu i ocenić stopień wyjaśnienia zmienności zmiennej objaśnianej przy pomocy współczynnika determinacji. Wytłumaczyć związek między wartością współczynnika
determinacji a wartościami reszt z modelu.
8. Wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 P ROMt−1 + εt i zinterpretować oszacowany
parametr przy zmiennej objaśniającej. Zapisać wyniki estymacji jako ikonę sesji.
9. Wykonać estymację parametrów modelu: P RZY CHt = b0 +b1 P RZY CHt−1 +εt i zinterpretować oszacowany
parametr przy zmiennej objaśniającej. Zapisać wyniki estymacji jako ikonę sesji.
10. Utworzyć tabelę modeli z ikon sesji dotychczas oszacowanych modeli. Omówić różnice w wartościach współczynników determinacji dla poszczególnych modeli.
11. Zapisać wyniki pracy jako plik sesji GRETL-a.
1
Zadanie 2
Wczytać do GRETL-a plik sesji utworzony w poprzednim zadaniu. W czwartym kwartale 2007 roku zaobserwowano wyjątkowo wysokie (w porównaniu z dotychczasowymi) przychody firmy z poprzedniego zadania.
Zdecydowano się wprowadzić zmienną zero-jedynkową d074, która pozwoli uwzględnić ten fakt w modelu. Postanowiono, że zostanie ona włączona do specyfikacji następnych modeli.
1. Dodać zmienną zero-jedynkową, która przyjmuje wartość 1 dla 2007:4 i 0 dla pozostałych okresów.
2. Wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 P ROMt + b2 d704t + εt i zinterpretować
oszacowany parametr przy zmiennej d074. Obliczyć liczbę stopni swobody.
3. Porównać dopasowanie powyższego modelu z modelami z jedną zmienną objaśniającą przy pomocy zwykłego
i skorygowanego R2 i skomentować różnice. Porównać wszystkie dotychczasowe modele z punktu widzenia
kryterium informacyjnego Akaike.
4. Dodać do zbioru zmiennych zmienną time wyrażającą trend deterministyczny i wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 t + b2 d704t + εt . Zinterpretować oszacowany parametr przy zmiennej
t.
5. Utworzyć logarytmy zmiennych PRZYCH i PROM.
6. Wykonać estymację parametrów modelu potęgowego: ln P RZY CHt = b0 + b1 ln P ROMt + b2 d704t + εt i
zinterpretować oszacowania parametrów.
7. Wykonać estymację parametrów modelu logarytmicznego: P RZY CHt = b0 + b1 ln P ROMt + b2 d074t i
zinterpretować oszacowania parametrów.
8. Wykonać estymację parametrów modelu wykładniczego: ln P RZY CHt = b0 + b1 P ROMt + b2 d074t i zinterpretować oszacowania parametrów.
Zadanie 3
Zebrano dane na temat kwartalnego spożycia warzyw w gospodarstwach domowych (SPOZWA [kg]) w
okresie od 1 kwartału 2007 do 4 kwartału 2011 r. Postanowiono zbadać jaki wpływ ma na tą zmienną cena
warzyw przedstawiona w postaci przeciętnej (uśrednionej) ceny koszyka warzyw (KOSZ [zł]) w tym samym
okresie. Stosowne dane znajdują się w arkuszu spozycie warzyw.
1. Wykonać wykres zmiennej SPOZWA i skomentować jego zachowanie.
2. Dodać periodyczne zmienne zero-jedynkowe. W jaki sposób włączają one do modelu wahania sezonowe?
3. Wykonać estymację parametrów modelu: SP OZW At = b0 + b1 KOSZt + b2 dq1t + b3 dq2t + b4 dq3t + εt a
następnie:
a) wyjaśnić nieobecność zmiennej dq4 ;
b) zweryfikować poprawność znaków przy parametrach i dokonać ich interpretacji;
c) sprawdzić jak na dopasowanie modelu wpłynęło wprowadzenie zmiennych sztucznych (wykonać porównanie z modelem pozbawionym tych zmiennych);
d) ocenić błędy szacunku dla parametrów;
e) ocenić istotność oszacowań przy pomocy testu t-Studenta i na tej podstawie odpowiedzieć na pytanie
czy zmienne zero-jedynkowe były faktycznie potrzebne w modelu;
f) podać z jakim rodzajem błędu związana jest wartość poziomu istotności;
g) zinterpretować wynik testu Walda i porównać wyniki tej weryfikacji z testem istotności t-Studenta;
h) zweryfikować hipotezę o rozkładzie normalnym reszt z modelu.
4. Wykonać estymację parametrów modelu: ln SP OZW At = b0 + b1 ln KOSZt + b2 dq1t + b3 dq2t + b4 dq3t + εt
i przeprowadzić weryfikację merytoryczną oraz statystyczną.
5. Utworzyć zmienne z1-z4 mierzące odchylenie od średniej w roku przy pomocy formuł GRETL-a.
6. Wykonać estymację parametrów modelu: SP OZW At = b0 +b1 KOSZt +b2 z1t +b3 z2t +b4 z3t +εt a następnie:
a) zinterpretować parametry przy zmiennych z1-z3 ;
b) obliczyć parametr przy zmiennej z4.
2
Zadanie 4
Dla grupy 40 zawodników grających w niemieckiej Bundeslidze w sezonie 2010/2011 zebrano następujące
informacje: zmiana wartości rynkowej zawodnika (ZWR [mln EUR]), liczba bramek strzelonych w sezonie
2010/2011 (B ), liczba asyst w sezonie 2010/2011 (A), wiek zawodnika (W ), wartość początkowa zawodnika
przed rozpoczęciem sezonu 2010/2011 (WP [mln EUR]). Dane te znalazły się w arkuszu bundesliga.
1. Wczytać do pakietu GRETL dane z arkusza bundesliga i prześledzić postępowanie dla danych przekrojowych.
2. Wykonać estymację parametrów modelu: ZW Ri = b0 + b1 Bi + b2 Ai + b3 Wi + b4 W Pi + εi a następnie:
a) przeprowadzić weryfikację merytoryczną (zinterpretować znaki oszacowań i same oszacowania parametrów); czy wyraz wolny w tym modelu posiada interpretację?
b) przeprowadzić weryfikację następujących własności statystycznych modelu: stopień wyjaśnienia zmienności zmiennej ZWR, ocena istotności oszacowań parametrów na podstawie statystyk t-Studenta, uogólniony test Walda, test na normalność reszt i jego interpretacja;
c) przy pomocy testu White’a zweryfikować hipotezę o występowaniu heteroskedastyczności składnika losowego; jak na własności modelu wpływa obecność heteroskedastyczności?
Zadanie 5
W pewnej firmie zebrano następujące informacje na temat zatrudnionych w niej pracowników: wynagrodzenie miesięczne netto (WYNAG [zł]), liczba lat przeznaczonych na naukę po skończeniu gimnazjum (EDUK ),
staż pracy na danym stanowisku (STAZ [lata]), wiek pracownika (WIEK [lata]). Zgromadzone dane zostały
wprowadzone do arkusza wynagrodzenia czynniki.
1. Wykonać estymację parametrów modelu: W Y N AGi = b0 + b1 EDU Ki + b2 ST AZi + b3 W IEKi + εi a
następnie:
a) zweryfikować poprawność oszacowanych parametrów modelu pod względem merytorycznym;
b) ocenić wartość współczynnika determinacji oraz istotność oszacowań;
c) zweryfikować hipotezę na temat występowania heteroskedastyczności przy pomocy testu White’a i określić czy może istnieć związek między wynikami tego testu a istotnością oszacowań parametrów.
Na podstawie wykresu dopasowania powyższego modelu zaobserwowano, że wynagrodzenia niektórych pracowników są wyraźnie wyższe od innych. Zidentyfikowano, że chodzi o osoby, których dotyczą obserwacje: 2, 14, 26,
41 i 42. W związku z tym wykonać następujące operacje:
1. Dodać zmienną zero-jedynkową u3000 dla nietypowych obserwacji.
2. Wykonać estymację parametrów zmodyfikowanego modelu: W Y N AGi = b0 + b1 EDU Ki + b2 ST AZi +
b3 u3000i + εi
Jak zmieniły się własności statystyczne modelu po wprowadzeniu zmiennej zero-jedynkowej? Jaką interpretację ma oszacowany parametr przy zmiennej u3000 ? Czy między zmiennymi EDUK a STAZ obserwujemy
występowanie współliniowości?
Zadanie 6
Z publikacji GUS pt. „Powiaty w Polsce” wybrane zostały niektóre informacje na temat powiatów województwa łódzkiego i umieszczone w arkuszu powiaty lodzkie. Są to dane przekrojowe pochodzące z 2006 roku i
zawierają m.in. liczbę małżeństw zawartych w tym roku w danym powiecie (MALZ ), liczbę osób, które przyjechały do powiatu i zameldowały się w nim na pobyt stały (NAPLYW ) oraz liczbę pracujących w powiecie
(PRAC ).
1. Wykonać estymację parametrów modelu: M ALZi = b0 + b1 N AP LY Wi + b2 P RACi + εi a następnie:
a) przeprowadzić weryfikację merytoryczną modelu po oszacowaniu parametrów (czy wyraz wolny ma interpretację?);
b) wyjaśnić przyczyny wysokiej wartości współczynnika determinacji;
c) ocenić czy wybrane zmienne objaśniające w istotny sposób wpływają na zmienną objaśnianą;
d) zweryfikować hipotezę na temat występowania heteroskedastyczności;
e) sprawdzić czy w modelu występuje współliniowość.
3
2. Wykonać estymację parametrów modelu: ln M ALZi = b0 + b1 ln N AP LY Wi + b2 ln P RACi + εi a następnie:
a) zweryfikować model pod względem merytorycznym (skomentować ujemny wyraz wolny);
b) wskazać podobieństwa i różnice we własnościach statystycznych w porównaniu z modelem liniowym.
Zadanie 7
Korzystając z danych zawartych w arkuszu powiaty lodzkie oszacować parametry następującego modelu:
U Ri = b0 + b1 M ALZi + b2 P RACi + b3 P RZEDSZKi + εi , w którym UR oznacza liczbę urodzeń żywych w
powiecie, MALZ liczbę zawartych małżeństw, PRAC liczbę pracujących a PRZEDSZK liczbę miejsc dostępnych
w przedszkolach funkcjonujących na terenie powiatu. Przeprowadzić weryfikację merytoryczną (zastanowić się
nad poprawnością znaku przy oszacowaniu parametru b2 ). Czy w modelu występuje współliniowość zmiennych
objaśniających? Jeśli tak, to których i jaki ma ona wpływ na własności statystyczne modelu?
Dla tego samego zestawu danych wykonać estymacje:
1. U Ri = b0 + b1 M ALZi + b2 P RZEDSZKi + εi
2. U Ri = b0 + b1 P RACi + b2 P RZEDSZKi + εi
Zweryfikować poprawność merytoryczną oszacowań parametrów obu modeli. Czy na podstawie wartości VIF
można powiedzieć, że usunięta została współliniowość zmiennych objaśniających? Zaproponować zastąpienie
jednej z nich inną zmienną zastępczą niosącą podobną informację, która poprawi własności statystyczne modelu.
Wykorzystać zmienne z wczytanego zbioru danych.
Zadanie 8
W arkuszu pow mieszkan znalazły się dane na temat łącznej powierzchni użytkowej mieszkań (PUM [tys.
2
m ]) w 42 miastach województwa łódzkiego (oprócz Łodzi) wraz z liczbą mieszkańców tych miast (LM [tys.
os.]) na koniec 2006 roku. Na podstawie wyników weryfikacji testu Goldfelda-Quandta ocenić czy model postaci
P U Mi = b0 +b1 LMi +εi może być estymowany na całej dostępnej próbie, czy na dwóch podpróbach odpowiednio
od 1 do 20 oraz od 21 do 42 obserwacji.
Dla wszystkich obserwacji łącznie wykonać estymację parametrów modelu: ln P U Mi = b0 + b1 ln LMi + εi
po czym przy pomocy testu White’a zweryfikować hipotezę o występowaniu heteroskedastyczności. Czy jej
obecność wpływa na wyniki weryfikacji testu istotności t-Studenta?
Zadanie 9
Dla okresu od stycznia 2008 do października 2011 roku zebrano informacje na temat przeciętnej ceny pszenicy na targowiskach (CPT [zł/1 dt]), przeciętnej ceny pszenicy w punktach skupu (CSKP [zł/1 dt]) oraz
łańcuchowego indeksu cen towarów i usług konsumpcyjnych. Ostatnia zmienna została zamieniona na indeks
jednopodstawowy z podstawą w styczniu 2008. W arkuszu ceny zboza oznaczono ją jako CPI08. Przed wykonaniem dalszych poleceń, przy pomocy formuł pakietu GRETL, dokonać przeliczenia obu zmiennych wyrażających
ceny pszenicy z wartości nominalnych na realne oznaczone odpowiednio CPTR i CSKPR.
1. Wykonać estymację parametrów modelu: CP T Rt = b0 + b1 CSKP Rt + εt a następnie:
a) zweryfikować poprawność merytoryczną modelu;
b) ocenić dopasowanie modelu do danych i zbadać istotność oszacowań parametrów;
c) wykonać wykres reszt z modelu względem czasu i skomentować jego zachowanie;
d) zweryfikować hipotezę na temat występowania autokorelacji przy pomocy testu Durbina-Watsona, zinterpretować wartość współczynnika rho1 ;
e) sprawdzić, czy reszty mają rozkład normalny – skomentować wyniki w kontekście liczebności próby
statystycznej;
f) ocenić czy można mieć zaufanie do statystyk t-Studenta.
2. Wykonać estymację parametrów modelu: CP T Rt = b0 + b1 CSKP Rt−1 + εt , porównać go z modelem poprzednim i wskazać różnice.
3. Wykonać estymację parametrów modelu: CP T Rt = b0 + b1 CSKP Rt + b2 CP T Rt−1 + εt a następnie:
a) zinterpretować wartość statystyki Durbina h;
4
b) odpowiedzieć na pytanie: jakie konsekwencje będzie miało usunięcie wyrazu wolnego;
c) zwrócić uwagę na wartości statystyk t-Studenta pozostałych parametrów i skomentować ich związek z
obecnością bądź nie autokorelacji w modelu;
d) oszacować parametry modelu potęgowego o powyższej specyfikacji i zinterpretować wyniki.
Zadanie 10
W arkuszu patenty znajdują się dane dla USA na temat liczby zgłoszonych patentów (PATENTS [tys.]) oraz
wydatków na badania i rozwój (RD [mld USD]) w latach 1960-1993. Na tej podstawie oszacować parametry
modelu opisującego wpływ wspomnianych wydatków na liczbę patentów. Model powinien charakteryzować się
poprawnymi własnościami merytorycznymi i statystycznymi. Zinterpretować otrzymane wyniki.
Zadanie 11
Arkusz ladunki samochodowe zawiera dane na temat wielkości ładunków przewiezionych transportem samochodowym w Polsce (SAM [mln ton]) oraz ilości kontenerów załadowanych i wyładowanych w polskich portach
morskich (KONT [tys. ton]) od sierpnia 2008 do grudnia 2011 roku.
1. Wykonać estymację parametrów modelu: SAMt = b0 + b1 KON Tt + εt i wskazać te spośród jego własności
statystycznych, które należy uznać za niepoprawne.
2. Wykonać wykres zmiennej SAM i przeanalizować jego zachowanie. Zwrócić uwagę na zachowanie w 2008
roku a następnie obciąć próbę tak, aby początek danych przypadał w styczniu 2009 roku.
3. Powtórzyć estymację parametrów po zmianie zakresu próby i ocenić zmiany jakie zaszły w porównaniu z
poprzednim modelem. Wykonać wykresy: reszt i dopasowania do danych.
4. Dodać periodyczne zmienne zero-jedynkowe a następnie wykonać estymację parametrów modelu: SAMt =
b0 + b1 KON Tt + b2 SAMt−1 + b3 dm1t + b4 dm12t + εt
5. Przeprowadzić weryfikację merytoryczną i statystyczną. Skomentować wartość parametru przy opóźnionej
zmiennej SAM.
Zadanie 12
W arkuszu ladunki kolejowe zebrane zostały wybrane zmienne mające związek z transportem kolejowym w
Polsce w okresie od sierpnia 2008 do grudnia 2011 roku. Po wykonaniu wykresu zmiennej KOL okazało się, że
od stycznia do listopada 2009 roku da się zaobserwować nietypowy wzrost wielkości ładunków przewiezionych
koleją. W związku z tym uznano, że zestaw zmiennych należy rozszerzyć o zmienną zero-jedynkową d09 dla
wspomnianego okresu.
1. Wykonać estymację parametrów modelu: KOLt = b0 + b1 P RZEMt + b2 SAMt + b3 P ROW EGt + b4 d09t + εt
a następnie:
a) przeprowadzić weryfikację merytoryczną;
b) przeprowadzić weryfikację statystyczną (czy wykres reszt z modelu wskazuje na występowanie autokorelacji?).
2. Wykonać estymację parametrów modelu: KOLt = b0 + b1 P RZEMt + b2 SAMt + b3 P ROW EGt + b4 d09t +
b5 KOLt−1 + εt a następnie:
a) ocenić, czy wyraz wolny posiada interpretację;
b) przeprowadzić weryfikację statystyczną (wykonać wykres reszt z modelu i porównać go z wykresem dla
modelu poprzedniego).
3. Wykonać estymację parametrów modelu potęgowego do poprzedniej specyfikacji i zinterpretować wyniki.
Zadanie 13
Dla danych z arkusza wegiel wykonać następujące polecenia:
1. Wyznaczyć zmienne realne PROWEGR i PRZEMR wykorzystując do tego celu jednopodstawowe indeksy
odpowiednio MPI08 oraz PPI08.
5
2. Dodać periodyczne zmienne zero-jedynkowe. Na podstawie wykresu zmiennej ELEKT zadecydować, które
efekty sezonowe znajdą się w modelu.
3. Wykonać estymację parametrów modelu: ELEKTt = b0 + b1 P ROW EGRt + b2 P RZEM Rt +
P11
bj+2 j=1 dmjt + εt . W jego ostatecznej wersji mają się znaleźć istotne statystycznie zmienne wyrażające
efekty sezonowe.
4. Zinterpretować otrzymane wyniki.
Zadanie 14
W arkuszu powiaty slaskie znalazły się dane zebrane w 2006 roku w 37 powiatach województwa śląskiego.
Obejmują one liczbę zgonów wywołanych chorobami układu oddechowego (ZGODD [os.]) w powiecie, emisję
zanieczyszczeń gazowych powietrza (ZANGAZ [tys. t]) i wydatki budżetów gmin na ochronę zdrowia (WYZDR
[mln zł]).
1. Wykonać estymację parametrów modelu: ZGODDi = b0 + b1 ZAN GAZi + b2 W Y ZDRi + εi a następnie:
a) przeprowadzić weryfikację merytoryczną oszacowanych parametrów;
b) przeprowadzić weryfikację statystyczną (czy współczynnik determinacji można uznać za niski?).
2. Znaleźć specyfikację modelu poprawną pod względem merytorycznym i statystycznym. Zinterpretować otrzymane wyniki.
Zadanie 15
Arkusz cena samochodu zawiera dane dotyczące 20 używanych aut wystawionych na sprzedaż. Dane te obejmują cenę, wiek i pojemność silnika samochodu. Ponadto zmienna zero-jedynkowa ST wyraża stan techniczny
przyjmując wartość 1 dla tych pojazdów, które są bezwypadkowe. Wykonać estymacje dwóch modeli. W pierwszym na cenę samochodu wpływać mają wiek i pojemność silnika. W drugim, oprócz poprzednich zmiennych
uwzględniony zostanie stan techniczny. Porównać wyniki estymacji i wskazać, który z modeli lepiej nadaje się
do dalszego wykorzystania. Dla drugiej specyfikacji oszacować model w wariancie potęgowym i zinterpretować
oszacowania parametrów.
Zadanie 16
Wczytać dane z arkusza powiaty scieki. Uwaga! Dane od 1 do 24 dotyczą województwa łódzkiego, od 25
do 38 województwa świętokrzyskiego. Zaproponować specyfikację i oszacować parametry modelu opisującego
wpływ wybranych zmiennych na ilość ścieków wymagających oczyszczenia (zmienna SC ). Model powinien
charakteryzować się poprawnymi własnościami merytorycznymi i statystycznymi. Wiadomo ponadto, że jedną
ze zmiennych objaśniających ma być liczba ludności zamieszkująca dany powiat. Zinterpretować otrzymane
wyniki.
Zadanie 17
Wczytać dane z arkusza depozyty a następnie wartość depozytów oraz stopę ich oprocentowania przeliczyć
z wartości nominalnych na realne wykorzystując jednopodstawowy wskaźnik cen towarów i usług wyrażony
zmienną CPI09. Przyjąć oznaczenia odpowiednio DEP2R i RDR. Uwaga! Zmienna RD (stopa oprocentowania)
podana została w procentach.
1. Wykonać estymację parametrów modelu: DEP 2Rt = b0 + b1 RDRt + εt a następnie:
a) przeprowadzić weryfikację statystyczną;
b) wykonać wykres zmiennej DEP2R – zwrócić uwagę na jej nieliniowe zachowanie;
c) przeprowadzić weryfikację testem nieliniowości wykorzystującym kwadraty zmiennych (wyjaśnić dlaczego
nie można użyć logarytmów);
d) przy pomocy testu RESET zweryfikować hipotezę na temat poprawności specyfikacji modelu.
2. Dodać zmienną time i podnieść ją do kwadratu przy pomocy odpowiedniej formuły w pakiecie GRETL
tworząc zmienną t2 .
3. Wykonać estymację parametrów modelu: DEP 2Rt = b0 + b1 RDRt + b2 t2 + εt a następnie:
6
a) przeprowadzić weryfikację merytoryczną i statystyczną;
b) wykonać wykres dopasowania i zwrócić uwagę na nietypowe zachowanie zmiennej DEP2R na przełomie
2009 i 2010 roku;
c) ponowne wykonać test RESET.
4. Utworzyć zmienną zero-jedynkową d1202 dla okresu od 2009:12 do 2010:02.
5. Wykonać estymację parametrów modelu: DEP 2Rt = b0 + b1 RDRt + b2 t2 + b3 d1202 + b4 DEP 2Rt−1 + εt a
następnie:
a) przeprowadzić weryfikację statystyczną i rozstrzygnąć czy w modelu występuje autokorelacja na podstawie wartości statystyki Durbina h;
b) użyć testu LM (Breuscha-Godfreya) na występowanie autokorelacji 1 rzędu.
Zadanie 18
W arkuszu urlopy znalazły się dane na temat kwartalnego zysku pewnego biura turystycznego (ZBT [tys.
zł]). Ponadto zebrano informacje o liczbie dni wolnych wraz z urlopem do wykorzystania, którymi dysponują
klienci biura (W ) oraz ich realnym dochodzie do dyspozycji w przeliczeniu na osobę (D [zł]).
1. Wykonać wykres zmiennej ZBT i dodać periodyczne zmienne zero-jedynkowe.
2. Wykonać estymację parametrów modelu: P BTt = b0 +b1 Wt +b2 Dt +b3 dq1t +b4 dq2t +b5 dq3t +εt a następnie:
a) przeprowadzić weryfikację merytoryczną i statystyczną;
b) przy pomocy testu nieliniowości dla logarytmów zmiennych ustalić, czy model powinien mieć postać
liniową;
c) wykonać test RESET (które zmienne należy usunąć z modelu i dlaczego?).
3. Wykonać estymację parametrów modelu: P BTt = b0 + b1 Dt + b2 dq2t + b3 dq3t + εt a następnie:
a) ponownie wykonać test nieliniowości;
b) ponownie wykonać test RESET;
c) zweryfikować hipotezę na temat występowania autokorelacji w modelu.
4. Wykonać estymację parametrów modelu: ln P BTt = b0 + b1 ln Dt−2 + b2 dq2t + b3 dq3t + εt po czym:
a) ustalić czy wartość statystyki w teście Durbina-Watsona wskazuje na obecność w modelu autokorelacji;
b) rozstrzygnąć o występowaniu autokorelacji na przykład przy pomocy testu mnożnika Lagrange’a.
7