Zestaw zadań z Ekonometrii
Transkrypt
Zestaw zadań z Ekonometrii
Adam Kucharski Zestaw zadań z Ekonometrii Wstęp Niniejszy zestaw zadań został pomyślany jako pomoc dydaktyczna do zajęć z Podstaw ekonometrii dla kierunku Logistyka oraz z Ekonometrii dla kierunku Międzynarodowe Stosunki Gospodarcze. Zakres materiału odpowiada więc programom nauczania na tych przedmiotach i pewne zagadnienia np. modele panelowe nie zostały w zadaniach poruszone. Z tego samego powodu początkowe zadania zawierają polecenia pomagające w opanowaniu obsługi pakietu GRETL, który jest wykorzystywany podczas zajęć. W dalszych zadaniach polecenia te są już pominięte. Aby móc rozwiązać poniższe zadania konieczne jest pobranie ze strony www.kbo.uni.lodz.pl pliku modele regresji v5.xls zawierającego dane wejściowe. Obowiązuje w nim zasada, że jeden arkusz zawiera jeden zestaw danych. Zakładam wykorzystanie pakietu GRETL, ale dane te mogą być wczytane również do innych pakietów ekonometrycznych. Część danych ma charakter fikcyjny. Niektóre arkusze zawierają ponadto zestawy danych udostępnione przez autorów polskich i zagranicznych podręczników do ekonometrii. Zadanie 1 W pewnej firmie zebrano dane na temat kwartalnych przychodów ze sprzedaży (PRZYCH [tys. zł]) oraz kwartalnych wydatków na reklamę i promocję (PROM [tys. zł]). Dane te obejmują okres od 1 kwartału 2006 do 4 kwartału 2011 i znajdują się w arkuszu przychody. 1. Wczytać dane z arkusza przychody do programu GRETL a następnie zapisać je w formacie .gdt. 2. Wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 P ROMt + εt i zapisać model po oszacowaniu parametrów. Czym różni się estymator od oszacowania parametru? 3. Zinterpretować oszacowane parametry. Zapisać wartości teoretyczne oraz reszty z modelu jako odrębne szeregi. 4. Zapisać wyniki estymacji jako ikonę sesji w pakiecie GRETL oraz jako plik .rtf. 5. Utworzyć wykres dopasowania wartości wyrównanych i empirycznych względem czasu. Wyjaśnić skąd wzięły się różnice widoczne na wykresie. Zapisać go jako ikonę sesji oraz jako plik w wybranym formacie graficznym. 6. Utworzyć wykres porównujący wartości empiryczne z linią regresji otrzymaną na podstawie modelu. Zapisać go jako ikonę sesji oraz jako plik w wybranym formacie graficznym. Jakie informacje dostarcza ten typ wykresu? 7. Zinterpretować błąd standardowy reszt z modelu i ocenić stopień wyjaśnienia zmienności zmiennej objaśnianej przy pomocy współczynnika determinacji. Wytłumaczyć związek między wartością współczynnika determinacji a wartościami reszt z modelu. 8. Wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 P ROMt−1 + εt i zinterpretować oszacowany parametr przy zmiennej objaśniającej. Zapisać wyniki estymacji jako ikonę sesji. 9. Wykonać estymację parametrów modelu: P RZY CHt = b0 +b1 P RZY CHt−1 +εt i zinterpretować oszacowany parametr przy zmiennej objaśniającej. Zapisać wyniki estymacji jako ikonę sesji. 10. Utworzyć tabelę modeli z ikon sesji dotychczas oszacowanych modeli. Omówić różnice w wartościach współczynników determinacji dla poszczególnych modeli. 11. Zapisać wyniki pracy jako plik sesji GRETL-a. 1 Zadanie 2 Wczytać do GRETL-a plik sesji utworzony w poprzednim zadaniu. W czwartym kwartale 2007 roku zaobserwowano wyjątkowo wysokie (w porównaniu z dotychczasowymi) przychody firmy z poprzedniego zadania. Zdecydowano się wprowadzić zmienną zero-jedynkową d074, która pozwoli uwzględnić ten fakt w modelu. Postanowiono, że zostanie ona włączona do specyfikacji następnych modeli. 1. Dodać zmienną zero-jedynkową, która przyjmuje wartość 1 dla 2007:4 i 0 dla pozostałych okresów. 2. Wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 P ROMt + b2 d704t + εt i zinterpretować oszacowany parametr przy zmiennej d074. Obliczyć liczbę stopni swobody. 3. Porównać dopasowanie powyższego modelu z modelami z jedną zmienną objaśniającą przy pomocy zwykłego i skorygowanego R2 i skomentować różnice. Porównać wszystkie dotychczasowe modele z punktu widzenia kryterium informacyjnego Akaike. 4. Dodać do zbioru zmiennych zmienną time wyrażającą trend deterministyczny i wykonać estymację parametrów modelu: P RZY CHt = b0 + b1 t + b2 d704t + εt . Zinterpretować oszacowany parametr przy zmiennej t. 5. Utworzyć logarytmy zmiennych PRZYCH i PROM. 6. Wykonać estymację parametrów modelu potęgowego: ln P RZY CHt = b0 + b1 ln P ROMt + b2 d704t + εt i zinterpretować oszacowania parametrów. 7. Wykonać estymację parametrów modelu logarytmicznego: P RZY CHt = b0 + b1 ln P ROMt + b2 d074t i zinterpretować oszacowania parametrów. 8. Wykonać estymację parametrów modelu wykładniczego: ln P RZY CHt = b0 + b1 P ROMt + b2 d074t i zinterpretować oszacowania parametrów. Zadanie 3 Zebrano dane na temat kwartalnego spożycia warzyw w gospodarstwach domowych (SPOZWA [kg]) w okresie od 1 kwartału 2007 do 4 kwartału 2011 r. Postanowiono zbadać jaki wpływ ma na tą zmienną cena warzyw przedstawiona w postaci przeciętnej (uśrednionej) ceny koszyka warzyw (KOSZ [zł]) w tym samym okresie. Stosowne dane znajdują się w arkuszu spozycie warzyw. 1. Wykonać wykres zmiennej SPOZWA i skomentować jego zachowanie. 2. Dodać periodyczne zmienne zero-jedynkowe. W jaki sposób włączają one do modelu wahania sezonowe? 3. Wykonać estymację parametrów modelu: SP OZW At = b0 + b1 KOSZt + b2 dq1t + b3 dq2t + b4 dq3t + εt a następnie: a) wyjaśnić nieobecność zmiennej dq4 ; b) zweryfikować poprawność znaków przy parametrach i dokonać ich interpretacji; c) sprawdzić jak na dopasowanie modelu wpłynęło wprowadzenie zmiennych sztucznych (wykonać porównanie z modelem pozbawionym tych zmiennych); d) ocenić błędy szacunku dla parametrów; e) ocenić istotność oszacowań przy pomocy testu t-Studenta i na tej podstawie odpowiedzieć na pytanie czy zmienne zero-jedynkowe były faktycznie potrzebne w modelu; f) podać z jakim rodzajem błędu związana jest wartość poziomu istotności; g) zinterpretować wynik testu Walda i porównać wyniki tej weryfikacji z testem istotności t-Studenta; h) zweryfikować hipotezę o rozkładzie normalnym reszt z modelu. 4. Wykonać estymację parametrów modelu: ln SP OZW At = b0 + b1 ln KOSZt + b2 dq1t + b3 dq2t + b4 dq3t + εt i przeprowadzić weryfikację merytoryczną oraz statystyczną. 5. Utworzyć zmienne z1-z4 mierzące odchylenie od średniej w roku przy pomocy formuł GRETL-a. 6. Wykonać estymację parametrów modelu: SP OZW At = b0 +b1 KOSZt +b2 z1t +b3 z2t +b4 z3t +εt a następnie: a) zinterpretować parametry przy zmiennych z1-z3 ; b) obliczyć parametr przy zmiennej z4. 2 Zadanie 4 Dla grupy 40 zawodników grających w niemieckiej Bundeslidze w sezonie 2010/2011 zebrano następujące informacje: zmiana wartości rynkowej zawodnika (ZWR [mln EUR]), liczba bramek strzelonych w sezonie 2010/2011 (B ), liczba asyst w sezonie 2010/2011 (A), wiek zawodnika (W ), wartość początkowa zawodnika przed rozpoczęciem sezonu 2010/2011 (WP [mln EUR]). Dane te znalazły się w arkuszu bundesliga. 1. Wczytać do pakietu GRETL dane z arkusza bundesliga i prześledzić postępowanie dla danych przekrojowych. 2. Wykonać estymację parametrów modelu: ZW Ri = b0 + b1 Bi + b2 Ai + b3 Wi + b4 W Pi + εi a następnie: a) przeprowadzić weryfikację merytoryczną (zinterpretować znaki oszacowań i same oszacowania parametrów); czy wyraz wolny w tym modelu posiada interpretację? b) przeprowadzić weryfikację następujących własności statystycznych modelu: stopień wyjaśnienia zmienności zmiennej ZWR, ocena istotności oszacowań parametrów na podstawie statystyk t-Studenta, uogólniony test Walda, test na normalność reszt i jego interpretacja; c) przy pomocy testu White’a zweryfikować hipotezę o występowaniu heteroskedastyczności składnika losowego; jak na własności modelu wpływa obecność heteroskedastyczności? Zadanie 5 W pewnej firmie zebrano następujące informacje na temat zatrudnionych w niej pracowników: wynagrodzenie miesięczne netto (WYNAG [zł]), liczba lat przeznaczonych na naukę po skończeniu gimnazjum (EDUK ), staż pracy na danym stanowisku (STAZ [lata]), wiek pracownika (WIEK [lata]). Zgromadzone dane zostały wprowadzone do arkusza wynagrodzenia czynniki. 1. Wykonać estymację parametrów modelu: W Y N AGi = b0 + b1 EDU Ki + b2 ST AZi + b3 W IEKi + εi a następnie: a) zweryfikować poprawność oszacowanych parametrów modelu pod względem merytorycznym; b) ocenić wartość współczynnika determinacji oraz istotność oszacowań; c) zweryfikować hipotezę na temat występowania heteroskedastyczności przy pomocy testu White’a i określić czy może istnieć związek między wynikami tego testu a istotnością oszacowań parametrów. Na podstawie wykresu dopasowania powyższego modelu zaobserwowano, że wynagrodzenia niektórych pracowników są wyraźnie wyższe od innych. Zidentyfikowano, że chodzi o osoby, których dotyczą obserwacje: 2, 14, 26, 41 i 42. W związku z tym wykonać następujące operacje: 1. Dodać zmienną zero-jedynkową u3000 dla nietypowych obserwacji. 2. Wykonać estymację parametrów zmodyfikowanego modelu: W Y N AGi = b0 + b1 EDU Ki + b2 ST AZi + b3 u3000i + εi Jak zmieniły się własności statystyczne modelu po wprowadzeniu zmiennej zero-jedynkowej? Jaką interpretację ma oszacowany parametr przy zmiennej u3000 ? Czy między zmiennymi EDUK a STAZ obserwujemy występowanie współliniowości? Zadanie 6 Z publikacji GUS pt. „Powiaty w Polsce” wybrane zostały niektóre informacje na temat powiatów województwa łódzkiego i umieszczone w arkuszu powiaty lodzkie. Są to dane przekrojowe pochodzące z 2006 roku i zawierają m.in. liczbę małżeństw zawartych w tym roku w danym powiecie (MALZ ), liczbę osób, które przyjechały do powiatu i zameldowały się w nim na pobyt stały (NAPLYW ) oraz liczbę pracujących w powiecie (PRAC ). 1. Wykonać estymację parametrów modelu: M ALZi = b0 + b1 N AP LY Wi + b2 P RACi + εi a następnie: a) przeprowadzić weryfikację merytoryczną modelu po oszacowaniu parametrów (czy wyraz wolny ma interpretację?); b) wyjaśnić przyczyny wysokiej wartości współczynnika determinacji; c) ocenić czy wybrane zmienne objaśniające w istotny sposób wpływają na zmienną objaśnianą; d) zweryfikować hipotezę na temat występowania heteroskedastyczności; e) sprawdzić czy w modelu występuje współliniowość. 3 2. Wykonać estymację parametrów modelu: ln M ALZi = b0 + b1 ln N AP LY Wi + b2 ln P RACi + εi a następnie: a) zweryfikować model pod względem merytorycznym (skomentować ujemny wyraz wolny); b) wskazać podobieństwa i różnice we własnościach statystycznych w porównaniu z modelem liniowym. Zadanie 7 Korzystając z danych zawartych w arkuszu powiaty lodzkie oszacować parametry następującego modelu: U Ri = b0 + b1 M ALZi + b2 P RACi + b3 P RZEDSZKi + εi , w którym UR oznacza liczbę urodzeń żywych w powiecie, MALZ liczbę zawartych małżeństw, PRAC liczbę pracujących a PRZEDSZK liczbę miejsc dostępnych w przedszkolach funkcjonujących na terenie powiatu. Przeprowadzić weryfikację merytoryczną (zastanowić się nad poprawnością znaku przy oszacowaniu parametru b2 ). Czy w modelu występuje współliniowość zmiennych objaśniających? Jeśli tak, to których i jaki ma ona wpływ na własności statystyczne modelu? Dla tego samego zestawu danych wykonać estymacje: 1. U Ri = b0 + b1 M ALZi + b2 P RZEDSZKi + εi 2. U Ri = b0 + b1 P RACi + b2 P RZEDSZKi + εi Zweryfikować poprawność merytoryczną oszacowań parametrów obu modeli. Czy na podstawie wartości VIF można powiedzieć, że usunięta została współliniowość zmiennych objaśniających? Zaproponować zastąpienie jednej z nich inną zmienną zastępczą niosącą podobną informację, która poprawi własności statystyczne modelu. Wykorzystać zmienne z wczytanego zbioru danych. Zadanie 8 W arkuszu pow mieszkan znalazły się dane na temat łącznej powierzchni użytkowej mieszkań (PUM [tys. 2 m ]) w 42 miastach województwa łódzkiego (oprócz Łodzi) wraz z liczbą mieszkańców tych miast (LM [tys. os.]) na koniec 2006 roku. Na podstawie wyników weryfikacji testu Goldfelda-Quandta ocenić czy model postaci P U Mi = b0 +b1 LMi +εi może być estymowany na całej dostępnej próbie, czy na dwóch podpróbach odpowiednio od 1 do 20 oraz od 21 do 42 obserwacji. Dla wszystkich obserwacji łącznie wykonać estymację parametrów modelu: ln P U Mi = b0 + b1 ln LMi + εi po czym przy pomocy testu White’a zweryfikować hipotezę o występowaniu heteroskedastyczności. Czy jej obecność wpływa na wyniki weryfikacji testu istotności t-Studenta? Zadanie 9 Dla okresu od stycznia 2008 do października 2011 roku zebrano informacje na temat przeciętnej ceny pszenicy na targowiskach (CPT [zł/1 dt]), przeciętnej ceny pszenicy w punktach skupu (CSKP [zł/1 dt]) oraz łańcuchowego indeksu cen towarów i usług konsumpcyjnych. Ostatnia zmienna została zamieniona na indeks jednopodstawowy z podstawą w styczniu 2008. W arkuszu ceny zboza oznaczono ją jako CPI08. Przed wykonaniem dalszych poleceń, przy pomocy formuł pakietu GRETL, dokonać przeliczenia obu zmiennych wyrażających ceny pszenicy z wartości nominalnych na realne oznaczone odpowiednio CPTR i CSKPR. 1. Wykonać estymację parametrów modelu: CP T Rt = b0 + b1 CSKP Rt + εt a następnie: a) zweryfikować poprawność merytoryczną modelu; b) ocenić dopasowanie modelu do danych i zbadać istotność oszacowań parametrów; c) wykonać wykres reszt z modelu względem czasu i skomentować jego zachowanie; d) zweryfikować hipotezę na temat występowania autokorelacji przy pomocy testu Durbina-Watsona, zinterpretować wartość współczynnika rho1 ; e) sprawdzić, czy reszty mają rozkład normalny – skomentować wyniki w kontekście liczebności próby statystycznej; f) ocenić czy można mieć zaufanie do statystyk t-Studenta. 2. Wykonać estymację parametrów modelu: CP T Rt = b0 + b1 CSKP Rt−1 + εt , porównać go z modelem poprzednim i wskazać różnice. 3. Wykonać estymację parametrów modelu: CP T Rt = b0 + b1 CSKP Rt + b2 CP T Rt−1 + εt a następnie: a) zinterpretować wartość statystyki Durbina h; 4 b) odpowiedzieć na pytanie: jakie konsekwencje będzie miało usunięcie wyrazu wolnego; c) zwrócić uwagę na wartości statystyk t-Studenta pozostałych parametrów i skomentować ich związek z obecnością bądź nie autokorelacji w modelu; d) oszacować parametry modelu potęgowego o powyższej specyfikacji i zinterpretować wyniki. Zadanie 10 W arkuszu patenty znajdują się dane dla USA na temat liczby zgłoszonych patentów (PATENTS [tys.]) oraz wydatków na badania i rozwój (RD [mld USD]) w latach 1960-1993. Na tej podstawie oszacować parametry modelu opisującego wpływ wspomnianych wydatków na liczbę patentów. Model powinien charakteryzować się poprawnymi własnościami merytorycznymi i statystycznymi. Zinterpretować otrzymane wyniki. Zadanie 11 Arkusz ladunki samochodowe zawiera dane na temat wielkości ładunków przewiezionych transportem samochodowym w Polsce (SAM [mln ton]) oraz ilości kontenerów załadowanych i wyładowanych w polskich portach morskich (KONT [tys. ton]) od sierpnia 2008 do grudnia 2011 roku. 1. Wykonać estymację parametrów modelu: SAMt = b0 + b1 KON Tt + εt i wskazać te spośród jego własności statystycznych, które należy uznać za niepoprawne. 2. Wykonać wykres zmiennej SAM i przeanalizować jego zachowanie. Zwrócić uwagę na zachowanie w 2008 roku a następnie obciąć próbę tak, aby początek danych przypadał w styczniu 2009 roku. 3. Powtórzyć estymację parametrów po zmianie zakresu próby i ocenić zmiany jakie zaszły w porównaniu z poprzednim modelem. Wykonać wykresy: reszt i dopasowania do danych. 4. Dodać periodyczne zmienne zero-jedynkowe a następnie wykonać estymację parametrów modelu: SAMt = b0 + b1 KON Tt + b2 SAMt−1 + b3 dm1t + b4 dm12t + εt 5. Przeprowadzić weryfikację merytoryczną i statystyczną. Skomentować wartość parametru przy opóźnionej zmiennej SAM. Zadanie 12 W arkuszu ladunki kolejowe zebrane zostały wybrane zmienne mające związek z transportem kolejowym w Polsce w okresie od sierpnia 2008 do grudnia 2011 roku. Po wykonaniu wykresu zmiennej KOL okazało się, że od stycznia do listopada 2009 roku da się zaobserwować nietypowy wzrost wielkości ładunków przewiezionych koleją. W związku z tym uznano, że zestaw zmiennych należy rozszerzyć o zmienną zero-jedynkową d09 dla wspomnianego okresu. 1. Wykonać estymację parametrów modelu: KOLt = b0 + b1 P RZEMt + b2 SAMt + b3 P ROW EGt + b4 d09t + εt a następnie: a) przeprowadzić weryfikację merytoryczną; b) przeprowadzić weryfikację statystyczną (czy wykres reszt z modelu wskazuje na występowanie autokorelacji?). 2. Wykonać estymację parametrów modelu: KOLt = b0 + b1 P RZEMt + b2 SAMt + b3 P ROW EGt + b4 d09t + b5 KOLt−1 + εt a następnie: a) ocenić, czy wyraz wolny posiada interpretację; b) przeprowadzić weryfikację statystyczną (wykonać wykres reszt z modelu i porównać go z wykresem dla modelu poprzedniego). 3. Wykonać estymację parametrów modelu potęgowego do poprzedniej specyfikacji i zinterpretować wyniki. Zadanie 13 Dla danych z arkusza wegiel wykonać następujące polecenia: 1. Wyznaczyć zmienne realne PROWEGR i PRZEMR wykorzystując do tego celu jednopodstawowe indeksy odpowiednio MPI08 oraz PPI08. 5 2. Dodać periodyczne zmienne zero-jedynkowe. Na podstawie wykresu zmiennej ELEKT zadecydować, które efekty sezonowe znajdą się w modelu. 3. Wykonać estymację parametrów modelu: ELEKTt = b0 + b1 P ROW EGRt + b2 P RZEM Rt + P11 bj+2 j=1 dmjt + εt . W jego ostatecznej wersji mają się znaleźć istotne statystycznie zmienne wyrażające efekty sezonowe. 4. Zinterpretować otrzymane wyniki. Zadanie 14 W arkuszu powiaty slaskie znalazły się dane zebrane w 2006 roku w 37 powiatach województwa śląskiego. Obejmują one liczbę zgonów wywołanych chorobami układu oddechowego (ZGODD [os.]) w powiecie, emisję zanieczyszczeń gazowych powietrza (ZANGAZ [tys. t]) i wydatki budżetów gmin na ochronę zdrowia (WYZDR [mln zł]). 1. Wykonać estymację parametrów modelu: ZGODDi = b0 + b1 ZAN GAZi + b2 W Y ZDRi + εi a następnie: a) przeprowadzić weryfikację merytoryczną oszacowanych parametrów; b) przeprowadzić weryfikację statystyczną (czy współczynnik determinacji można uznać za niski?). 2. Znaleźć specyfikację modelu poprawną pod względem merytorycznym i statystycznym. Zinterpretować otrzymane wyniki. Zadanie 15 Arkusz cena samochodu zawiera dane dotyczące 20 używanych aut wystawionych na sprzedaż. Dane te obejmują cenę, wiek i pojemność silnika samochodu. Ponadto zmienna zero-jedynkowa ST wyraża stan techniczny przyjmując wartość 1 dla tych pojazdów, które są bezwypadkowe. Wykonać estymacje dwóch modeli. W pierwszym na cenę samochodu wpływać mają wiek i pojemność silnika. W drugim, oprócz poprzednich zmiennych uwzględniony zostanie stan techniczny. Porównać wyniki estymacji i wskazać, który z modeli lepiej nadaje się do dalszego wykorzystania. Dla drugiej specyfikacji oszacować model w wariancie potęgowym i zinterpretować oszacowania parametrów. Zadanie 16 Wczytać dane z arkusza powiaty scieki. Uwaga! Dane od 1 do 24 dotyczą województwa łódzkiego, od 25 do 38 województwa świętokrzyskiego. Zaproponować specyfikację i oszacować parametry modelu opisującego wpływ wybranych zmiennych na ilość ścieków wymagających oczyszczenia (zmienna SC ). Model powinien charakteryzować się poprawnymi własnościami merytorycznymi i statystycznymi. Wiadomo ponadto, że jedną ze zmiennych objaśniających ma być liczba ludności zamieszkująca dany powiat. Zinterpretować otrzymane wyniki. Zadanie 17 Wczytać dane z arkusza depozyty a następnie wartość depozytów oraz stopę ich oprocentowania przeliczyć z wartości nominalnych na realne wykorzystując jednopodstawowy wskaźnik cen towarów i usług wyrażony zmienną CPI09. Przyjąć oznaczenia odpowiednio DEP2R i RDR. Uwaga! Zmienna RD (stopa oprocentowania) podana została w procentach. 1. Wykonać estymację parametrów modelu: DEP 2Rt = b0 + b1 RDRt + εt a następnie: a) przeprowadzić weryfikację statystyczną; b) wykonać wykres zmiennej DEP2R – zwrócić uwagę na jej nieliniowe zachowanie; c) przeprowadzić weryfikację testem nieliniowości wykorzystującym kwadraty zmiennych (wyjaśnić dlaczego nie można użyć logarytmów); d) przy pomocy testu RESET zweryfikować hipotezę na temat poprawności specyfikacji modelu. 2. Dodać zmienną time i podnieść ją do kwadratu przy pomocy odpowiedniej formuły w pakiecie GRETL tworząc zmienną t2 . 3. Wykonać estymację parametrów modelu: DEP 2Rt = b0 + b1 RDRt + b2 t2 + εt a następnie: 6 a) przeprowadzić weryfikację merytoryczną i statystyczną; b) wykonać wykres dopasowania i zwrócić uwagę na nietypowe zachowanie zmiennej DEP2R na przełomie 2009 i 2010 roku; c) ponowne wykonać test RESET. 4. Utworzyć zmienną zero-jedynkową d1202 dla okresu od 2009:12 do 2010:02. 5. Wykonać estymację parametrów modelu: DEP 2Rt = b0 + b1 RDRt + b2 t2 + b3 d1202 + b4 DEP 2Rt−1 + εt a następnie: a) przeprowadzić weryfikację statystyczną i rozstrzygnąć czy w modelu występuje autokorelacja na podstawie wartości statystyki Durbina h; b) użyć testu LM (Breuscha-Godfreya) na występowanie autokorelacji 1 rzędu. Zadanie 18 W arkuszu urlopy znalazły się dane na temat kwartalnego zysku pewnego biura turystycznego (ZBT [tys. zł]). Ponadto zebrano informacje o liczbie dni wolnych wraz z urlopem do wykorzystania, którymi dysponują klienci biura (W ) oraz ich realnym dochodzie do dyspozycji w przeliczeniu na osobę (D [zł]). 1. Wykonać wykres zmiennej ZBT i dodać periodyczne zmienne zero-jedynkowe. 2. Wykonać estymację parametrów modelu: P BTt = b0 +b1 Wt +b2 Dt +b3 dq1t +b4 dq2t +b5 dq3t +εt a następnie: a) przeprowadzić weryfikację merytoryczną i statystyczną; b) przy pomocy testu nieliniowości dla logarytmów zmiennych ustalić, czy model powinien mieć postać liniową; c) wykonać test RESET (które zmienne należy usunąć z modelu i dlaczego?). 3. Wykonać estymację parametrów modelu: P BTt = b0 + b1 Dt + b2 dq2t + b3 dq3t + εt a następnie: a) ponownie wykonać test nieliniowości; b) ponownie wykonać test RESET; c) zweryfikować hipotezę na temat występowania autokorelacji w modelu. 4. Wykonać estymację parametrów modelu: ln P BTt = b0 + b1 ln Dt−2 + b2 dq2t + b3 dq3t + εt po czym: a) ustalić czy wartość statystyki w teście Durbina-Watsona wskazuje na obecność w modelu autokorelacji; b) rozstrzygnąć o występowaniu autokorelacji na przykład przy pomocy testu mnożnika Lagrange’a. 7