Modele liniowe i nieliniowe (laboratorium 3) 1 Przykład 1 (Dane
Transkrypt
Modele liniowe i nieliniowe (laboratorium 3) 1 Przykład 1 (Dane
Modele liniowe i nieliniowe (laboratorium 3) Przykład 1 (Dane: Transport w Polsce (dane ogólne)) Celem analizy będzie sporządzenie prognozy liczby pasażerów przewożonych koleją w roku 20102012. Do prognozy wykorzystany zostanie model liniowy i kwadratowy. Poniżej omówiono poszczególne etapy sporządzania prognozy. Etap 1 (Analiza graficzna) 900 000 800 000 800 000 700 000 600 000 500 000 400 000 700 000 600 000 500 000 400 000 300 000 300 000 200 000 200 000 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Przewozy pasażerów (koleje) [tys. osób] 900 000 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Przewozy pasażerów (koleje) [tys. osób] Podczas analizy danych czasowych pierwszym etapem musi być wzrokowa analiza dynamiki rozważanego zjawiska. Najczęściej polega ona na sporządzeniu wykresu liniowego (różne rodzaje tych wykresów były omawiane na zajęciach nr 1). W celu sporządzenia wykresu liniowego posługujemy się poleceniami Wykresy / Wykresy 2W / Wykresy liniowe (zmiennych). Następnie za pomocą przycisku Zmienne wybieramy Przewozy pasażerów (koleje). W zakładce Więcej wskazujemy Dopasowanie liniowe i wykonujemy wykres. Następnie proszę przywrócić okno tworzenia wykresu i sporządzić w analogiczny sposób wykres z modelem w postaci wielomianu (domyślnie jest to wielomian stopnia 2. czyli funkcja kwadratowa). Proszę tak sformatować wykresy, by wyglądały one jak poniżej. Proszę spróbować tak skonstruować wykres, by oba modele – liniowy i kwadratowy, były dopasowane do danych na jednym wykresie. Wnioski z analizy graficznej: Wzrokowa ocena jakości dopasowania obu modeli do danych oraz wiarygodności otrzymanych na ich podstawie prognoz każe zdecydowanie wyżej ocenić model kwadratowy. Tym niemniej dalsze rozważania będą prowadzone równolegle dla obu modeli. Etap 2 (Wzór modelu) W nagłówku wykresu liniowego pokazany jest matematyczny wzór modelu liniowego (kwadratowego). Wzór ten zostanie wykorzystany do sporządzenia prognozy. Aby sporządzić prognozę dla modelu liniowego postępujemy w następujący sposób. Na końcu arkusza dodajemy dwie nowe zmienne – jedną z nich nazywamy X a drugą Model liniowy. Zmienną X wypełniamy kolejnymi numerami obserwacji (1, …, 20) zaś zmienną Model liniowy wyliczamy wykorzystując formułę z nagłówka wykresu. W kolejnym etapie do arkusza dodajemy na końcu trzy nowe przypadki wprowadzając dla zmiennej X numery kolejnych lat (21, 22, 23) i wyliczamy prognozę. W analogiczny sposób wyznaczamy prognozę za pomocą modelu kwadratowego. Fragment arkusza danych wraz z wyliczoną prognozą zamieszczono powyżej. 1 Modele liniowe i nieliniowe (laboratorium 3) Etap 3 (wykorzystanie analizy regresji) Do tej pory posługiwaliśmy się tylko i wyłącznie informacjami otrzymanymi za pomocą wykresów liniowych z dopasowaniem odpowiednich modeli. Bardziej uniwersalne narzędzie do konstruowania modeli trendów (z większą liczbą wyników i szerszymi możliwościami jeśli chodzi o zakres modeli) oferuje moduł Regresja wieloraka. Omówiona zostanie konstrukcja i najważniejsze wyniki analiz przeprowadzonych za pomocą tego modułu, a na końcu zostanie sporządzona za jego pomocą prognoza na lata 2010-2012 dla modelu liniowego i kwadratowego. Model liniowy Za pomocą poleceń Statystyka / Regresja wieloraka uruchamiamy wejściowe okno służące do konstruowania modeli liniowych i wybieramy zmienne: na liście zmiennych zależnych wskazujemy przewozy pasażerskie koleją na liście zmiennych niezależnych wprowadzoną uprzednio zmienną X (zawierającą numer obserwacji). Po zatwierdzeniu wyboru zmiennych przechodzimy do okna Wyniki regresji wielokrotnej, gdzie za pomocą przycisku Podsumowanie wywołujemy najważniejsze wyniki analiz. Na obecnym etapie w arkuszu wyników interesować nas będą tylko dwie kolumny B i p oraz wartość R2 umieszczona w nagłówku tabeli. W kolumnie B umieszczone są współczynniki funkcji modelu liniowego zaś w kolumnie p znajduje się ocena istotności poszczególnych składników modelu – jeżeli są one poniżej 0,05 oznacza to, że obecność danego czynnika w modelu jest uzasadniona. W nagłówku modelu znajduje się wartość R2, zwana współczynnikiem determinacji, który na ogół wyraża się w procentach (83,2%). Współczynnik determinacji określa jakość dopasowania modelu do danych i przyjmuje wartości z zakresu 0-100%. W naszym przypadku można stwierdzić, iż model liniowy jest dość dobrze dopasowany do danych – współczynnik determinacji wynosi ponad 80%. Aby uzyskać wartość prognozy dla kolejnych lat, przywracamy okno analizy i wywołujemy zakładkę Reszty, założenia, predykcja po czym wywołujemy polecenie Predykcja zmiennej zależnej. Podajemy odpowiedni numer okresu (dla roku 2010 – 21) i wywołujemy prognozę. Następnie analogicznie sporządzamy prognozy dla roku 2011 i 2012. Wyniki obejmują nie tylko prognozę punktową (identyczną zresztą z wynikami uzyskanymi wcześniej) ale także pewien zakres, w którym z 95% pewnością powinna znaleźć się prognozowana wielkość. W rozważanym przypadku szerokość przedziału prognozy jest dosyć duża, co oczywiście obniża jej wiarygodność i praktyczne znaczenie. Model kwadratowy W arkuszu danych dodajemy po zmiennej X nową kolumnę i nazywamy ją X2 a następnie za pomocą odpowiedniej formuły wyznaczamy jej wartości jako kwadraty zmiennej X. W dalszej części postępujemy analogicznie, z tym że do modelu regresji jako zmiennej niezależne wprowadzamy zarówno X jak i X2. Proszę uzyskać analogiczne wyniki jak dla modelu liniowego. Podać wzór modelu, ocenić istotność jego składowych, podać jakość dopasowania i wartość prognozy (punktowej i przedziałowej dla lat 2010-2012). Rok 2010 2011 2012 Przewozy pasażerów w transporcie kolejowych (w mln osób) Model liniowy (R2 = 83,2%) Model kwadratowy (R2 = ) Prognoza Prognoza Prognoza Prognoza punktowa przedziałowa punktowa przedziałowa 168,9 110,6–229,2 2