Modele liniowe i nieliniowe (laboratorium 3) 1 Przykład 1 (Dane

Transkrypt

Modele liniowe i nieliniowe (laboratorium 3) 1 Przykład 1 (Dane
Modele liniowe i nieliniowe (laboratorium 3)
Przykład 1 (Dane: Transport w Polsce (dane ogólne))
Celem analizy będzie sporządzenie prognozy liczby pasażerów przewożonych koleją w roku 20102012. Do prognozy wykorzystany zostanie model liniowy i kwadratowy.
Poniżej omówiono poszczególne etapy sporządzania prognozy.
Etap 1 (Analiza graficzna)
900 000
800 000
800 000
700 000
600 000
500 000
400 000
700 000
600 000
500 000
400 000
300 000
300 000
200 000
200 000
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
Przewozy pasażerów (koleje) [tys. osób]
900 000
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
Przewozy pasażerów (koleje) [tys. osób]
Podczas analizy danych czasowych pierwszym etapem musi być wzrokowa analiza dynamiki rozważanego
zjawiska. Najczęściej polega ona na sporządzeniu wykresu liniowego (różne rodzaje tych wykresów były
omawiane na zajęciach nr 1). W celu sporządzenia wykresu liniowego posługujemy się poleceniami Wykresy /
Wykresy 2W / Wykresy liniowe (zmiennych). Następnie za pomocą przycisku Zmienne wybieramy Przewozy
pasażerów (koleje). W zakładce Więcej wskazujemy Dopasowanie liniowe i wykonujemy wykres. Następnie
proszę przywrócić okno tworzenia wykresu i sporządzić w analogiczny sposób wykres z modelem w postaci
wielomianu (domyślnie jest to wielomian stopnia 2. czyli funkcja kwadratowa).
Proszę tak sformatować wykresy, by wyglądały one jak poniżej.
Proszę spróbować tak skonstruować wykres, by oba modele – liniowy i kwadratowy, były
dopasowane do danych na jednym wykresie.
Wnioski z analizy graficznej: Wzrokowa ocena jakości dopasowania obu modeli do danych oraz
wiarygodności otrzymanych na ich podstawie prognoz każe zdecydowanie wyżej ocenić model
kwadratowy. Tym niemniej dalsze rozważania będą prowadzone równolegle dla obu modeli.
Etap 2 (Wzór modelu)
W nagłówku wykresu liniowego pokazany jest matematyczny wzór modelu liniowego (kwadratowego). Wzór
ten zostanie wykorzystany do sporządzenia prognozy. Aby sporządzić prognozę dla modelu liniowego
postępujemy w następujący sposób.
Na końcu arkusza dodajemy dwie nowe zmienne –
jedną z nich nazywamy X a drugą Model liniowy.
Zmienną X wypełniamy kolejnymi numerami
obserwacji (1, …, 20) zaś zmienną Model liniowy
wyliczamy wykorzystując formułę z nagłówka
wykresu. W kolejnym etapie do arkusza dodajemy na
końcu trzy nowe przypadki wprowadzając dla
zmiennej X numery kolejnych lat (21, 22, 23) i
wyliczamy prognozę. W analogiczny sposób
wyznaczamy prognozę za pomocą modelu
kwadratowego. Fragment arkusza danych wraz z
wyliczoną prognozą zamieszczono powyżej.
1
Modele liniowe i nieliniowe (laboratorium 3)
Etap 3 (wykorzystanie analizy regresji)
Do tej pory posługiwaliśmy się tylko i wyłącznie informacjami otrzymanymi za pomocą wykresów liniowych z
dopasowaniem odpowiednich modeli. Bardziej uniwersalne narzędzie do konstruowania modeli trendów (z
większą liczbą wyników i szerszymi możliwościami jeśli chodzi o zakres modeli) oferuje moduł Regresja
wieloraka. Omówiona zostanie konstrukcja i najważniejsze wyniki analiz przeprowadzonych za pomocą tego
modułu, a na końcu zostanie sporządzona za jego pomocą prognoza na lata 2010-2012 dla modelu liniowego i
kwadratowego.
Model liniowy
Za pomocą poleceń Statystyka / Regresja wieloraka uruchamiamy wejściowe okno służące do konstruowania
modeli liniowych i wybieramy zmienne: na liście zmiennych zależnych wskazujemy przewozy pasażerskie
koleją na liście zmiennych niezależnych wprowadzoną uprzednio zmienną X (zawierającą numer obserwacji).
Po zatwierdzeniu wyboru zmiennych przechodzimy do okna Wyniki regresji wielokrotnej, gdzie za pomocą
przycisku Podsumowanie
wywołujemy najważniejsze
wyniki analiz. Na obecnym
etapie w arkuszu wyników
interesować nas będą tylko
dwie kolumny B i p oraz
wartość R2 umieszczona w
nagłówku tabeli.
W kolumnie B umieszczone są współczynniki funkcji modelu liniowego zaś w kolumnie p znajduje się ocena
istotności poszczególnych składników modelu – jeżeli są one poniżej 0,05 oznacza to, że obecność danego
czynnika w modelu jest uzasadniona. W nagłówku modelu znajduje się wartość R2, zwana współczynnikiem
determinacji, który na ogół wyraża się w procentach (83,2%). Współczynnik determinacji określa jakość
dopasowania modelu do danych i przyjmuje wartości z zakresu 0-100%. W naszym przypadku można
stwierdzić, iż model liniowy jest dość dobrze dopasowany do danych – współczynnik determinacji wynosi ponad
80%.
Aby uzyskać wartość prognozy dla kolejnych lat,
przywracamy okno analizy i wywołujemy zakładkę
Reszty, założenia, predykcja po czym wywołujemy
polecenie Predykcja zmiennej zależnej. Podajemy
odpowiedni numer okresu (dla roku 2010 – 21) i
wywołujemy
prognozę.
Następnie
analogicznie
sporządzamy prognozy dla roku 2011 i 2012. Wyniki
obejmują nie tylko prognozę punktową (identyczną
zresztą z wynikami uzyskanymi wcześniej) ale także
pewien zakres, w którym z 95% pewnością powinna znaleźć się prognozowana wielkość. W rozważanym
przypadku szerokość przedziału prognozy jest dosyć duża, co oczywiście obniża jej wiarygodność i praktyczne
znaczenie.
Model kwadratowy
W arkuszu danych dodajemy po zmiennej X nową kolumnę i nazywamy ją X2 a następnie za pomocą
odpowiedniej formuły wyznaczamy jej wartości jako kwadraty zmiennej X. W dalszej części postępujemy
analogicznie, z tym że do modelu regresji jako zmiennej niezależne wprowadzamy zarówno X jak i X2.
Proszę uzyskać analogiczne wyniki jak dla modelu liniowego. Podać wzór modelu, ocenić istotność jego
składowych, podać jakość dopasowania i wartość prognozy (punktowej i przedziałowej dla lat 2010-2012).
Rok
2010
2011
2012
Przewozy pasażerów w transporcie kolejowych (w mln osób)
Model liniowy (R2 = 83,2%)
Model kwadratowy (R2 =
)
Prognoza
Prognoza
Prognoza
Prognoza
punktowa
przedziałowa
punktowa
przedziałowa
168,9
110,6–229,2
2