Imię1 NAZWISKO1 - Intelligent

Transkrypt

Imię1 NAZWISKO1 - Intelligent
PROBLEMY KOMUNIKACYJNE MIAST W WARUNKACH ZATŁOCZENIA MOTORYZACYJNEGO
X Poznańska Konferencja Naukowo-Techniczna
Poznań-Rosnówko 17-19.06.2015
Rafał KUCHARSKI*
Marek BAUER**
Tomasz KULPA **
Andrzej SZARATA ***
*) mgr inż., **) dr inż., ***) dr hab. inż., prof. PK,
Zakład Systemów Komunikacyjnych, Politechnika Krakowska, ul. Warszawska
24, 31-155 Kraków
MODELOWANIE WYBORU ŚRODKA TRANSPORTU –
PORÓWNANIE REGRESJI LOGISTYCZNEJ I
LOGITOWEGO MODELU WYBORU DYSKRETNEGO
Niniejszy artykuł jest teoretyczną analizą porównawczą dwóch modeli matematycznych
używanych w modelowaniu wyboru środka transportu przez podróżnego. Opisujemy i
porównujemy tu dwa modele: regresję logistyczną i model logitowy. Obydwa
powszechnie stosowane w praktyce i często niesłusznie uznawane ze identyczne. Dzięki
formalnemu zdefiniowaniu modeli możliwa jest ich analiza, porównanie założeń i
przedstawienie interpretacji. W artykule tym pokazujemy różnice w założeniach modeli i
ich konsekwencje. Obydwa modele określają prawdopodobieństwo wyboru danego
środka transportu jako funkcję jego atrakcyjności. Wywodzą się jednak z różnych założeń.
Model logitowy jest modelem wyboru dyskretnego, regresja logistyczna jest z kolei
dopasowaniem funkcji jednej zmiennej do zaobserwowanego zjawiska. Pokażemy jakie
są konsekwencje tych założeń w: doborze zmiennych objaśniających wybór (ograniczony
w regresji i nieograniczony w modelu logitowym); liczbie alternatyw (dwie w regresji,
dowolna ilość w modelu logitowym); postaci pochodnej, czyli wrażliwości na zmianę
atrakcyjności (silnie nieliniowa i złożona w regresji) i procesie kalibracji (tradycyjny w
regresji z wykorzystaniem zagregowanych obserwacji i symulacyjny z wykorzystaniem
wszystkich obserwacji w modelu logitowym).
Słowa kluczowe: podział zadań przewozowych, modal split, podział modalny,
funkcja logitowa, model logitowy.
1. Problem wyboru środka transportu
Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA
Rozważmy problem wyboru środka transportu przez podróżnego w danej
sytuacji X. Podróżny wybiera środek transportu a spośród dostępnych mu
alternatyw a  A z danym prawdopodobieństwem paX . W niniejszym artykule
rozważamy wybór pomiędzy dwiema alternatywami: komunikacją zbiorową i
indywidualną A  {KZ , KI } . Porównajmy dwa modele matematyczne określające
p-wo wyboru środka transportu paX , nazwane kolejno: regresją logistyczną i
modelem logitowym.
W obydwu modelach paX może być zdefiniowane jako funkcja
użyteczności U aX dostępnych środków transportu a  A . Użyteczność
alternatywy (środka transportu) a jest zależna od danej sytuacji X i jej czynników
wpływających na użyteczność. W odniesieniu do środka transportu czynniki,
które wpływają na wybór w danej sytuacji to zazwyczaj: czas przejazdu, koszt
przejazdu, czas dojścia, liczba przesiadek, koszt parkowania, itp. Wobec tego
sytuację X możemy zdefiniować jako wektor wartości czynników wpływających
na wybór w danej sytuacji (1), np. czas podróży KZ i KI, koszt biletu, liczba
przesiadek, czas dojścia do przystanku, koszt parkowania, itp. Takie ujęcie
pozwala na wyrażenie użyteczności danego środka transportu jako funkcji danej
sytuacji (2), a następnie na wyrażenie p-wa wyboru środka transportu jako funkcji
użyteczności (3). Dla tak zdefiniowanego p-wa zachodzą podstawowe zależności:
(4), oraz (5).
X  {x1 , x2 , , xn }
(1)
U aX  f ( X )  f ({x1 , x2 ,
, xn })
(2)
p  f (U )
(3)
paX  0,1
(4)
(5)
X
a
p
aA
X
a
1
X
a
Dwa porównywane modele różnią się w definiowaniu powyższych
funkcji: określeniu użyteczności alternatywy jako funkcji sytuacji i określeniu pwa jako funkcji użyteczności.
1.1. Regresja logistyczna
W regresji logistycznej tradycyjnie zakłada się, że użyteczność (2) jest
określona dla jednego ze środków transportu i wyrażona jest jako funkcja czasów
przejazdu w każdej z alternatyw, a dokładniej ilorazem czasów przejazdu (6).
Ujęcie takie pozwala uprościć problem wyboru do funkcji jednej zmiennej –
użyteczności jednego ze środków transportu i zastosować metody matematyczne
dla jednej zmiennej, np. regresję jednej zmiennej. Aby to było możliwe
użyteczność jest wyrażona jako względna różnica w czasie przejazdu pomiędzy
Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy
komunikacją zbiorową a indywidualną. Tak zdefiniowana użyteczność może być
zastosowana jako zmienna objaśniająca w problemie wyboru środka transportu.
Niestety problem może być uproszczony do jednej zmiennej tylko wówczas gdy
rozważamy wybór między dwiema alternatywami. Tak wyrażona użyteczność (6)
jest używana do obliczenia p-wa wyboru środka transportu w regresji logistycznej
jednej zmiennej (7). Regresja ta jest nieliniowa, zakłada się tu, że zależność
pomiędzy p-wem wyboru środka transportu, a użytecznością opisana jest
dystrybuantą rozkładu logistycznego (7). W modelu logitowym rozkład
logistyczny służy do określenia zmienności losowej użyteczności (12) – stąd
podobieństwa w formułach dwóch modeli. Zmienną niezależną w regresji jest
użyteczność jednego ze środków transportu (zazwyczaj KI), a zmienną zależną pwo wyboru alternatywy (tej dla której określono użyteczność). Parametrem
modelu jest mnożnik  określający względną wagę czasu w komunikacji
indywidualnej w stosunku do czasu w komunikacji zbiorowej.
t
(6)
U KIX    KI
tKZ
pKIX 
1
(7)
X
1  eU KI
X
X
pKZ
 1  pKI
(8)
c
(9)
U KIX    KI
cKZ
Dodatkowym rozwinięciem powyższego modelu może być użycie kosztu
c zamiast czasu w formule określającej użyteczność (9). Pozwala to na
uwzględnienie dodatkowych czynników sytuacji X poza czasem przejazdu, np.
liczby przesiadek, czasu dojścia, kosztu parkowania, itp. Wtedy pojawia się
jednak problem praktyczny przy normalizacji kosztów i określeniu miarodajnego
ilorazu  określającego względną atrakcyjność.
1.2. Model Logitowy
W modelu logitowym użyteczność jest określona dla każdej alternatywy
z osobna, jako funkcja czynników sytuacji xi i ich współczynników βi . Ze względu
na późniejsze założenia modelu logitowego użyteczność wyrażona jest jako
składowa dwóch elementów: użyteczności mierzalnej V, oraz losowej części ε,
zgodnie ze wzorem (10), część mierzalna będzie określona w modelu na
podstawie zmiennych danej sytuacji, natomiast o części losowej założymy jedynie
rozkład p-wa. Ujęcie takie pozwala na uchwycenie po pierwsze różnych
preferencji użytkowników i ich subiektywnych, odczuwalnych użyteczności
alternatywy (np. nie dla każdego przesiadka jest tak samo uciążliwa), po drugie
pozwala uwzględnić błędy użytkowników w ocenie użyteczności
Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA
(niedoszacowanie, przeszacowanie), po trzecie pozwala uchwycić wszelkie
niemierzalne czynniki losowe wpływające na wybór środka transportu (np.
komfort, przyzwyczajenie, modę, itp.). Użyteczność mierzalna V jest określona
jako funkcja liniowa czynników sytuacji X (11), warto przy tym podkreślić, że
liniowość dotyczy jedynie współczynników βi (muszą one być stałe), podczas gdy
same czynniki mogą być przekształcone nieliniowo (np. logarytmiczny wzrost
uciążliwości czasu, skokowy wzrost uciążliwości przesiadkę). Z kolei, o losowej
części użyteczności ε zakłada, że jest zmienną losową o zadanym rozkładzie. W
modelu logitowym zakłada się, że losowa część użyteczności ma rozkład
logistyczny o dystrybuancie F(ε) danej przez (12).
Model logitowy zakłada, że użytkownik wybierze alternatywę o
największej użyteczności max U aX spośród dostępnych mu alternatyw a  A .
aA
Jednak po zdefiniowaniu użyteczności jako sumy dwu składowych (mierzalnej,
określonej V i niemierzalnej, losowej ε) użyteczność staje się funkcją zmiennej
losowej ε. Wobec tego p-wo wyboru alternatywy a staje się również funkcją
zmiennej losowej i wyrażone jest jako (13), czyli p-wo że użyteczność danej
alternatywy jest największa spośród wszystkich alternatyw. Założenie o
rozkładzie części losowej (12) pozwala określić p-wo w formie modelu
logitowego (14). Dla dwóch alternatyw (rozpatrywane w regresji logistycznej
A  {KZ , KI } ), p-wo wyboru jednej z nich wyrażone jest jako (15), co upraszcza
postać modelu logitowego do (16). Zwyczajowo [1] dodawany w modelu
logitowym parametr skali  jest coraz częściej pomijany i ustępuje
wygodniejszemu w praktyce uwzględnia się pośrednio, poprzez zmianę
czynników βi (17), co zmniejsza stopień swobody układu i upraszcza kalibrację –
kalibrowane są jedynie współczynniki βi.
U aX  VaX   aX
X
a
V

 x
xi X
F ( ) 
i i
  0  1 x1   2 x2 
1
1  e  

  n xn
(12)
 
paX  Pr U aX  max U aX'  Pr U aX  max U aX'
paX 
(10)
(11)
a 'A\{a }
eU a
 eUa '
a 'A

(13)
(14)
a 'A
X
p  Pr U KIX  U KZ

X
KI
pKIX 
eU KI
eU KI  eU KZ
(15)
(16)
Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy
VaX 
  x
xi X
i i
(17)
1.3. Iloraz, czy różnica
Dla porównania dwu powyższych modeli, przeprowadźmy następującą
operacje na modelu logitowym (16). Podzielmy licznik i mianownik przez eU KI ,
aby uzyskać model logitowy wyrażony w formie jednej zmiennej (18). Okazuje
się, że jest on wówczas objaśniany nie ilorazem (tak jak w regresji) a różnicą
pomiędzy użytecznościami. Pozwala to zarysować podstawową różnicę w
założeniu: p-wo wyboru środka transportu w regresji logistycznej jest funkcją
ilorazu użyteczności, podczas gdy w modelu logitowym jest funkcją różnicy
pomiędzy użytecznościami.
eU KI
eU KI
1 / eU KI
1
1


 U KI

U KZ
U KI
U KZ
U KI
U KZ
U KI
U KZ U KI
e
e
e e
e e
1/ e
1 e
 U KI
U KI
e
e
(18)
1.4. Analiza wrażliwości
Przeprowadźmy analizę wrażliwości p-wa wyboru środka transportu (3)
na zmianę użyteczności (19). Określenie wrażliwości wyboru na zmianę sytuacji
jest bardzo istotne. W praktyce podstawowe pytanie w modelowaniu wyboru to:
o ile wzrośnie udział danej alternatywy, gdy zwiększymy jej atrakcyjność (nowa
linia, zwiększenie prędkości, spadek ceny, etc.), a odpowiedź zależy wprost od
postaci pochodnej przyjętego modelu. W akapicie niniejszym przedstawimy
pochodne dla obydwu modeli matematycznych. Załóżmy, że użyteczność
komunikacji indywidualnej (w tym wypadku czas tKI) jest stała i wyraźmy zmianę
p-wa wyboru komunikacji zbiorowej w formie funkcji jej użyteczności (czasu
tKZ). Aby to obliczyć najpierw określmy wrażliwość samej użyteczności. W
modelu logitowym użyteczność jest wyrażona w formie liniowej zależności (11),
a więc jej pochodna cząstkowa ze względu na zmianę czynnika xi jest stała i
wyniesie  i (20). Co, przy założeniu że  / xi  0 , oznacza, że użyteczność U
ma również taką wrażliwość (21). Mamy więc prostą interpretację, że użyteczność
alternatywy wzrasta proporcjonalnie do wzrostu danej zmiennej objaśniającej xi
z współczynnikiem proporcjonalności równym  i . Z kolei w wypadku regresji
logistycznej użyteczność jest wyrażona w formie ilorazu (6), a zmienna zależna
tKZ jest w mianowniku. Prowadzi to do nieliniowej pochodnej cząstkowej ze
względu na zmianę czasu przejazdu (22).
Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA
Znając wrażliwość użyteczności na zmianę wartości czynników xi i
parametrów βi możemy określić wrażliwość p-wa na zmianę użyteczności jednej
z alternatyw (19). W wypadku modelu logitowego pochodna przyjmuje postać
(23), co wyrażone w formie funkcji zmiany czasu przejazdu można przedstawić
jako (24). W wypadku regresji logistycznej postać pochodnej ze względu na
użyteczność przyjmuje postać (25) analogiczną do modelu logitowego, jednak już
wyrażenie pochodnej jako funkcji czasu tKZ (26) wprowadza dodatkowy czynnik
od którego zależna jest pochodna: tKI. Wobec tego wrażliwość (26) jest funkcją
nie tylko użyteczności i współczynnika  , ale jest odwrotnie proporcjonalna do
użyteczności alternatywnego środka transportu tKI, co utrudnia interpretacje
wrażliwości.
paX
U aX
V
 i
xi
U (V   ) V


 0   KZ
tKZ
tKZ
tKZ
U
  tKI

tKZ
tKZ 2
(19)
(20)
(21)
(22)
pKZ
eU KZ U KI
 U
U KZ (e KZ  eU KI )2
(23)
pKZ
 eU KZ U KI
p
 UKZ
  KZ  KZ
U KI 2
KZ
tKZ (e  e )
U KZ
(24)
pKZ
eU KZ
 U
U KZ (e KZ  1)2
(25)
X
X
X
pKZ
 e  tKZ /tKI
 pKZ



X
X
X
 tKZ
/ tKI
2
tKZ tKI (e
tKI U KZ
 1)
(26)
2. ESTYMACJA MODELI
W tej części pokażemy sposób estymacji obydwu modeli na podstawie
dostępnych danych. Posłużymy się standardowymi danymi dostępnymi do
przeprowadzania analiz transportowych w Polsce: dzienniczkiem podróży
wykonywanym w ramach KBR. Dzienniczek zawiera informacje o podróżach
Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy
jakie badani podróżni odbyli w danej sytuacji X. Część opisu sytuacji podróżny
sam podał w dzienniczku (czas i miejsce rozpoczęcia, motywacja, środek
transportu, dochód, dostępność samochodu itp.), a część musi być dobrana ze
źródeł zewnętrznych, np. z modelu ruchu (czas podróży, liczba przesiadek, koszt
parkowania, czas dojścia, itp.). O podróżnym wiemy, że wybrał dany środek
transportu a (deklaruje to w dzienniczku), wobec tego zaobserwowane p-wo
wyboru tego środka transportu paX  1 , a zaobserwowane p-wo wyboru innych
środków transportu jest zerowe a '  a : paX'  0 . Informacja ta jest jednostkową
obserwacją wyboru środka transportu a w danej sytuacji X. Celem estymacji jest
takie dobranie współczynników modelu, aby zamodelowane p-wa p były jak
najbliższe tym zaobserwowanym p . Szukać będziemy więc minimum pewnej
miary dopasowania (27), określonej wobec całej obserwowanej próby X  X .
Zamodelowane p-wo jest funkcją zmiennych danej sytuacji X  {x1 , x2 , , xn } i
współczynników modelu. Rozwiązania będziemy szukać w przestrzeni
możliwych wartości parametrów modelu, odpowiednio dla modelu logitowego
β  { 0 , 1 ,  2 , ,  n } , oraz  dla regresji logistycznej.
W regresji logistycznej korzysta się zazwyczaj ze zagregowanych
wartości. Tworzy się szereg rozdzielczy obserwacji, grupując je ze względu na
iloraz czasów t KI / t KZ . Dla obserwacji z danego przedziału ilorazów określa się,
jaka część wszystkich podróży z danego przedziału [min, max) odbyła się
komunikacją indywidualną (28) i to stanowi pojedynczą obserwację. Liczba
obserwacji jest więc równa liczbie przedziałów w szeregu rozdzielczym, a waga
każdej obserwacji równa się liczbie podróży w każdym z przedziałów. Pozwala
to na estymację za pomocą dopasowania kształtu krzywej regresji logistycznej do
obserwacji,; poziom swobody problemu regresji jest jeden (parametr  ). Przy
określaniu miary dopasowania można stosować klasyczne, jednowymiarowe
miary, np. błąd średnio kwadratowy, czy korelację r2.
W modelu logitowym, z kolei, do kalibracji wykorzystuje się każdą
obserwację X  X z osobna. Wymaga to jednak miary określającej dopasowanie
zamodelowanego p-wa do tego zaobserwowanego,; powszechnie w szacowaniu
modeli dyskretnych, w szczególności dwumianowych wykorzystuje się tzw.
miarę log-likelihood (29). Jako, że zaobserwowane p-wo może przyjąć tylko dwie
wartości paX  {0,1} , a model logitowy określa prawdopodobieństwo z zakresu
paX  (0,1] , do określenia dopasowania pojedynczej obserwacji stosuje się
odwzorowanie logarytmiczne, które daje wyniki ujemne ( x  1  ln( x )  0 ).
Miarą dopasowania całej próby X jest L określona jako (30). Im L jest bliższe
zera, tym lepsze dopasowanie modelu. Jednak w praktyce, aby uzyskać
miarodajną ocenę dopasowania, porównuje się miarę L(β) dla dwóch
parametryzacji: a) β0 :  i  0 czyli dla wyników modelu losowego, w którym
Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA
użyteczności są zerowe, a więc p  0.5 niezależnie od alternatywy i sytuacji, oraz
b) dla wyników estymacji. I mniejsza jest wartość L w stosunku do modelu
losowego β0 tym lepsze dopasowanie modelu (31). Im wartość (31) jest bliższa
jedynce, tym lepsze dopasowanie modelu. Narzędziem pozwalającym estymować
parametry modelu logitowego jest np. ogólnodostępny pakiet BIOGEME [3].

X X
paX  paX

X :tKI / tKZ [min,max)
(27)
pKIX
X
pKIX  pKZ
paX  ln( paX )
L(β ) 
1
(29)
p
X X
L(β)
L(β0)
(28)
X
a
 ln( p )
X
a
(30)
(31)
3. PORÓWNANIE MODELI
Obydwa modele mają podobne formuły i podobną postać korzystającą z
rozkładu logistycznego, różnią się jednak zasadniczo, jeśli chodzi o koncepcję.
Regresja logistyczna opisuje p-wo wyboru środka transportu jako funkcję
ilorazu czasów i ma ograniczone możliwości użycia innych czynników niż czas
w opisie użyteczności. Przebieg zmienności tej funkcji jest złożony i nie ma
czytelnej interpretacji jak zmiana użyteczności zmienia p-wo wyboru środka
transportu. Dwa przekształcenia nieliniowe: iloraz i regresja logistyczna
komplikują wnioskowanie i intuicyjność. W estymacji regresji logistycznej używa
się zagregowanych danych, które operują jedynie na średnim obserwowanym
udziale danego środka transportu wyrażonym jako funkcja jednej zmiennej:
użyteczności, czyli ilorazu czasu, tracone są informacje o rozrzucie wyborów w
zależności od sytuacji. Regresja logistyczna może być stosowana tylko dla dwóch
alternatyw, poszerzenie zbioru alternatyw o kolejną opcję jest niemożliwe (z
powodu postaci ilorazowej). Ponadto brak jest intuicyjnej interpretacji modelu, bo
o ile można uzasadnić, że iloraz czasów przejazdu objaśnia wybór środka
transportu, o tyle ciężko uzasadnić dlaczego wrażliwość na tą zmianę układa się
wzdłuż dystrybuanty rozkładu logistycznego. Ponadto regresja logistyczna ma
tylko jeden stopień swobody, parametr  , co znacznie zmniejsza możliwości
kalibracji.
Model logitowym z kolei czerpie z bardzo bogatej rodziny modeli wyboru
dyskretnego, dogłębnie przebadanej, opisanej i zweryfikowanej w dziesiątkach
Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy
zastosowań praktycznych [1], nie tylko transportowych. Model logitowym ma
ścisłe uzasadnienie kształtu funkcji, które wprost wynika z założenia o rozkładzie
czynnika losowego  w użyteczności i wynikających z tego prawdopodobieństw,
że dana alternatywa ma największą użyteczność. Jedynym arbitralnym
założeniem jest więc założenie o tym, że losowa część użyteczności ma rozkład
logistyczny (rozkład zbliżony do normalnego, tylko o „grubszych ogonach”). To
jest akceptowalne założenie i zazwyczaj zgodne z rzeczywistym procesem
wyboru. Model logitowy wykorzystuje wszystkie zaobserwowane wybory w
zbiorze zaobserwowanych sytuacji X, a stosowana miara log-likelihood pozwala
oszacować model dwumianowy i wykorzystać faktyczną informacje płynącą z
obserwacji. Dla typowych wyników KBR mamy więc do kalibracji zbiór
kilkudziesięciu tysięcy podróży, zamiast kilkunastu przedziałów użytych w
regresji logistycznej. Model logitowy ma znacznie więcej stopni swobody, tyle ile
parametrów β i (co bardzo istotne) pozawala na uchwycenie tzw. stałej
alternatywy  0 (ASC - Alternative Specific Constant), bez której nie jest
możliwe uchwycenie niesymetrycznej skłonności użytkowników ku jednej z
alternatyw. Zazwyczaj wybory użytkowników nie są ściśle racjonalne i nie tylko
różnią się pomiędzy użytkownikami (co jest uchwycone w losowej uzyteczności
 ), ponadto użytkownicy mają skłonność do wyboru subiektywnie
atrakcyjniejszych alternatyw z powodu mody, przyzwyczajenia, itp. W modelu
logitowym jest to uwzględnione za pomocą parametru  0 , natomiast w regresji
logistycznej można to osiągnąć, ale poprzez parametr  , który jednocześnie
opisuje wrażliwość modelu, co ogranicza możliwości odwzorowania
jednocześnie wrażliwości i skłonności.
Opisany w niniejszej analizie dwumianowy model logitowy może z
powodzeniem być rozszerzony do wielomianowego modelu logitowego, w
którym liczba alternatyw nie jest ograniczona. Pozwala to na uwzględnienie
pozostałych środków transportu, np. rower, podróże łączone, piesze, itd. i
odpowiednie określenie ich użyteczności. Wówczas tracimy możliwość
przedstawienia modelu w formie wykresu jednej zmiennej, ale wciąż możemy
analizować jego wrażliwość i wyniki w poszczególnych sytuacjach.
Ograniczeniem w uwzględnianych alternatywach jest to, że muszą być one
nieskorelowane i niezależne, w wypadku skorelowanych alternatyw stosuje się
model zagnieżdżony.
4. PODSUMOWANIE
Artykuł niniejszy przedstawia formalne porównanie dwóch modeli
matematycznych. Skupiono się tu na strukturze, założeniach i działaniu dwóch
modeli. Pokazano w jaki sposób porównywane modele odpowiadają na pytanie o
Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA
wybór środka transportu przez użytkownika. Dwa modele zasadniczo różnią się
od siebie, pomimo pozornego podobieństwa. Kontynuacją niniejszego
porównania powinna być analiza faktycznych wyborów użytkowników
(uzyskanych z wyników KBR z ostatnich lat) i odpowiedź na pytanie jaki jest
proces wyboru środka transportu. Jeśli okaże się, że:
a) liczba istotnych alternatyw wybieranych przez użytkowników to nie
tylko komunikacja zbiorowa i indywidualna, a znaczna część
użytkowników wybiera np. rower, podróże łączone, czy podwożenie,
b) wykazana zostanie istotna zależność wyboru środka transportu z
czynnikiem innym niż czas (np. koszt parkowania, zarobki,
dostępność pojazdu, niezawodność, zatłoczenie, itp.),
wówczas modelowanie wyboru środka transportu regresją logistyczną
okaże się niepoprawne i niemożliwe będzie dobre odwzorowanie faktycznych
zachowań.
MATERIAŁY ŹRÓDŁOWE
[1] Ben-Akiva M., Lerman S. (1985) Discrete Choice Analysis, MIT Press, Cambridge
[2] Bhat, Chandra R. (1998) Accommodating variations in responsiveness to level-ofservice measures in travel mode choice modeling. Transportation Research Part A.
[3] Bierlaire, M. (2003) BIOGEME: a free package for the estimation of discrete choice
models, Proceedings of the 3rd Swiss Transportation Research Conference, Ascona,
Switzerland. www.strc.ch
[4] Dudek M. (2011) Wpływ parametrów jakościowych transportu zbiorowego na
podział zadań przewozowych, Przegląd Komunikacyjny 11/2011.
[5] Frejinger E., Bierlaire M. (2010) On path generation algorithms for route choice
models. Choice Modelling: The State-of-the-art and the State-of practice Proceedings.
[6] Jamroz K., Birr K., Grulkowski S., Kalkowski K., Budziszewski T. (2014) Analiza
możliwości wzrostu udziału transportu zbiorowego w wojewódzkich przewozach
pasażerskich na przykładzie województwa pomorskiego, Transport Miejski i
Regionalny 08/2014.
[7] Kucharski, R. (2012). Tło teoretyczne dla adaptacyjnego, dynamicznego modelu
wyboru ścieżki w modelu ruchu, Modelowanie Podróży i prognozowanie ruchu,
Kraków.
[8] Pinjari A., (2011) Modeling the choice continuum: an integrated model of residential
location, auto ownership, bicycle ownership, and commute tour mode choice
decisions. Transportation.
[9] Szarata A. (2005) Ocena efektywności funkcjonalnej parkingów przesiadkowych
(P+R), Praca Doktorska, Politechika Krakowska, 2005.
Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy
MODE CHOICE MODELS – COMPARING THE LOGIT MODEL
WITH THE LOGISTIC REGRESSION
We propose theoretical analysis of the two mathematical models commonly used to model
mode choice process. One is the discrete choice model, namely multinomial logit model,
while second one is the logistic regression, which are often confused. The formal analysis
and fundamental definitions provide insight on what is the mathematical structure of the
model and what are the practical implications. The article is concluded with remarks on
the calibration process.
Keywords: mode choice, discrete choice, modal split, logit model, logistic
regression, log-likelihood estimation.