Imię1 NAZWISKO1 - Intelligent
Transkrypt
Imię1 NAZWISKO1 - Intelligent
PROBLEMY KOMUNIKACYJNE MIAST W WARUNKACH ZATŁOCZENIA MOTORYZACYJNEGO X Poznańska Konferencja Naukowo-Techniczna Poznań-Rosnówko 17-19.06.2015 Rafał KUCHARSKI* Marek BAUER** Tomasz KULPA ** Andrzej SZARATA *** *) mgr inż., **) dr inż., ***) dr hab. inż., prof. PK, Zakład Systemów Komunikacyjnych, Politechnika Krakowska, ul. Warszawska 24, 31-155 Kraków MODELOWANIE WYBORU ŚRODKA TRANSPORTU – PORÓWNANIE REGRESJI LOGISTYCZNEJ I LOGITOWEGO MODELU WYBORU DYSKRETNEGO Niniejszy artykuł jest teoretyczną analizą porównawczą dwóch modeli matematycznych używanych w modelowaniu wyboru środka transportu przez podróżnego. Opisujemy i porównujemy tu dwa modele: regresję logistyczną i model logitowy. Obydwa powszechnie stosowane w praktyce i często niesłusznie uznawane ze identyczne. Dzięki formalnemu zdefiniowaniu modeli możliwa jest ich analiza, porównanie założeń i przedstawienie interpretacji. W artykule tym pokazujemy różnice w założeniach modeli i ich konsekwencje. Obydwa modele określają prawdopodobieństwo wyboru danego środka transportu jako funkcję jego atrakcyjności. Wywodzą się jednak z różnych założeń. Model logitowy jest modelem wyboru dyskretnego, regresja logistyczna jest z kolei dopasowaniem funkcji jednej zmiennej do zaobserwowanego zjawiska. Pokażemy jakie są konsekwencje tych założeń w: doborze zmiennych objaśniających wybór (ograniczony w regresji i nieograniczony w modelu logitowym); liczbie alternatyw (dwie w regresji, dowolna ilość w modelu logitowym); postaci pochodnej, czyli wrażliwości na zmianę atrakcyjności (silnie nieliniowa i złożona w regresji) i procesie kalibracji (tradycyjny w regresji z wykorzystaniem zagregowanych obserwacji i symulacyjny z wykorzystaniem wszystkich obserwacji w modelu logitowym). Słowa kluczowe: podział zadań przewozowych, modal split, podział modalny, funkcja logitowa, model logitowy. 1. Problem wyboru środka transportu Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA Rozważmy problem wyboru środka transportu przez podróżnego w danej sytuacji X. Podróżny wybiera środek transportu a spośród dostępnych mu alternatyw a A z danym prawdopodobieństwem paX . W niniejszym artykule rozważamy wybór pomiędzy dwiema alternatywami: komunikacją zbiorową i indywidualną A {KZ , KI } . Porównajmy dwa modele matematyczne określające p-wo wyboru środka transportu paX , nazwane kolejno: regresją logistyczną i modelem logitowym. W obydwu modelach paX może być zdefiniowane jako funkcja użyteczności U aX dostępnych środków transportu a A . Użyteczność alternatywy (środka transportu) a jest zależna od danej sytuacji X i jej czynników wpływających na użyteczność. W odniesieniu do środka transportu czynniki, które wpływają na wybór w danej sytuacji to zazwyczaj: czas przejazdu, koszt przejazdu, czas dojścia, liczba przesiadek, koszt parkowania, itp. Wobec tego sytuację X możemy zdefiniować jako wektor wartości czynników wpływających na wybór w danej sytuacji (1), np. czas podróży KZ i KI, koszt biletu, liczba przesiadek, czas dojścia do przystanku, koszt parkowania, itp. Takie ujęcie pozwala na wyrażenie użyteczności danego środka transportu jako funkcji danej sytuacji (2), a następnie na wyrażenie p-wa wyboru środka transportu jako funkcji użyteczności (3). Dla tak zdefiniowanego p-wa zachodzą podstawowe zależności: (4), oraz (5). X {x1 , x2 , , xn } (1) U aX f ( X ) f ({x1 , x2 , , xn }) (2) p f (U ) (3) paX 0,1 (4) (5) X a p aA X a 1 X a Dwa porównywane modele różnią się w definiowaniu powyższych funkcji: określeniu użyteczności alternatywy jako funkcji sytuacji i określeniu pwa jako funkcji użyteczności. 1.1. Regresja logistyczna W regresji logistycznej tradycyjnie zakłada się, że użyteczność (2) jest określona dla jednego ze środków transportu i wyrażona jest jako funkcja czasów przejazdu w każdej z alternatyw, a dokładniej ilorazem czasów przejazdu (6). Ujęcie takie pozwala uprościć problem wyboru do funkcji jednej zmiennej – użyteczności jednego ze środków transportu i zastosować metody matematyczne dla jednej zmiennej, np. regresję jednej zmiennej. Aby to było możliwe użyteczność jest wyrażona jako względna różnica w czasie przejazdu pomiędzy Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy komunikacją zbiorową a indywidualną. Tak zdefiniowana użyteczność może być zastosowana jako zmienna objaśniająca w problemie wyboru środka transportu. Niestety problem może być uproszczony do jednej zmiennej tylko wówczas gdy rozważamy wybór między dwiema alternatywami. Tak wyrażona użyteczność (6) jest używana do obliczenia p-wa wyboru środka transportu w regresji logistycznej jednej zmiennej (7). Regresja ta jest nieliniowa, zakłada się tu, że zależność pomiędzy p-wem wyboru środka transportu, a użytecznością opisana jest dystrybuantą rozkładu logistycznego (7). W modelu logitowym rozkład logistyczny służy do określenia zmienności losowej użyteczności (12) – stąd podobieństwa w formułach dwóch modeli. Zmienną niezależną w regresji jest użyteczność jednego ze środków transportu (zazwyczaj KI), a zmienną zależną pwo wyboru alternatywy (tej dla której określono użyteczność). Parametrem modelu jest mnożnik określający względną wagę czasu w komunikacji indywidualnej w stosunku do czasu w komunikacji zbiorowej. t (6) U KIX KI tKZ pKIX 1 (7) X 1 eU KI X X pKZ 1 pKI (8) c (9) U KIX KI cKZ Dodatkowym rozwinięciem powyższego modelu może być użycie kosztu c zamiast czasu w formule określającej użyteczność (9). Pozwala to na uwzględnienie dodatkowych czynników sytuacji X poza czasem przejazdu, np. liczby przesiadek, czasu dojścia, kosztu parkowania, itp. Wtedy pojawia się jednak problem praktyczny przy normalizacji kosztów i określeniu miarodajnego ilorazu określającego względną atrakcyjność. 1.2. Model Logitowy W modelu logitowym użyteczność jest określona dla każdej alternatywy z osobna, jako funkcja czynników sytuacji xi i ich współczynników βi . Ze względu na późniejsze założenia modelu logitowego użyteczność wyrażona jest jako składowa dwóch elementów: użyteczności mierzalnej V, oraz losowej części ε, zgodnie ze wzorem (10), część mierzalna będzie określona w modelu na podstawie zmiennych danej sytuacji, natomiast o części losowej założymy jedynie rozkład p-wa. Ujęcie takie pozwala na uchwycenie po pierwsze różnych preferencji użytkowników i ich subiektywnych, odczuwalnych użyteczności alternatywy (np. nie dla każdego przesiadka jest tak samo uciążliwa), po drugie pozwala uwzględnić błędy użytkowników w ocenie użyteczności Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA (niedoszacowanie, przeszacowanie), po trzecie pozwala uchwycić wszelkie niemierzalne czynniki losowe wpływające na wybór środka transportu (np. komfort, przyzwyczajenie, modę, itp.). Użyteczność mierzalna V jest określona jako funkcja liniowa czynników sytuacji X (11), warto przy tym podkreślić, że liniowość dotyczy jedynie współczynników βi (muszą one być stałe), podczas gdy same czynniki mogą być przekształcone nieliniowo (np. logarytmiczny wzrost uciążliwości czasu, skokowy wzrost uciążliwości przesiadkę). Z kolei, o losowej części użyteczności ε zakłada, że jest zmienną losową o zadanym rozkładzie. W modelu logitowym zakłada się, że losowa część użyteczności ma rozkład logistyczny o dystrybuancie F(ε) danej przez (12). Model logitowy zakłada, że użytkownik wybierze alternatywę o największej użyteczności max U aX spośród dostępnych mu alternatyw a A . aA Jednak po zdefiniowaniu użyteczności jako sumy dwu składowych (mierzalnej, określonej V i niemierzalnej, losowej ε) użyteczność staje się funkcją zmiennej losowej ε. Wobec tego p-wo wyboru alternatywy a staje się również funkcją zmiennej losowej i wyrażone jest jako (13), czyli p-wo że użyteczność danej alternatywy jest największa spośród wszystkich alternatyw. Założenie o rozkładzie części losowej (12) pozwala określić p-wo w formie modelu logitowego (14). Dla dwóch alternatyw (rozpatrywane w regresji logistycznej A {KZ , KI } ), p-wo wyboru jednej z nich wyrażone jest jako (15), co upraszcza postać modelu logitowego do (16). Zwyczajowo [1] dodawany w modelu logitowym parametr skali jest coraz częściej pomijany i ustępuje wygodniejszemu w praktyce uwzględnia się pośrednio, poprzez zmianę czynników βi (17), co zmniejsza stopień swobody układu i upraszcza kalibrację – kalibrowane są jedynie współczynniki βi. U aX VaX aX X a V x xi X F ( ) i i 0 1 x1 2 x2 1 1 e n xn (12) paX Pr U aX max U aX' Pr U aX max U aX' paX (10) (11) a 'A\{a } eU a eUa ' a 'A (13) (14) a 'A X p Pr U KIX U KZ X KI pKIX eU KI eU KI eU KZ (15) (16) Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy VaX x xi X i i (17) 1.3. Iloraz, czy różnica Dla porównania dwu powyższych modeli, przeprowadźmy następującą operacje na modelu logitowym (16). Podzielmy licznik i mianownik przez eU KI , aby uzyskać model logitowy wyrażony w formie jednej zmiennej (18). Okazuje się, że jest on wówczas objaśniany nie ilorazem (tak jak w regresji) a różnicą pomiędzy użytecznościami. Pozwala to zarysować podstawową różnicę w założeniu: p-wo wyboru środka transportu w regresji logistycznej jest funkcją ilorazu użyteczności, podczas gdy w modelu logitowym jest funkcją różnicy pomiędzy użytecznościami. eU KI eU KI 1 / eU KI 1 1 U KI U KZ U KI U KZ U KI U KZ U KI U KZ U KI e e e e e e 1/ e 1 e U KI U KI e e (18) 1.4. Analiza wrażliwości Przeprowadźmy analizę wrażliwości p-wa wyboru środka transportu (3) na zmianę użyteczności (19). Określenie wrażliwości wyboru na zmianę sytuacji jest bardzo istotne. W praktyce podstawowe pytanie w modelowaniu wyboru to: o ile wzrośnie udział danej alternatywy, gdy zwiększymy jej atrakcyjność (nowa linia, zwiększenie prędkości, spadek ceny, etc.), a odpowiedź zależy wprost od postaci pochodnej przyjętego modelu. W akapicie niniejszym przedstawimy pochodne dla obydwu modeli matematycznych. Załóżmy, że użyteczność komunikacji indywidualnej (w tym wypadku czas tKI) jest stała i wyraźmy zmianę p-wa wyboru komunikacji zbiorowej w formie funkcji jej użyteczności (czasu tKZ). Aby to obliczyć najpierw określmy wrażliwość samej użyteczności. W modelu logitowym użyteczność jest wyrażona w formie liniowej zależności (11), a więc jej pochodna cząstkowa ze względu na zmianę czynnika xi jest stała i wyniesie i (20). Co, przy założeniu że / xi 0 , oznacza, że użyteczność U ma również taką wrażliwość (21). Mamy więc prostą interpretację, że użyteczność alternatywy wzrasta proporcjonalnie do wzrostu danej zmiennej objaśniającej xi z współczynnikiem proporcjonalności równym i . Z kolei w wypadku regresji logistycznej użyteczność jest wyrażona w formie ilorazu (6), a zmienna zależna tKZ jest w mianowniku. Prowadzi to do nieliniowej pochodnej cząstkowej ze względu na zmianę czasu przejazdu (22). Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA Znając wrażliwość użyteczności na zmianę wartości czynników xi i parametrów βi możemy określić wrażliwość p-wa na zmianę użyteczności jednej z alternatyw (19). W wypadku modelu logitowego pochodna przyjmuje postać (23), co wyrażone w formie funkcji zmiany czasu przejazdu można przedstawić jako (24). W wypadku regresji logistycznej postać pochodnej ze względu na użyteczność przyjmuje postać (25) analogiczną do modelu logitowego, jednak już wyrażenie pochodnej jako funkcji czasu tKZ (26) wprowadza dodatkowy czynnik od którego zależna jest pochodna: tKI. Wobec tego wrażliwość (26) jest funkcją nie tylko użyteczności i współczynnika , ale jest odwrotnie proporcjonalna do użyteczności alternatywnego środka transportu tKI, co utrudnia interpretacje wrażliwości. paX U aX V i xi U (V ) V 0 KZ tKZ tKZ tKZ U tKI tKZ tKZ 2 (19) (20) (21) (22) pKZ eU KZ U KI U U KZ (e KZ eU KI )2 (23) pKZ eU KZ U KI p UKZ KZ KZ U KI 2 KZ tKZ (e e ) U KZ (24) pKZ eU KZ U U KZ (e KZ 1)2 (25) X X X pKZ e tKZ /tKI pKZ X X X tKZ / tKI 2 tKZ tKI (e tKI U KZ 1) (26) 2. ESTYMACJA MODELI W tej części pokażemy sposób estymacji obydwu modeli na podstawie dostępnych danych. Posłużymy się standardowymi danymi dostępnymi do przeprowadzania analiz transportowych w Polsce: dzienniczkiem podróży wykonywanym w ramach KBR. Dzienniczek zawiera informacje o podróżach Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy jakie badani podróżni odbyli w danej sytuacji X. Część opisu sytuacji podróżny sam podał w dzienniczku (czas i miejsce rozpoczęcia, motywacja, środek transportu, dochód, dostępność samochodu itp.), a część musi być dobrana ze źródeł zewnętrznych, np. z modelu ruchu (czas podróży, liczba przesiadek, koszt parkowania, czas dojścia, itp.). O podróżnym wiemy, że wybrał dany środek transportu a (deklaruje to w dzienniczku), wobec tego zaobserwowane p-wo wyboru tego środka transportu paX 1 , a zaobserwowane p-wo wyboru innych środków transportu jest zerowe a ' a : paX' 0 . Informacja ta jest jednostkową obserwacją wyboru środka transportu a w danej sytuacji X. Celem estymacji jest takie dobranie współczynników modelu, aby zamodelowane p-wa p były jak najbliższe tym zaobserwowanym p . Szukać będziemy więc minimum pewnej miary dopasowania (27), określonej wobec całej obserwowanej próby X X . Zamodelowane p-wo jest funkcją zmiennych danej sytuacji X {x1 , x2 , , xn } i współczynników modelu. Rozwiązania będziemy szukać w przestrzeni możliwych wartości parametrów modelu, odpowiednio dla modelu logitowego β { 0 , 1 , 2 , , n } , oraz dla regresji logistycznej. W regresji logistycznej korzysta się zazwyczaj ze zagregowanych wartości. Tworzy się szereg rozdzielczy obserwacji, grupując je ze względu na iloraz czasów t KI / t KZ . Dla obserwacji z danego przedziału ilorazów określa się, jaka część wszystkich podróży z danego przedziału [min, max) odbyła się komunikacją indywidualną (28) i to stanowi pojedynczą obserwację. Liczba obserwacji jest więc równa liczbie przedziałów w szeregu rozdzielczym, a waga każdej obserwacji równa się liczbie podróży w każdym z przedziałów. Pozwala to na estymację za pomocą dopasowania kształtu krzywej regresji logistycznej do obserwacji,; poziom swobody problemu regresji jest jeden (parametr ). Przy określaniu miary dopasowania można stosować klasyczne, jednowymiarowe miary, np. błąd średnio kwadratowy, czy korelację r2. W modelu logitowym, z kolei, do kalibracji wykorzystuje się każdą obserwację X X z osobna. Wymaga to jednak miary określającej dopasowanie zamodelowanego p-wa do tego zaobserwowanego,; powszechnie w szacowaniu modeli dyskretnych, w szczególności dwumianowych wykorzystuje się tzw. miarę log-likelihood (29). Jako, że zaobserwowane p-wo może przyjąć tylko dwie wartości paX {0,1} , a model logitowy określa prawdopodobieństwo z zakresu paX (0,1] , do określenia dopasowania pojedynczej obserwacji stosuje się odwzorowanie logarytmiczne, które daje wyniki ujemne ( x 1 ln( x ) 0 ). Miarą dopasowania całej próby X jest L określona jako (30). Im L jest bliższe zera, tym lepsze dopasowanie modelu. Jednak w praktyce, aby uzyskać miarodajną ocenę dopasowania, porównuje się miarę L(β) dla dwóch parametryzacji: a) β0 : i 0 czyli dla wyników modelu losowego, w którym Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA użyteczności są zerowe, a więc p 0.5 niezależnie od alternatywy i sytuacji, oraz b) dla wyników estymacji. I mniejsza jest wartość L w stosunku do modelu losowego β0 tym lepsze dopasowanie modelu (31). Im wartość (31) jest bliższa jedynce, tym lepsze dopasowanie modelu. Narzędziem pozwalającym estymować parametry modelu logitowego jest np. ogólnodostępny pakiet BIOGEME [3]. X X paX paX X :tKI / tKZ [min,max) (27) pKIX X pKIX pKZ paX ln( paX ) L(β ) 1 (29) p X X L(β) L(β0) (28) X a ln( p ) X a (30) (31) 3. PORÓWNANIE MODELI Obydwa modele mają podobne formuły i podobną postać korzystającą z rozkładu logistycznego, różnią się jednak zasadniczo, jeśli chodzi o koncepcję. Regresja logistyczna opisuje p-wo wyboru środka transportu jako funkcję ilorazu czasów i ma ograniczone możliwości użycia innych czynników niż czas w opisie użyteczności. Przebieg zmienności tej funkcji jest złożony i nie ma czytelnej interpretacji jak zmiana użyteczności zmienia p-wo wyboru środka transportu. Dwa przekształcenia nieliniowe: iloraz i regresja logistyczna komplikują wnioskowanie i intuicyjność. W estymacji regresji logistycznej używa się zagregowanych danych, które operują jedynie na średnim obserwowanym udziale danego środka transportu wyrażonym jako funkcja jednej zmiennej: użyteczności, czyli ilorazu czasu, tracone są informacje o rozrzucie wyborów w zależności od sytuacji. Regresja logistyczna może być stosowana tylko dla dwóch alternatyw, poszerzenie zbioru alternatyw o kolejną opcję jest niemożliwe (z powodu postaci ilorazowej). Ponadto brak jest intuicyjnej interpretacji modelu, bo o ile można uzasadnić, że iloraz czasów przejazdu objaśnia wybór środka transportu, o tyle ciężko uzasadnić dlaczego wrażliwość na tą zmianę układa się wzdłuż dystrybuanty rozkładu logistycznego. Ponadto regresja logistyczna ma tylko jeden stopień swobody, parametr , co znacznie zmniejsza możliwości kalibracji. Model logitowym z kolei czerpie z bardzo bogatej rodziny modeli wyboru dyskretnego, dogłębnie przebadanej, opisanej i zweryfikowanej w dziesiątkach Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy zastosowań praktycznych [1], nie tylko transportowych. Model logitowym ma ścisłe uzasadnienie kształtu funkcji, które wprost wynika z założenia o rozkładzie czynnika losowego w użyteczności i wynikających z tego prawdopodobieństw, że dana alternatywa ma największą użyteczność. Jedynym arbitralnym założeniem jest więc założenie o tym, że losowa część użyteczności ma rozkład logistyczny (rozkład zbliżony do normalnego, tylko o „grubszych ogonach”). To jest akceptowalne założenie i zazwyczaj zgodne z rzeczywistym procesem wyboru. Model logitowy wykorzystuje wszystkie zaobserwowane wybory w zbiorze zaobserwowanych sytuacji X, a stosowana miara log-likelihood pozwala oszacować model dwumianowy i wykorzystać faktyczną informacje płynącą z obserwacji. Dla typowych wyników KBR mamy więc do kalibracji zbiór kilkudziesięciu tysięcy podróży, zamiast kilkunastu przedziałów użytych w regresji logistycznej. Model logitowy ma znacznie więcej stopni swobody, tyle ile parametrów β i (co bardzo istotne) pozawala na uchwycenie tzw. stałej alternatywy 0 (ASC - Alternative Specific Constant), bez której nie jest możliwe uchwycenie niesymetrycznej skłonności użytkowników ku jednej z alternatyw. Zazwyczaj wybory użytkowników nie są ściśle racjonalne i nie tylko różnią się pomiędzy użytkownikami (co jest uchwycone w losowej uzyteczności ), ponadto użytkownicy mają skłonność do wyboru subiektywnie atrakcyjniejszych alternatyw z powodu mody, przyzwyczajenia, itp. W modelu logitowym jest to uwzględnione za pomocą parametru 0 , natomiast w regresji logistycznej można to osiągnąć, ale poprzez parametr , który jednocześnie opisuje wrażliwość modelu, co ogranicza możliwości odwzorowania jednocześnie wrażliwości i skłonności. Opisany w niniejszej analizie dwumianowy model logitowy może z powodzeniem być rozszerzony do wielomianowego modelu logitowego, w którym liczba alternatyw nie jest ograniczona. Pozwala to na uwzględnienie pozostałych środków transportu, np. rower, podróże łączone, piesze, itd. i odpowiednie określenie ich użyteczności. Wówczas tracimy możliwość przedstawienia modelu w formie wykresu jednej zmiennej, ale wciąż możemy analizować jego wrażliwość i wyniki w poszczególnych sytuacjach. Ograniczeniem w uwzględnianych alternatywach jest to, że muszą być one nieskorelowane i niezależne, w wypadku skorelowanych alternatyw stosuje się model zagnieżdżony. 4. PODSUMOWANIE Artykuł niniejszy przedstawia formalne porównanie dwóch modeli matematycznych. Skupiono się tu na strukturze, założeniach i działaniu dwóch modeli. Pokazano w jaki sposób porównywane modele odpowiadają na pytanie o Rafał KUCHARSKI, Marek BAUER, Tomasz KULPA, Andrzej SZARATA wybór środka transportu przez użytkownika. Dwa modele zasadniczo różnią się od siebie, pomimo pozornego podobieństwa. Kontynuacją niniejszego porównania powinna być analiza faktycznych wyborów użytkowników (uzyskanych z wyników KBR z ostatnich lat) i odpowiedź na pytanie jaki jest proces wyboru środka transportu. Jeśli okaże się, że: a) liczba istotnych alternatyw wybieranych przez użytkowników to nie tylko komunikacja zbiorowa i indywidualna, a znaczna część użytkowników wybiera np. rower, podróże łączone, czy podwożenie, b) wykazana zostanie istotna zależność wyboru środka transportu z czynnikiem innym niż czas (np. koszt parkowania, zarobki, dostępność pojazdu, niezawodność, zatłoczenie, itp.), wówczas modelowanie wyboru środka transportu regresją logistyczną okaże się niepoprawne i niemożliwe będzie dobre odwzorowanie faktycznych zachowań. MATERIAŁY ŹRÓDŁOWE [1] Ben-Akiva M., Lerman S. (1985) Discrete Choice Analysis, MIT Press, Cambridge [2] Bhat, Chandra R. (1998) Accommodating variations in responsiveness to level-ofservice measures in travel mode choice modeling. Transportation Research Part A. [3] Bierlaire, M. (2003) BIOGEME: a free package for the estimation of discrete choice models, Proceedings of the 3rd Swiss Transportation Research Conference, Ascona, Switzerland. www.strc.ch [4] Dudek M. (2011) Wpływ parametrów jakościowych transportu zbiorowego na podział zadań przewozowych, Przegląd Komunikacyjny 11/2011. [5] Frejinger E., Bierlaire M. (2010) On path generation algorithms for route choice models. Choice Modelling: The State-of-the-art and the State-of practice Proceedings. [6] Jamroz K., Birr K., Grulkowski S., Kalkowski K., Budziszewski T. (2014) Analiza możliwości wzrostu udziału transportu zbiorowego w wojewódzkich przewozach pasażerskich na przykładzie województwa pomorskiego, Transport Miejski i Regionalny 08/2014. [7] Kucharski, R. (2012). Tło teoretyczne dla adaptacyjnego, dynamicznego modelu wyboru ścieżki w modelu ruchu, Modelowanie Podróży i prognozowanie ruchu, Kraków. [8] Pinjari A., (2011) Modeling the choice continuum: an integrated model of residential location, auto ownership, bicycle ownership, and commute tour mode choice decisions. Transportation. [9] Szarata A. (2005) Ocena efektywności funkcjonalnej parkingów przesiadkowych (P+R), Praca Doktorska, Politechika Krakowska, 2005. Modelowanie wyboru środka transportu – regresja logistyczna i model logitowy MODE CHOICE MODELS – COMPARING THE LOGIT MODEL WITH THE LOGISTIC REGRESSION We propose theoretical analysis of the two mathematical models commonly used to model mode choice process. One is the discrete choice model, namely multinomial logit model, while second one is the logistic regression, which are often confused. The formal analysis and fundamental definitions provide insight on what is the mathematical structure of the model and what are the practical implications. The article is concluded with remarks on the calibration process. Keywords: mode choice, discrete choice, modal split, logit model, logistic regression, log-likelihood estimation.