Ukryte łańcuchy Markowa jako metoda analizy danych panelowych

Transkrypt

Ukryte łańcuchy Markowa jako metoda analizy danych panelowych
Ukryte łańcuchy Markowa jako metoda analizy
danych panelowych
Monika Książek
Szkoła Główna Handlowa w Warszawie
Celem referatu jest zaprezentowanie możliwości jakich dostarcza metodologia
ukrytych łańcuchów Markowa w analizie danych panelowych.
Pierwsza część referatu poświęcona będzie prezentacji metodologii ukrytych
łańcuchów Markowa. Przedmiotem analizy są obiekty obserwowane w kilku momentach
czasu, opisywane w każdym z tych momentów przez pewne zmienne mierzalne. W
modelach ukrytych łańcuchów Markowa zakłada się, że badane obiekty znajdują się w
każdym momencie czasu w jednym z dyskretnych stanów pewnego procesu. O procesie
tym zakłada się, że ma własność Markowa, to znaczy, że stan osiągany w danym
momencie zależy od stanu z poprzedniego momentu, ale nie od stanów z okresów
wcześniejszych. Stany są nieobserwowalne, ale przynależność do nich determinują
obserwowane wartości zmiennych mierzalnych. Zmienne te są zatem wskaźnikami
nieobserwowalnego stanu. Parametrami modelu są: prawdopodobieństwa przynależności
do poszczególnych stanów w pierwszym okresie, macierz przejścia oraz rozkłady
warunkowe zmiennych obserwowalnych. Regułą jest przyjmowanie założenia
niezmienność pomiaru które oznacza, że ostatnia grupa parametrów jest stała w czasie.
Standardowy model ukrytego łańcucha Markowa można rozszerzyć o współzmienne.
Współzmienne wpływają na prawdopodobieństwa przynależności do stanów w pierwszym
okresie oraz na prawdopodobieństwa przejścia. Mogą one być obserwowalne lub
nieobserwowalne. Nieobserwowalna współzmienna ma charakter klasy ukrytej i może
mieć swoje własne wskaźniki. Model z nieobserwowalnymi współzmiennymi nazywa się
mieszanym modelem ukrytego łańcucha Markowa. W referacie zostanie zaprezentowana
specyfikacja mieszanego modelu ukrytego łańcucha Markowa z obserwowalnymi
współzmiennymi. Omówione zostaną również metody estymacji tych modeli: metoda EM i
Newtona-Rapsona oraz sposób oceny jakości modelu.
Drugą część referatu będzie stanowił przykład zastosowania modelu mieszanego
ukrytego łańcucha Markowa z obserwowalną współzmienną. Przedmiotem analizy będzie
stan portfela oszczędności i kredytów polskich gospodarstw domowych. Wskaźnikami
stanu portfela będą: posiadanie oszczędności i kredytów, forma i przeznaczenie
oszczędności, typ kredytodawcy oraz cel kredytów. Zgodnie z teoriami zachowań
finansowych, na przynależność do wyłonionych stanów będzie wpływał bieżący dochód.
Klasa ukryta powinna natomiast rozróżniać osoby o różnych postawach wobec
oszczędzania i zadłużania się oraz różnych zdolnościach zarządzania finansami.
Wskaźnikami ukrytej klasy będą wykształcenie, klasa wielkości miejscowości, poziom i
źródło dochodu oraz okres urodzenia. Dane zostaną zaczerpnięte z Diagnozy Społecznej badania panelowego prowadzonego na reprezentatywnej próbie polskich gospodarstw
domowych.
Słowa kluczowe: model ukrytego łańcucha Markowa, mieszany model ukrytego łańcucha
Markowa, model ukrytego łańcucha Markowa ze współzmiennymi, model klas ukrytych,
oszczędności i zadłużenie gospodarstw domowych
Literatura:
Rószkiewicz Małgorzata, „Oszczędzanie. Postawy i zachowania polskich gospodarstw
domowych wobec oszczędzania”, Aureus, Warszawa 2008
Langeheine Rolf, van de Pol Frank, „Latent Markov Chains” w: Applied Latent Class
Analysis pod red. Hagenaars Jacques A., McCutcheon Allan L., Cambridge University
Press 2002, str. 304-341
Vermunt J.K. , Magidson J., “Technical Guide for Latent GOLD 4.0: Basic and Advanced”,
Statistical Innovations Inc., 2005