Zastosowanie reguł logicznych do analizy przeżycia

Transkrypt

Zastosowanie reguł logicznych do analizy przeżycia
Projekt stypendialny
SWIFT
(Stypendia Wspomagające Innowacyjne Forum Technologii)
POKL.08.02.01-24-005/10
Temat:
Zastosowanie reguł logicznych do analizy przeżycia
Obszar technologiczny:
Technologie informacyjne i telekomunikacyjne
Imię, nazwisko:
ŁUKASZ WRÓBEL
Instytucja, Wydział, Instytut/Katedra:
Politechnika Śląska, Wydział Automatyki, Elektroniki i Informatyki, Instytut Informatyki
Krótka charakterystyka badań
Badania obejmowały opracowanie nowych metod eksploracji danych cenzurowanych. Dane
cenzurowane to takie, w których badaną zmienną jest czas do pojawienia się określonego zdarzenia
(np. śmierć pacjenta, nawrót choroby, awaria urządzenia). Główną trudnością w analizie tego typu
danych jest częste występowanie tzw. obserwacji uciętych (cenzurowanych), dla których dokładny
czas wystąpienia zdarzenia nie jest znany. Obecność obserwacji uciętych wymaga stosowania
specjalnych metod analizy, które ogólnie nazywane są analizą przeżycia. Analiza przeżycia stanowi
podstawowe narzędzie analityczne w studiach nad umieralnością pacjentów, nawrotom choroby,
czy też w badaniach nad skutecznością nowych terapii leczenia. Znalazła również liczne
zastosowania w takich obszarach jak: przemysł maszynowy (analiza niezawodności), ekonomia
(analiza trwania) oraz socjologia (analiza historii zdarzeń). Podstawowymi technikami analizy
przeżycia są parametryczne i pół-parametryczne metody statystyczne, spośród których szczególną
rolę odgrywają metody służące do modelowania wpływu zmiennych objaśniających na czas
przeżycia (np. regresyjny model proporcjonalnego hazardu Coxa). Metody te jednak często
wymagają spełnienia dodatkowych restrykcyjnych założeń dotyczących rozkładu analizowanych
danych oraz na ogół nie umożliwiają modelowania wielowymiarowych nieliniowych zależności.
Dlatego też w ramach przeprowadzonych prac zaproponowano nowe nieparametryczne metody
analizy przeżycia wykorzystujące technikę uczenia maszynowego, jaką jest indukcja reguł.
Opracowane algorytmy umożliwiają odkrywanie wiedzy z danych cenzurowanych oraz wyrażanie
odkrytych zależności za pomocą prostych i zrozumiałych dla człowieka formuł logicznych postaci
jeżeli-to.
Projekt współfinansowany ze środków Unii Europejskiej
w ramach Europejskiego Funduszu Społecznego