Klasyfikacja dokumentów tekstowych

Transkrypt

Klasyfikacja dokumentów tekstowych
Klasyfikacja dokumentów tekstowych
03/19/08
Maria Marchwicka
Krzysztof Gorgolewski
Karol Maciaszek
Systemy baz danych
i hurtowni danych
Motywacja:
• Możliwość praktycznego zastosowania projektu.
• Zainteresowaniami autorów problemami medycznymi.
• Napisanie moduł do większej aplikacji stworzonej dla Katedry
i Zakładu Immunologii Klinicznej w Poznaniu w ramach pracy
inżynierskiej na PP.
2
Cele projektu:
• Umożliwienie pozyskiwania informacji o diagnozie
na podstawie opisu tekstowego.
• Zbierania informacji o ilości danych rozpoznań w okresie
czasu.
• Umożliwienie badania reguł decyzyjnych (zależności
pomiędzy stawianą diagnozą a danymi pochodzącymi
z badania próbek materiału.
3
Wyniki badania
neutrofile
ziarnistość
monocyty
limfocyty
wielkość
4
Interfejs użytkownika
5
Architektura systemu:
• Relacja w bazie danych na potrzeby projektu (przypisanie
tekstów diagnoz do klas decyzyjnych - rozpoznań).
• Indukowanie reguł decyzyjnych z wykorzystaniem algorytmów
uczących.
• Integracja z istniejącym systemem.
6
Harmonogram pracy:
•
Przygotowanie klas decyzyjnych - możliwych rozpoznań (2 tygodnie)
•
Przegląd i wybór algorytmu uczącego (2 tygodnie)
•
Implementacja wybranych algorytmów uczących (4 tygodnie)
•
Integracja tworzonej aplikacji z istniejącym systemem (2 tygodnie)
•
Testy i korekty (2 tygodnie)
7