Komputerowa analiza tekstu w diagnozie zaburzeń psychicznych

Transkrypt

Komputerowa analiza tekstu w diagnozie zaburzeń psychicznych
James W. Pennebaker
Program LIWC
ok 5000 słów lub leksemów (np..matk*)
Każde słowo przypisane do co najmniej jednej z 80
kategorii
Kategorie lingwistycznie (czasownik, zaimek, czas) i
psychologicznie istotne (emocje, poznanie, procesy
społeczne, itp.)
Słowo ‘cried' należy do czterech kategorii: sadness,
negative emotion, overall affect, oraz past tense verb
Każdy analizowany tekst można dzięki temu opisać
zawartością procentową słów z danej kategorii (positive
emotions, prepositions, pronouns, cognitive words…)
Polska adaptacja
programu LIWC
Katarzyna Stemplewska-Żakowicz
Przykład:
read
reading
reads
RAZEM: 3 formy
Porównanie: Polskie blogi o depresji vs. Inne blogi
Porównanie: Polskie blogi o depresji vs. Inne blogi
Porównanie: Polskie blogi o depresji vs. Inne blogi
Porównanie: Polskie blogi o depresji vs. Inne blogi
Porównanie: Polskie blogi o depresji vs. Inne blogi
Porównanie: Polskie blogi o depresji vs. Inne blogi
Wnioski ze wstępnych badań
• Pierwsze testy dotyczące blogów wykazały trafność narzędzia
• Efekty dla słownika polskiego były takie same jak dla wersji angielskiej i
hiszpańskiej
• Wstępną trafność wykazano zarówno dla kategorii lingwistycznych
(zaimki)
• Jak i dla kategorii psychologicznych (emocje, funkcjonowanie
poznawcze, pojęcie czasu)
• Wysoka istotność różnic
• Konieczne są dalsze testy polskiego słownika
• Kwestia pokrywalności – znalezienie maksimum dla języka polskiego
• Dzięki testom możliwa jest dalsza kalibracja słownika i wstępne
badania eksploracyjne w celu znalezienia efektów typowo „polskich”
Badanie polskie:
• Badani proszeni o 2 wypowiedzi P/F
na kontrowersyjny temat
• Maskowanie – zaangażowanie
• Wyniki:
• Wstępne potwierdzenie wyników
Pennebakera
• Kłamcy mówią w sposób mniej
złożony
• Używają więcej negatywnych
emocjonalnie słów
Badanie polskie:
• Badani proszeni o wypełnienie KPD (Łojek,
Stańczak, w druku)
• O stworzenie wystandaryzowanej narracji
• N=82
• Wyniki wstępne:
• Istotna korelacja między zawartością
odniesień do JA (zaimki) a poziomem
depresji (szczególnie u Kobiet)
• Grupa o najwyższym poziomie depresji
różni się od pozostałych istotnie
zawartością negatywnych słów
Aktualnie trwające badania
1. Weryfikacja wniosków z badań jakościowych:
•Agorafobia
•Skala PAS Borwina Bandelowa w tłumaczeniu
Anny Potoczek
2.
Weryfikacja wniosków z teorii
• Zaburzenia osobowości
• SCID – II
Podsumowanie
Czy LIWC pozwala odróżniać osoby cierpiące na zaburzenia
psychiczne od osób zdrowych???
Częściowo tak: niektóre kategorie lingwistyczne skutecznie to
wyjaśniają.
Jednak dane pochodzą z badań porównawczych. Potrzeba określić
moc predyktywną wskaźników językowych
Czy LIWC pozwala rozróżniać osoby cierpiące na różne zaburzenia
psychiczne na podstawie języka?
• Na razie w małym stopniu: większość wskaźników odróżnia
osoby cierpiące od „zdrowych”, ale zaledwie kilka wskaźników
jest „specyficznych” dla danych zaburzeń
• Potrzeba więcej badań na populacji klinicznej
Podsumowanie
CELE NAUKI:
OPIS
WYJAŚNIANIE
PRZEWIDYWANIE

Podobne dokumenty