Komputerowa analiza tekstu w diagnozie zaburzeń psychicznych
Transkrypt
Komputerowa analiza tekstu w diagnozie zaburzeń psychicznych
James W. Pennebaker Program LIWC ok 5000 słów lub leksemów (np..matk*) Każde słowo przypisane do co najmniej jednej z 80 kategorii Kategorie lingwistycznie (czasownik, zaimek, czas) i psychologicznie istotne (emocje, poznanie, procesy społeczne, itp.) Słowo ‘cried' należy do czterech kategorii: sadness, negative emotion, overall affect, oraz past tense verb Każdy analizowany tekst można dzięki temu opisać zawartością procentową słów z danej kategorii (positive emotions, prepositions, pronouns, cognitive words…) Polska adaptacja programu LIWC Katarzyna Stemplewska-Żakowicz Przykład: read reading reads RAZEM: 3 formy Porównanie: Polskie blogi o depresji vs. Inne blogi Porównanie: Polskie blogi o depresji vs. Inne blogi Porównanie: Polskie blogi o depresji vs. Inne blogi Porównanie: Polskie blogi o depresji vs. Inne blogi Porównanie: Polskie blogi o depresji vs. Inne blogi Porównanie: Polskie blogi o depresji vs. Inne blogi Wnioski ze wstępnych badań • Pierwsze testy dotyczące blogów wykazały trafność narzędzia • Efekty dla słownika polskiego były takie same jak dla wersji angielskiej i hiszpańskiej • Wstępną trafność wykazano zarówno dla kategorii lingwistycznych (zaimki) • Jak i dla kategorii psychologicznych (emocje, funkcjonowanie poznawcze, pojęcie czasu) • Wysoka istotność różnic • Konieczne są dalsze testy polskiego słownika • Kwestia pokrywalności – znalezienie maksimum dla języka polskiego • Dzięki testom możliwa jest dalsza kalibracja słownika i wstępne badania eksploracyjne w celu znalezienia efektów typowo „polskich” Badanie polskie: • Badani proszeni o 2 wypowiedzi P/F na kontrowersyjny temat • Maskowanie – zaangażowanie • Wyniki: • Wstępne potwierdzenie wyników Pennebakera • Kłamcy mówią w sposób mniej złożony • Używają więcej negatywnych emocjonalnie słów Badanie polskie: • Badani proszeni o wypełnienie KPD (Łojek, Stańczak, w druku) • O stworzenie wystandaryzowanej narracji • N=82 • Wyniki wstępne: • Istotna korelacja między zawartością odniesień do JA (zaimki) a poziomem depresji (szczególnie u Kobiet) • Grupa o najwyższym poziomie depresji różni się od pozostałych istotnie zawartością negatywnych słów Aktualnie trwające badania 1. Weryfikacja wniosków z badań jakościowych: •Agorafobia •Skala PAS Borwina Bandelowa w tłumaczeniu Anny Potoczek 2. Weryfikacja wniosków z teorii • Zaburzenia osobowości • SCID – II Podsumowanie Czy LIWC pozwala odróżniać osoby cierpiące na zaburzenia psychiczne od osób zdrowych??? Częściowo tak: niektóre kategorie lingwistyczne skutecznie to wyjaśniają. Jednak dane pochodzą z badań porównawczych. Potrzeba określić moc predyktywną wskaźników językowych Czy LIWC pozwala rozróżniać osoby cierpiące na różne zaburzenia psychiczne na podstawie języka? • Na razie w małym stopniu: większość wskaźników odróżnia osoby cierpiące od „zdrowych”, ale zaledwie kilka wskaźników jest „specyficznych” dla danych zaburzeń • Potrzeba więcej badań na populacji klinicznej Podsumowanie CELE NAUKI: OPIS WYJAŚNIANIE PRZEWIDYWANIE