Morfeusz 2 i Kuźnia
Transkrypt
Morfeusz 2 i Kuźnia
q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt t t t t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt Narzędzia analizy fleksyjnej języka polskiego: Morfeusz 2 i Kuźnia Marcin Woliński Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Wrocław, 25 kwietnia 2016 . . . . . . . . . . . . . . 1/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Analizator i generator fleksyjny Morfeusz . . . . . . . j Morfeusz, wersja 2 opracowana w Zespole Inżynierii Lingwistycznej IPI PAN w ramach CLARIN-PL: http://sgjp.pl/morfeusz . . . . . . . 2/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Dystrybucja programu . . . . . . . j Zasadniczą postać programu stanowi moduł programistyczny, który można wbudować w tworzone przez siebie programy. Dla mniej technicznie ukierunkowanych użytkowników przygotowano interfejs graficzny w Javie. Udostępniamy kod źródłowy i wersje skompilowane dla Linuksa, Mac OS X i Windows; 32- i 64-bitowe. Dodatkowe moduły umożliwiają użycie Morfeusza z poziomu Pythona, Perla, Javy i SWI-Prologu. . . . . . . . 3/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Interfejs graficzny Morfeusza . . . . . . . j . . . . . . . 4/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Podstawowe pojęcia . . . . . . . j Leksem (wyraz słownikowy) abstrakcyjna jednostka języka, zbiór form wyrazowych Forma (wyrazowa) segment zinterpretowany poprzez przypisanie do leksemu i określenie jego funkcji gramatycznej Wykładnik (formy) segment reprezentujący ją w tekście Lemat umowny identyfikator leksemu, tradycyjnie równokształtny z wykładnikiem pewnej jego formy . . . . . . . 5/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Podstawowe pojęcia . . . . . . . j Leksem (wyraz słownikowy) abstrakcyjna jednostka języka, zbiór form wyrazowych Forma (wyrazowa) segment zinterpretowany poprzez przypisanie do leksemu i określenie jego funkcji gramatycznej Wykładnik (formy) segment reprezentujący ją w tekście Lemat umowny identyfikator leksemu, tradycyjnie równokształtny z wykładnikiem pewnej jego formy Technicznie: Forma trójka ⟨wykładnik, lemat, znacznik fleksyjny (tag)⟩ Leksem zbiór form o tym samym lemacie . . . . . . . 5/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Podstawowe pojęcia . . . . . . . j Analiza fleksyjna (morfologiczna) identyfikacja wszystkich form wyrazowych, których dany segment może być wykładnikiem Ujednoznacznianie fleksyjne określenie na podstawie kontekstu, jako którą z możliwych form interpretować dane wystąpienie segmentu Tagowanie analiza + ujednoznacznienie . . . . . . . 6/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Przykład Mam mama mamić mieć subst:pl:gen:f impt:sg:sec:imperf fin:sg:pri:imperf próbkę próbka subst:sg:acc:f analizy analiza subst:sg:gen:f subst:pl:nom.acc.voc:f morfologicznej morfologiczny adj:sg:gen.dat.loc:f:pos . . interp . . . . . . . j . . . . . . . 7/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Regularność odmiany . . . . . . . j . . . . . . . 8/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Regularność odmiany . . . . . . . j . . . . . . . 8/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t imps fin ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Regularność odmiany . . . . . . . j impt praet inf Fleksem podzbiór leksemu (w miarę) jednorodny ze względu na kategorie gramatyczne przysługujące formom . . . . . . . 8/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Tagset Mam mama mamić mieć subst:pl:gen:f impt:sg:sec:imperf fin:sg:pri:imperf próbkę próbka subst:sg:acc:f analizy analiza subst:sg:gen:f subst:pl:nom.acc.voc:f morfologicznej morfologiczny adj:sg:gen.dat.loc:f:pos . . interp . . . . . . . j . . . . . . . 9/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Lematyzacja . . . . . . . j Leksem para: Uczestnicy tańczą parami. Zatrucie parami rtęci jest praktycznie niemożliwe bez jednoczesnego poparzenia. . . . . . . . 10/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Lematyzacja . . . . . . . j Leksem para: Uczestnicy tańczą parami. Zatrucie parami rtęci jest praktycznie niemożliwe bez jednoczesnego poparzenia. Leksemy zamek:s1 i zamek:s2: Jakoś odruchowo przekręciła gałkę zamka, a potem nacisnęła klamkę. Na dziedzińcu zamku lubelskiego natrafiono na fragmenty konstrukcji zrębowej drewnianej chaty. . . . . . . . 10/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Lematyzacja . . . . . . . j Lematy ok. 10 000 leksemów w SGJP wymagają elementu ujednoznaczniającego. Po dwukropku dodano oznaczenie części mowy. Np. leksemy piec:s i piec:v. Jeżeli to nie wystarczyło, dodano oznaczenie cyfrowe, np. zamek:s1 (zamka) i zamek:s2 (zamku); słać:v1 (ślę) i słać:v2 (ścielę). Analizator zwraca takie lematy. Generator dla argumentu "piec:s" zwróci formy odmiany rzeczownika piec:s, a dla argumentu "piec" — formy zarówno rzeczownika jak i czasownika. . . . . . . . 11/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Informacje dodatkowe . . . . . . . j Morfeusz 2 dodaje w wynikach analizy dwa elementy, które nie są ściśle fleksyjne: prostą klasyfikację nazw własnych, kwalifikatory. Wrocławiu,Wrocław,subst:sg:loc.voc:m3,geograficzna,_ Marcina,Marcin,subst:sg:gen.acc:m1,imię,_ tą,ten,adj:sg:inst:f:pos,_,_ tą,ten,adj:sg:acc:f:pos,_,pot. . . . . . . . 12/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Dostępne słowniki . . . . . . . j Morfeusz jest dystrybuowany z dwoma słownikami: SGJP (http://sgjp.pl/) ponad 300 tysięcy leksemów ponad 4 miliony wykładników form Polimorf (http://zil.ipipan.waw.pl/PoliMorf). Kolejne wydania Morfeusza są generowane automatycznie przez system Kuźnia zarządzający pracą nad oboma słownikami. . . . . . . . 13/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Kompilowanie słownika . . . . . . . j Dane wbudowywane w binarny plik słownikowy Morfeusza: słownik lub słowniki źródłowe, reguły łączenia segmentów, definicja tagsetu. . . . . . . . 14/21 ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt t t q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Postać źródłowa słownika Gdańsk Gdańsk Gdańska Gdański Gdańskiem funkcja funkcjach funkcjami funkcje funkcje funkcje funkcji funkcji funkcjo funkcjom funkcyj Gdańsk Gdańsk Gdańsk Gdańsk Gdańsk funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja subst:sg:acc:m3 subst:sg:nom:m3 subst:sg:gen:m3 subst:pl:nom:m3 subst:sg:inst:m3 subst:sg:nom:f subst:pl:loc:f subst:pl:inst:f subst:pl:acc:f subst:pl:nom:f subst:pl:voc:f subst:pl:gen:f subst:sg:gen:f subst:sg:voc:f subst:pl:dat:f subst:pl:gen:f geograficzna geograficzna geograficzna geograficzna geograficzna pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita j rzad. rzad. arch. . . . . . . . . . . . . . . 15/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Kompilowanie słownika . . . . . . . j . . . . . . . 16/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Kuźnia . . . . . . . j Do tworzenia słowników w formacie wymaganym przez Morfeusza służy system Kuźnia (opracowany w ZIL IPI PAN). W ramach CLARIN-PL udostępniono instalację Kuźni pozwalającą samodzielnie założyć konto i podjąć pracę nad własnym słownikiem: http://kuznia.ipipan.clarin-pl.eu/accounts/ register/ . . . . . . . 17/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Przykład tworzenia leksemu w Kuźni . . . . . . . j . . . . . . . 18/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Przykład tworzenia leksemu w Kuźni . . . . . . . j . . . . . . . 19/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Przykład tworzenia leksemu w Kuźni . . . . . . . j . . . . . . . 20/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Podsumowanie . . . . . . . j Analiza fleksyjna jest wymaganym pierwszym krokiem w większości zastosowań inżynierii lingwistycznej. Program Morfeusz 2 sprawnie wykonuje to zadanie. Jest dystrybuowany z dwoma obszernymi słownikami fleksyjnymi języka polskiego. Może być rozszerzany poprzez tworzenie słowników dodatkowych np. za pomocą narzędzia Kuźnia. Wszystkie wymienione zasoby są dostępne na dwuklauzulowej licencji BSD. . . . . . . . 21/21