Morfeusz 2 — analizator i generator fleksyjny dla języka
Transkrypt
Morfeusz 2 — analizator i generator fleksyjny dla języka
t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t tt q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq t t Morfeusz 2 — analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL, 20 maja 2015 . . . . . . . . . . . . . . 1/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Analizator i generator fleksyjny Morfeusz . . . . . . j Morfeusz, wersja 2 opracowana w Zespole Inżynierii Lingwistycznej IPI PAN w ramach CLARIN-PL: http://sgjp.pl/morfeusz/dopobrania.html . . . . . . . . 2/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Dystrybucja programu . . . . . . j Zasadniczą postać programu stanowi moduł programistyczny, który można wbudować w tworzone przez siebie programy. Dla mniej technicznie ukierunkowanych użytkowników przygotowano interfejs graficzny w Javie. Udostępniamy kod źródłowy i wersje skompilowane dla Linuksa, Mac OS X i Windows; 32- i 64-bitowe. Dodatkowe moduły umożliwiają użycie Morfeusza z poziomu Pythona, Perla, Javy i SWI-Prologu. . . . . . . . . 3/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Program Morfeusz . . . . . . j . . . . . . . . 4/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Przykład . . . . . . j Mam mama mamić mieć subst:pl:gen:f impt:sg:sec:imperf fin:sg:pri:imperf próbkę próbka subst:sg:acc:f analizy analiza morfologicznej morfologiczny adj:sg:gen.dat.loc:f:pos . . interp subst:sg:gen:f subst:pl:nom.acc.voc:f . . . . . . . . 5/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Podstawowe pojęcia . . . . . . j Leksem (wyraz słownikowy) abstrakcyjna jednostka języka, zbiór form wyrazowych Forma (wyrazowa) segment zinterpretowany poprzez przypisanie do leksemu i określenie jego funkcji gramatycznej Wykładnik (formy) segment reprezentujący ją w tekście Lemat umowny identyfikator leksemu, tradycyjnie równokształtny z wykładnikiem pewnej jego formy . . . . . . . . 6/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Podstawowe pojęcia . . . . . . j Leksem (wyraz słownikowy) abstrakcyjna jednostka języka, zbiór form wyrazowych Forma (wyrazowa) segment zinterpretowany poprzez przypisanie do leksemu i określenie jego funkcji gramatycznej Wykładnik (formy) segment reprezentujący ją w tekście Lemat umowny identyfikator leksemu, tradycyjnie równokształtny z wykładnikiem pewnej jego formy Technicznie: Leksem zbiór form o tym samym lemacie Forma trójka ⟨wykładnik, lemat, znacznik fleksyjny (tag)⟩ . . . . . . . . 6/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Podstawowe pojęcia . . . . . . j Analiza fleksyjna (morfologiczna) identyfikacja wszystkich form wyrazowych, których dany segment może być wykładnikiem Ujednoznacznianie fleksyjne określenie na podstawie kontekstu, jako którą z możliwych form interpretować dane wystąpienie segmentu Tagowanie analiza + ujednoznacznienie . . . . . . . . 7/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t PRL-u psami psami. ul. biało-czerwonych różowawoczerwonymi → → → → → → ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Segmentacja . . . . . . j psami psami . ul . biało - czerwonych różowawo czerwonymi PRL-u Segmentacja dla polszczyzny jest uwikłana słownikowo. . . . . . . . . 8/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Segmentacja form czasu przeszłego . . . . . . j Powiedziała, że to czytaliście. Powiedziała, żeście to czytali. *Powiedziała, żeby to czytaliście. Powiedziała, żebyście to czytali. . . . . . . . . 9/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Segmentacja form czasu przeszłego . . . . . . j Powiedziała, że to czytaliście. Powiedziała, żeście to czytali. *Powiedziała, żeby to czytaliście. Powiedziała, żebyście to czytali. Świnieście! . . . . . . . . 9/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t widział em widziałem widzieć być widzieć ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Segmentacja form czasu przeszłego . . . . . . j Wariant fundamentalistyczny: praet:sg:m1.m2.m3:imperf aglt:sg:pri:imperf:wok Wariant pragmatyczny: praet:sg:m1.m2.m3:pri:imperf . . . . . . . . 10/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t widział by m widziałbym widzieć by być widzieć ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Segmentacja form trybu warunkowego . . . . . . j Wariant fundamentalistyczny: praet:sg:m1.m2.m3:imperf qub aglt:sg:pri:imperf:wok Wariant pragmatyczny (nowy znacznik cond): cond:sg:m1.m2.m3:pri:imperf . . . . . . . . 11/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Regularność odmiany . . . . . . j . . . . . . . . 12/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Regularność odmiany . . . . . . j . . . . . . . . 12/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t imps fin ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Regularność odmiany Fleksem podzbiór leksemu (w miarę) jednorodny ze względu na kategorie gramatyczne przysługujące formom . . . . . . j impt praet inf . . . . . . . . 12/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Tagset . . . . . . j Mam mama mamić mieć subst:pl:gen:f impt:sg:sec:imperf fin:sg:pri:imperf próbkę próbka subst:sg:acc:f analizy analiza morfologicznej morfologiczny adj:sg:gen.dat.loc:f:pos . . interp subst:sg:gen:f subst:pl:nom.acc.voc:f . . . . . . . . 13/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Lematyzacja . . . . . . j Leksem para: Zatrucie parami rtęci jest praktycznie niemożliwe bez jednoczesnego poparzenia. Uczestnicy tańczą parami. . . . . . . . . 14/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Lematyzacja . . . . . . j Leksem para: Uczestnicy tańczą parami. Leksemy zamek:s1 i zamek:s2: Zatrucie parami rtęci jest praktycznie niemożliwe bez jednoczesnego poparzenia. Jakoś odruchowo przekręciła gałkę zamka, a potem nacisnęła klamkę. Na dziedzińcu zamku lubelskiego natrafiono na fragmenty konstrukcji zrębowej drewnianej chaty. . . . . . . . . 14/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Lematyzacja . . . . . . j Lematy ok. 10 000 leksemów w SGJP wymagają elementu ujednoznaczniającego. Po dwukropku dodano oznaczenie części mowy. Np. leksemy piec:s i piec:v. Jeżeli to nie wystarczyło, dodano oznaczenie cyfrowe, np. zamek:s1 (zamka) i zamek:s2 (zamku); słać:v1 (ślę) i słać:v2 (ścielę). Analizator zwraca takie lematy. Generator dla argumentu "piec:s" zwróci formy odmiany rzeczownika piec:s, a dla argumentu "piec" — formy zarówno rzeczownika jak i czasownika. . . . . . . . . 15/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Dostępne słowniki . . . . . . j Morfeusz jest dystrybuowany z dwoma słownikami: SGJP i Polimorf. Kolejne wydania Morfeusza są generowane automatycznie przez system Kuźnia zarządzający pracą nad oboma słownikami. Aby załadować słownik samemu przygotowany, trzeba najpierw wskazać programowi katalog, w którym miałby takich słowników poszukiwać. . . . . . . . . 16/21 ttt t t tt t t t t t t t t t t t t t t t t tt q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt t t Postać źródłowa słownika Gdańsk Gdańsk Gdańska Gdański Gdańskiem funkcja funkcjach funkcjami funkcje funkcje funkcje funkcji funkcji funkcjo funkcjom funkcyj Gdańsk Gdańsk Gdańsk Gdańsk Gdańsk funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja funkcja subst:sg:acc:m3 subst:sg:nom:m3 subst:sg:gen:m3 subst:pl:nom:m3 subst:sg:inst:m3 subst:sg:nom:f subst:pl:loc:f subst:pl:inst:f subst:pl:acc:f subst:pl:nom:f subst:pl:voc:f subst:pl:gen:f subst:sg:gen:f subst:sg:voc:f subst:pl:dat:f subst:pl:gen:f geograficzna geograficzna geograficzna geograficzna geograficzna pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita pospolita j rzad. rzad. arch. . . . . . . . . . . . . . . 17/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Kompilowanie słownika . . . . . . j Dane wbudowywane w binarny plik słownikowy Morfeusza: słownik lub słowniki źródłowe, reguły łączenia segmentów, definicja tagsetu. . . . . . . . . 18/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Kompilowanie słownika . . . . . . j python morfeusz_builder --input-files=eksport.tab,sgjp-20150414.tab,dodatki.tab --tagset-file=morfeusz-sgjp.tagset --segments-file=segmenty.dat --dict-dir=morf-dict --dict test13 (całe powyższe polecenie musi być w jednym wierszu) . . . . . . . . 19/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Kompilowanie słownika . . . . . . j . . . . . . . . 20/21 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q t t t ttt t t tt t t t t t t t t t t t t t t t t ttt t t tt t ttt t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Kuźnia . . . . . . j Do tworzenia słowników w formacie wymaganym przez Morfeusza służy Kuźnia. W ramach CLARIN-PL udostępniono instalację Kuźni pozwalającą samodzielnie założyć konto i podjąć pracę nad własnym słownikiem: http://kuznia.ipipan.clarin-pl.eu/accounts/ register/ . . . . . . . . 21/21