Wyszukiwarka korpusowa Poliqarp2
Transkrypt
Wyszukiwarka korpusowa Poliqarp2
q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q t t t Bartosz Zaborowski j INSTITUTE OF COMPUTER SCIENCE POLISH ACADEMY OF SCIENCES ul. Jana Kazimierza 5, 01-248 Warszawa 25 kwietnia 2016 t t tt tt t t t t t t t t ttt tt tt ttt t t t t t t t t tt tt t t t tt tt t t t t ttt t t tt tt Wyszukiwarka korpusowa Poliqarp2 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Czym jest Poliqarp2 t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Czym jest Poliqarp2 Możliwości j Wyszukiwarka korpusowa, następca Poliqarp 1.x – cała funkcjonalność zachowana, szczególnie niejednoznaczność i wyrażenia regularne na segmentach, obsługa wielu poziomów anotacji (anotacje z NKJP i nie tylko), wsparcie dla różnych rodzajów korpusów/banków (korpusy historyczne, grafy składniowe, struktury LFG. . . ). 2 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Możliwości t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Czym jest Poliqarp2 Możliwości j Obsługa dużych korpusów (miliardy segmentów), REST API – łatwa integracja, graficzny interfejs z wizualizacją wyników, modułowa budowa. 3 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Typy danych t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusów j typy proste (int, float, bool, string, enum) struktury atrybutowe (np. węzeł, krawędź, interpretacja, F-struktura) lista lista wieloznaczna (np. wszystkie interpretacje segmentu) wyróżnione rodzaje struktur: węzły wielkoskalowe, węzły zwykłe i krawędzie 2 rodzaje krawędzi: pierwotne i wtórne węzły i krawędzie pierwotne tworzą DAG (składnia) wyróżniony atrybut type – nadaje sens poszczególnym strukturom 4 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Typy danych t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusów j typy proste (int, float, bool, string, enum) struktury atrybutowe (np. węzeł, krawędź, interpretacja, F-struktura) lista lista wieloznaczna (np. wszystkie interpretacje segmentu) wyróżnione rodzaje struktur: węzły wielkoskalowe, węzły zwykłe i krawędzie 2 rodzaje krawędzi: pierwotne i wtórne węzły i krawędzie pierwotne tworzą DAG (składnia) wyróżniony atrybut type – nadaje sens poszczególnym strukturom 4 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Model NKJP na obrazku t named:. . . (j. nazw.) base certainty ... seg (segment) orth msd sense ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusów j doc (dokument) (metadane) p (akapit) s (zdanie) syngr:. . . (grupa) orth synh : true/false semh : true/false synw (sowo sk.) orth msd morph (interpretacja) base pos, case, . . . sub (podsegment) text, newword, endword 5 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Importowanie korpusów t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusów j Poliqarp2 czyta tylko własny format .pqz, udostępniamy konwertery dla TEI (NKJP, PCC, PSC), Składnicy, wyjścia z POLFIE, łatwe tworzenie nowych konwerterów. Najprostszy konwerter Dołączony przykładowy „konwerter” z .txt to ~100 linii kodu w Pythonie (z czego połowa to prosty segmentator). 6 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Importowanie korpusów t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusów j Poliqarp2 czyta tylko własny format .pqz, udostępniamy konwertery dla TEI (NKJP, PCC, PSC), Składnicy, wyjścia z POLFIE, łatwe tworzenie nowych konwerterów. Najprostszy konwerter Dołączony przykładowy „konwerter” z .txt to ~100 linii kodu w Pythonie (z czego połowa to prosty segmentator). 6 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Możliwości języka zapytań t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j Proste zapytania frazowe, specyfikacja wartości atrybutów struktur, specyfikacja relacji między węzłami sekwencje węzłów w porządku segmentowym, relacje zadane krawędziami grafu, wyrażenia regularne na węzłach (poziome i po krawędziach) zmienne, post-processing podobny do SQL. 7 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Możliwości języka zapytań t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j Proste zapytania frazowe, specyfikacja wartości atrybutów struktur, specyfikacja relacji między węzłami sekwencje węzłów w porządku segmentowym, relacje zadane krawędziami grafu, wyrażenia regularne na węzłach (poziome i po krawędziach) zmienne, post-processing podobny do SQL. 7 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Możliwości języka zapytań t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j Proste zapytania frazowe, specyfikacja wartości atrybutów struktur, specyfikacja relacji między węzłami sekwencje węzłów w porządku segmentowym, relacje zadane krawędziami grafu, wyrażenia regularne na węzłach (poziome i po krawędziach) zmienne, post-processing podobny do SQL. 7 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Zapytania proste t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j Nie chciałbym Ciąg słów: [Nie] [chciał][by][m] 8 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Atrybuty struktur t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j [syngr:AdjG && sons.size > 3] Grupa przymiotnikowa z co najmniej trzema dziećmi 9 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Atrybuty morfoskładniowe t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j [pos˜adj && case˜nom && {pos,case}!˜{adj,nom}] Być może przymiotnik i być może w mianowniku, ale nie naraz 10 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Wyrażenia regularne na węzłach t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j [pos=adj]{3,5} Ciąg od trzech do pięciu przymiotników 11 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Relacje i wyrażenia regularne pionowe t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j [syngr:NG && span.size > 5] >[-1]+ [seg] Skrajny prawy potomek grupy nominalnej mającej łącznie ponad 5 potomków 12 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Zapytania ogólne t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j ($X:=Sejm && $Y:=[base=komisja]) within [doc && taxonomy_type="#typ_qmow"] Słowo Sejm oraz forma słowa komisja w dokumencie quasi-mówionym, przypisanie znalezionych słów na zmienne 13 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Post-processing t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytań j [seg && orth=$O && base=$B]/pa ;; group $O, $B ;; zip($O, ", ") group $B sort count() desc najróżniej odmieniane formy bazowe w korpusie 14 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Strona techniczna t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe j wyszukiwarka: kompilowana z kodu źródłowego, dla Linuksa (i UNIX-ów), konsolowa (demon). GUI: Aplikacja WEB-owa Django, wieloplatformowa, można używać lokalnie, łatwe przeróbki, mini-CMS. 15 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Strona techniczna t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe j wyszukiwarka: kompilowana z kodu źródłowego, dla Linuksa (i UNIX-ów), konsolowa (demon). GUI: Aplikacja WEB-owa Django, wieloplatformowa, można używać lokalnie, łatwe przeróbki, mini-CMS. 15 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Informacje dodatkowe t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe j strona projektu na SourceForge (pobieranie, bug-tracker): https://sourceforge.net/projects/poliqarp2/ licencja: GPL3 publiczny dostęp do wyszukiwarki w ramach infrastruktury CLARIN-PL: http://poliqarp.clarin-pl.eu/ Pytania? 16 / 16 q q q t tq t t q t tq t q t t q t q t tq t q t tq tt tq ttt q ttt q tt tq ttt q ttt q ttt q tt q t q tt tq tt q t q t q tt tq tt tq ttt q ttt q ttt q tt q ttt q t q t t q tt q tt tq tt q tt tq tt q tt q tq t t q tt tq tt tq tt tq ttt q tt tq t q t q tt q tt q tt q tt q tt tq ttttq t q tt tq tt q t q t t q tt q tt tq tt q tt tq tt q tt q ttt q tq tt q tt q t q t tq ttt q tt q tt tq tt tq tt q t q t t q ttt q ttt q t tq tq tt q tt q t tq tt q tt q tt q t q t t q tt q ttt q ttt q tt q ttt q t q t t q tt tq tt tq tt q tt tq tt q tq tt q tt q tt q tt tq tt q ttt q tq tq q q q q Informacje dodatkowe t ttt t t tt t t t t t t t t t t t t t t t t t tt t t t t t t t ttt tt tt tt t t t tt tt t t tt t t t t ttt t t ttt tt t tt t t tt t t t t t t tt ttt ttt t t tt t ttt t t t t t t tt tt t t t tt tt t t t t ttt t t tt t tt tt t t t t t t t t ttt tt tt ttt t t tt t t Wstęp Dane Wyszukiwanie Informacje dodatkowe j strona projektu na SourceForge (pobieranie, bug-tracker): https://sourceforge.net/projects/poliqarp2/ licencja: GPL3 publiczny dostęp do wyszukiwarki w ramach infrastruktury CLARIN-PL: http://poliqarp.clarin-pl.eu/ Pytania? 16 / 16