Wyszukiwarka korpusowa Poliqarp2

Transkrypt

Wyszukiwarka korpusowa Poliqarp2
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
t
t
t
Bartosz Zaborowski
j
INSTITUTE OF COMPUTER SCIENCE
POLISH ACADEMY OF SCIENCES
ul. Jana Kazimierza 5, 01-248 Warszawa
25 kwietnia 2016
t
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
tt
Wyszukiwarka korpusowa
Poliqarp2
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Czym jest Poliqarp2
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Czym jest Poliqarp2 Możliwości
j
Wyszukiwarka korpusowa,
następca Poliqarp 1.x – cała funkcjonalność zachowana,
szczególnie niejednoznaczność i wyrażenia regularne na
segmentach,
obsługa wielu poziomów anotacji (anotacje z NKJP i nie
tylko),
wsparcie dla różnych rodzajów korpusów/banków (korpusy
historyczne, grafy składniowe, struktury LFG. . . ).
2 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Możliwości
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Czym jest Poliqarp2 Możliwości
j
Obsługa dużych korpusów (miliardy segmentów),
REST API – łatwa integracja,
graficzny interfejs z wizualizacją wyników,
modułowa budowa.
3 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Typy danych
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Modelowanie korpusu Importowanie korpusów
j
typy proste (int, float, bool, string, enum)
struktury atrybutowe (np. węzeł, krawędź, interpretacja,
F-struktura)
lista
lista wieloznaczna (np. wszystkie interpretacje segmentu)
wyróżnione rodzaje struktur: węzły wielkoskalowe, węzły
zwykłe i krawędzie
2 rodzaje krawędzi: pierwotne i wtórne
węzły i krawędzie pierwotne tworzą DAG (składnia)
wyróżniony atrybut type – nadaje sens poszczególnym
strukturom
4 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Typy danych
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Modelowanie korpusu Importowanie korpusów
j
typy proste (int, float, bool, string, enum)
struktury atrybutowe (np. węzeł, krawędź, interpretacja,
F-struktura)
lista
lista wieloznaczna (np. wszystkie interpretacje segmentu)
wyróżnione rodzaje struktur: węzły wielkoskalowe, węzły
zwykłe i krawędzie
2 rodzaje krawędzi: pierwotne i wtórne
węzły i krawędzie pierwotne tworzą DAG (składnia)
wyróżniony atrybut type – nadaje sens poszczególnym
strukturom
4 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Model NKJP na obrazku
t
named:. . .
(j. nazw.)
base
certainty
...
seg (segment)
orth
msd
sense
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Modelowanie korpusu Importowanie korpusów
j
doc (dokument)
(metadane)
p (akapit)
s (zdanie)
syngr:. . . (grupa)
orth
synh : true/false
semh : true/false
synw (sowo sk.)
orth
msd
morph (interpretacja)
base
pos, case, . . .
sub (podsegment)
text,
newword, endword
5 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Importowanie korpusów
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Modelowanie korpusu Importowanie korpusów
j
Poliqarp2 czyta tylko własny format .pqz,
udostępniamy konwertery dla TEI (NKJP, PCC, PSC),
Składnicy, wyjścia z POLFIE,
łatwe tworzenie nowych konwerterów.
Najprostszy konwerter
Dołączony przykładowy „konwerter” z .txt to ~100 linii kodu w
Pythonie (z czego połowa to prosty segmentator).
6 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Importowanie korpusów
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Modelowanie korpusu Importowanie korpusów
j
Poliqarp2 czyta tylko własny format .pqz,
udostępniamy konwertery dla TEI (NKJP, PCC, PSC),
Składnicy, wyjścia z POLFIE,
łatwe tworzenie nowych konwerterów.
Najprostszy konwerter
Dołączony przykładowy „konwerter” z .txt to ~100 linii kodu w
Pythonie (z czego połowa to prosty segmentator).
6 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Możliwości języka zapytań
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
Proste zapytania frazowe,
specyfikacja wartości atrybutów struktur,
specyfikacja relacji między węzłami
sekwencje węzłów w porządku segmentowym,
relacje zadane krawędziami grafu,
wyrażenia regularne na węzłach (poziome i po krawędziach)
zmienne,
post-processing podobny do SQL.
7 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Możliwości języka zapytań
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
Proste zapytania frazowe,
specyfikacja wartości atrybutów struktur,
specyfikacja relacji między węzłami
sekwencje węzłów w porządku segmentowym,
relacje zadane krawędziami grafu,
wyrażenia regularne na węzłach (poziome i po krawędziach)
zmienne,
post-processing podobny do SQL.
7 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Możliwości języka zapytań
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
Proste zapytania frazowe,
specyfikacja wartości atrybutów struktur,
specyfikacja relacji między węzłami
sekwencje węzłów w porządku segmentowym,
relacje zadane krawędziami grafu,
wyrażenia regularne na węzłach (poziome i po krawędziach)
zmienne,
post-processing podobny do SQL.
7 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Zapytania proste
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
Nie chciałbym
Ciąg słów: [Nie] [chciał][by][m]
8 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Atrybuty struktur
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
[syngr:AdjG && sons.size > 3]
Grupa przymiotnikowa z co najmniej trzema dziećmi
9 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Atrybuty morfoskładniowe
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
[pos˜adj && case˜nom && {pos,case}!˜{adj,nom}]
Być może przymiotnik i być może w mianowniku, ale nie naraz
10 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Wyrażenia regularne na węzłach
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
[pos=adj]{3,5}
Ciąg od trzech do pięciu przymiotników
11 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Relacje i wyrażenia regularne pionowe
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
[syngr:NG && span.size > 5] >[-1]+ [seg]
Skrajny prawy potomek grupy nominalnej mającej łącznie ponad 5 potomków
12 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Zapytania ogólne
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
($X:=Sejm && $Y:=[base=komisja]) within [doc &&
taxonomy_type="#typ_qmow"]
Słowo Sejm oraz forma słowa komisja w dokumencie quasi-mówionym, przypisanie
znalezionych słów na zmienne
13 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Post-processing
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
Język Przykłady zapytań
j
[seg && orth=$O && base=$B]/pa ;;
group $O, $B ;;
zip($O, ", ") group $B sort count() desc
najróżniej odmieniane formy bazowe w korpusie
14 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Strona techniczna
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
j
wyszukiwarka:
kompilowana z kodu źródłowego,
dla Linuksa (i UNIX-ów),
konsolowa (demon).
GUI:
Aplikacja WEB-owa Django,
wieloplatformowa,
można używać lokalnie,
łatwe przeróbki, mini-CMS.
15 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Strona techniczna
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
j
wyszukiwarka:
kompilowana z kodu źródłowego,
dla Linuksa (i UNIX-ów),
konsolowa (demon).
GUI:
Aplikacja WEB-owa Django,
wieloplatformowa,
można używać lokalnie,
łatwe przeróbki, mini-CMS.
15 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Informacje dodatkowe
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
j
strona projektu na SourceForge (pobieranie, bug-tracker):
https://sourceforge.net/projects/poliqarp2/
licencja: GPL3
publiczny dostęp do wyszukiwarki w ramach infrastruktury
CLARIN-PL: http://poliqarp.clarin-pl.eu/
Pytania?
16 / 16
q
q
q
t
tq
t t q
t
tq
t
q
t t q
t
q
t
tq
t
q
t
tq
tt tq
ttt q
ttt q
tt tq
ttt q
ttt q
ttt q
tt
q
t
q
tt tq
tt
q
t
q
t
q
tt tq
tt tq
ttt q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
tq
t t q
tt tq
tt tq
tt tq
ttt q
tt tq
t
q
t
q
tt
q
tt
q
tt
q
tt
q
tt tq
ttttq
t
q
tt tq
tt
q
t
q
t t q
tt
q
tt tq
tt
q
tt tq
tt
q
tt
q
ttt q
tq
tt q
tt q
t
q
t
tq
ttt q
tt
q
tt tq
tt tq
tt
q
t
q
t t q
ttt q
ttt q
t tq
tq
tt q
tt q
t tq
tt q
tt q
tt q
t
q
t t q
tt
q
ttt q
ttt q
tt
q
ttt q
t
q
t t q
tt tq
tt tq
tt
q
tt tq
tt
q
tq
tt
q
tt
q
tt
q
tt tq
tt
q
ttt q
tq
tq
q
q
q
q
Informacje dodatkowe
t
ttt
t
t
tt
t
t t
t
t t
t
t t
t t
t
t t
t
t
t
tt
t
t
t t
t t
t
ttt
tt
tt
tt
t
t t
tt
tt
t t
tt
t t
t
t
ttt
t
t
ttt
tt
t
tt
t
t
tt
t t
t
t t
t
tt
ttt
ttt
t
t
tt
t
ttt
t t
t
t t
t
tt
tt
t
t t
tt
tt
t t
t t
ttt
t
t
tt
t
tt
tt
t
t
t
t t
t
t t
ttt
tt
tt
ttt
t t
tt
t
t
Wstęp Dane Wyszukiwanie Informacje dodatkowe
j
strona projektu na SourceForge (pobieranie, bug-tracker):
https://sourceforge.net/projects/poliqarp2/
licencja: GPL3
publiczny dostęp do wyszukiwarki w ramach infrastruktury
CLARIN-PL: http://poliqarp.clarin-pl.eu/
Pytania?
16 / 16