w10
Transkrypt
w10
Składnia Składnia to nauka o związkach wyrazów w zdaniu, szyku wyrazów i roli pełnionej przez wyrazy. Zapis składni powinien w łatwy sposób umożliwiać jej opis i wykorzystanie w automatycznej analizie zdania. Analiza składniowa dostarcza informacji o związkach wyrazów w zdaniu, najczęściej w postaci drzewa. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272) Klasyfikacja opisów składni Ze względu na zakres: z szerokim pokryciem specjalizowane Ze względu na rodzaj opisywanych zależności: wyodrębniające części zdania zależnościowe Ze względu na sposób przechowywania reguł składniowych: zleksykalizowane bez leksykalizacji Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (249 / 272) Gramatyki transformacyjne Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (250 / 272) Gramatyki transformacyjne . XP spec. X’ X dopełnienia X (także X0 ) – element główny (ang. head), XP (także X′′ , X, X2 ) – fraza X („P” w angielskim pochodzi od phrase, po angielsku XP jest nazywane maximal projection (of X), X′ (także X – intermediate projection) – kategoria pośrednia. Reguły: XP → Spec. X′ X′ → X dopełnienia Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (251 / 272) Gramatyki transformacyjne . CP[+q] C′ C[+q] IP NP ∆ John I′ I[+fin] VP V[+aux] | has V′ VP[+en] V[+en] | read Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego V′ NP ∆ the book 10. Metody opisu składni (252 / 272) Gramatyki transformacyjne . CP[+q] C′ V[+aux] | hasi IP NP ∆ John I[+fin] | ti I′ VP V[+aux] | ti V′ VP[+en] V[+en] | read Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego V′ NP ∆ the book 10. Metody opisu składni (253 / 272) Gramatyki transformacyjne . CP[+q] C′ C[+q] NP ∆ John IP I′ I[+fin] VP V[+aux] | has V′ VP[+en] V′ V[+en] NP[+wh] | D[+wh] read | which N′ N book Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (254 / 272) Gramatyki transformacyjne . CP[+q] NP[+wh] ∆ C which booki [+q] | hasj C′ NP ∆ John IP I[+fin] | tj I′ VP V[+aux] | tj V′ VP[+en] V[+en] | read Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego V′ NP[+wh] ti 10. Metody opisu składni (255 / 272) Lexical-Functional Grammar Analiza zdania w tej gramatyce opiera się na dwóch strukturach: c-structure (z ang. constituent structure) i f-structure (z ang. functional structure). C-structure ma postać drzew uzyskanych z użyciem gramatyki bezkontekstowej. Może mieć różną postać w różnych językach. F-structure ma postać par (cecha, wartość) i reprezentuje powiązania często odległych od siebie fragmentów zdania. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (256 / 272) Lexical-Functional Grammar . S1 S(↑=↓) NP(↑ subj =↓) VP(↑=↓) NNP(↑=↓) VBZ(↑=↓) . John( . ↑ pred =′ john′ . . ↑ num = sg . . ↑ pers = 3) . has( . ↑ pred =′ have′ ) . VP . ↑ xcomp =↓ . . ↑ obj =↓ obj VBN(↑=↓) . read( . ↑ pred =′ read′ . . ↑ tense = past) NP(↑ obj =↓) DT(↑ spec:det =↓) NN(↑=↓) . book( . ↑ pred =′ book′ . . ↑ num = sg the(↑ pred =′ the′ ) . . ↑ pers = 3) Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (257 / 272) Lexical-Functional Grammar . S1 wszystkie cechy dzielone z wyższym węzłem S(↑=↓) NP(↑ subj =↓) VP(↑=↓) NNP(↑=↓) VBZ(↑=↓) . John( . ↑ pred =′ john′ . . ↑ num = sg . . ↑ pers = 3) . has( . ↑ pred =′ have′ ) cecha pred dzielona z wyższym węzłem . VP . ↑ xcomp =↓ . . ↑ obj =↓ obj VBN(↑=↓) . read( . ↑ pred =′ read′ . . ↑ tense = past) NP(↑ obj =↓) DT(↑ spec:det =↓) NN(↑=↓) . book( . ↑ pred =′ book′ . . ↑ num = sg the(↑ pred =′ the′ ) . . ↑ pers = 3) Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (258 / 272) Lexical-Functional Grammar . S1 S(↑=↓) AUX(↑=↓) NP(↑ subj =↓) Has(↑ pred =′ has′ ) NNP(↑=↓) VP(↑ xcomp =↓, ↑ obj =↓ obj) VB(↑=↓) ′ . John( . ↑ pred = John′ . . ↑ num = sg . . ↑ pers = 3) Jan Daciuk, KISI, ETI, PG NP(↑ obj =↓) ′ read(↑ pred = read ) Przetwarzanie języka naturalnego DT(↑ spec:det =↓) ′ NN(↑=↓) ′ the(↑ pred = the ) . book( . ↑ pred =′ book′ . . ↑ num = sg . . ↑ pers = 3) 10. Metody opisu składni (259 / 272) Head-Driven Phrase Structure Grammar HPSG wywodzi się z GPSG (ang. Generalized Phrase Structure Grammar). Gramatyka zleksykalizowana – informacje o łączliwości słów w słowniku. Gramatyka unifikacyjna – poszczególne obiekty posiadają cechy, na które można nakładać ograniczenia odwzorowujące zjawiska zachodzące w języku. Część ograniczeń jest zapisywana bezpośrednio za pomocą współdzielenia cech. Część ograniczeń wynika z ogólnych zasad, takich jak zasada elementu głównego, zasada struktury argumentów, czy zasada walencji. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (260 / 272) Head-Driven Phrase Structure Grammar word phon ss | lc ⟨ ⟩ dał local cat cont Zarówno słowa, jak i zdania są opisywane przez category struktury cech. verb gender masc 1 Współdzielenie head person 3rd wartości number sg cech zapisywane jest za valence ⟨ ⟩ pomocą liczb w subj 1 val ⟨ ⟩ kwadratach, np. 2,3 comps ⟨ ⟩ 1 : wartość cechy 1 NP[nom] 4 , 2 NP[dat] 5 , 3 NP[acc] 6 arg-st SS|LC|CAT|HEAD give jest tożsama giver 4 wartością cechy given 6 SS|LC|CAT|VAL|SUBJ . 5 recipient Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (261 / 272) Tree Adjoining Grammar Gramatyka istnieje w wielu wersjach (XTAG, LTAG, …), dla których istnieją różne analizatory składniowe. Podstawowe cechy: Z każdym słowem w słowniku związane jest drzewo określające miejsce słowa w zdaniu – rolę, jaką pełni w składni. Każde podstawowa struktura (w TAG – drzewo) posiada co najmniej jeden symbol końcowy (słowo). Innymi słowy: TAG jest gramatyką zleksykalizowaną. Przy dokonywaniu analizy składniowej zdania wykonuje się dwie operacje na drzewach: zastępowanie (ang. substitution) dołączanie (ang. adjunction) Na każdą z operacji można nałożyć dodatkowe warunki za pomocą unifikacji. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (262 / 272) Tree Adjoining Grammar – Zastępowanie Jeden z liści drzewa jest zastępowany poddrzewem o tej samej etykiecie. IP. DP I′ I VP . . DP DP V DP John a book reads W wyniku zastępowania dokonanego na liściach trzeciego drzewa otrzymamy: IP. DP I′ John I VP V DP reads a book Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (263 / 272) Tree Adjoining Grammar – dołączanie Podstawowe drzewa dzielimy na dwie kategorie: 1. pomocnicze: korzeń drzewa ma tę samą etykietę (kategorię) co wyznaczony liść drzewa .2 początkowe: wszystkie inne Dołączanie polega na wstawieniu drzewa pomocniczego o korzeniu A z etykietą X i wyznaczonym liściem B o tej samej etykiecie do innego drzewa w miejsce węzła C o etykiecie X w taki sposób, że rodzic węzła C staje się rodzicem węzła A, a dzieci węzła C stają się dziećmi węzła B. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (264 / 272) Tree Adjoining Grammar – dołączanie IP. I′ DP John I . VP VP V reads DP a book patiently VP Po operacji dołączenia otrzymamy: IP. DP I′ John I VP patiently Jan Daciuk, KISI, ETI, PG VP V DP reads a book Przetwarzanie języka naturalnego 10. Metody opisu składni (265 / 272) Link Grammar W tej gramatyce słowa w słowniku wyposażone są w zestawy uporządkowanych, nazwanych wiązań. Wiązania dzielą się na lewostronne (łączą się z wiązaniami innych słów leżących w tekście na lewo od danego słowa) i prawostronne (analogicznie). Lewo- i prawostronne wiązania uporządkowane są pod względem odległości słów, z których wiązaniami się łączą. Słowo może mieć kilka alternatywnych zestawów wiązań. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (266 / 272) Link Grammar Ciąg słów jest zdaniem rozpoznawanym przez gramatykę, jeżeli wiązania uda się połączyć w graf spełniający następujące warunki: planarność – wiązania nie przecinają się; łączliwość – wiązania wystarczają do połączenia wszystkich słów zdania; spełnialność – połączenia spełniają wszystkie wymagania nakładane przez wiązania słów w zdaniu. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (267 / 272) Link Grammar Xp Wd Ss . LEFT-WALL John.b PP has.v Os Ds read.v the book.n . book.n . Xp PP Qd . LEFT-WALL Jan Daciuk, KISI, ETI, PG Os Ds SIs has.v John.b Przetwarzanie języka naturalnego read.v the 10. Metody opisu składni (268 / 272) Link Grammar Xp Bsm PP Rw Wq Ds*w . which book.n LEFT-WALL SIs John.b has.v read.v ? read.v ? read.v ? Xp Pv Ss Ds*w Ws . which book.n LEFT-WALL Os John.b has.v Xp I*j Ss Ds*w Ws . which book.n LEFT-WALL Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego Os has.v John.b 10. Metody opisu składni (269 / 272) Definite Clause Grammar DCG jest rodzajem gramatyki metamorficznej. Jest ściśle związana z konkretnym językiem programowania – prologiem. Nie oznacza to, że nie można pisać analizatorów składniowych innych gramatyk w prologu, np. Alpino – analizator składniowy HPSG dla języka niderlandzkiego – jest napisany właśnie w prologu. Jedyna do niedawna pełna gramatyka języka polskiego (napisana przez Stanisława Szpakowicza, a rozwijana także przez Marka Świdzińskiego) jest gramatyką DCG. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (270 / 272) Literatura dotycząca składni Andrew Radford, Transformational Grammar. A First Course, Cambridge Textbooks in Linguistics, Cambridge University Press, 1988. Cheryl A. Black, A Step-by-Step Introduction to the Government and Binding Theory of Syntax, Summer Institute of Linguistics, 1999. Dostępne pod: http: //www.sil.org/americas/mexico/ling/E002-IntroGB.pdf Joan Bresnan, Lexical-Functional Syntax, Blackwell, 2001. Mary Dalrymple, Lexical Functional Grammar, San Diego: Academic Press, 2001. Magdalene Grantson, Lexical Functional Grammar: Analysis and Implementation, raport techniczny, Lund University, 2002. Dostępne pod: http://www.cs.lth.se/EDA171/Reports/2001/magdalene.pdf Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (271 / 272) Literatura dotycząca składni Carl Pollard, Ivan A. Sag,Head-Driven Phrase Structure Grammars, University of Chicago Press, 1994. Adam Przepiórkowski, Anna Kupść, Małgorzata Marciniak, Agnieszka Mykowiecka, Formalny opis języka polskiego. Teoria i implementacja, Akademicka Oficyna Wydawnicza Exit, Warszawa 2002. Stefan Müller, Head-Driven Phrase Structure Grammar. Eine Einführung, Stauffenburg Einführungen Nr. 17, Tübingen: Stauffenburg Verlag, 2008. Dostępne pod: http://hpsg.fu-berlin.de/~stefan/Pub/hpsg-lehrbuch.html Daniel Sleator, Davy Temperley, Parsing English with a Link Grammar, Third International Workshop on Parsing Technologies, 1993. Dostępny pod: http://www.cs.cmu.edu/afs/cs.cmu.edu/project/link/pub/ www/papers/ps/LG-IWPT93.pdf Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (272 / 272)