Gramatyki unifikacyjne (UG)
Transkrypt
Gramatyki unifikacyjne (UG)
Gramatyki unifikacyjne (UG) Gramatyki unifikacyjne (UG), Semantyka j zyka naturalnego Wieloznaczno słów Zapis własności języka naturalnego w gramatykach unifikacyjnych. Przykład formalizmu - HPSG. ę ś ć Literatura dodatkowa: Shieber, S. M. An Introduction to Unification-Based Approaches to Grammar, CSLI Stanford, 1986 Pollard, C., I. Sag, Head-Driven Phrase Structure Grammar, The University of Chicago Press, 1994. listopad, 2005 1 listopad, 2005 2 Lista wymaga Realizacja wymaga opis wymaga umieszczamy w strukturze atrybutów przypisanej danemu wyrazowi jako warto atrybutu arg-st ń ś sleep cat v arg-st elist num pl meet ć Realizacja wymaga polega b dzie na ‘skracaniu’ listy arg-st w momencie rozpoznania frazy opisanej przez jej kolejny element ń brak dopełnie ń cat v arg-st [cat np ] jedno dopełnienie, NP num pl cat v dwa dopełnienia: arg-st < [ cat np ], [cat np ]> NP i NP num pl cat v dwa dopełnienia: give tell arg-st < [cat np ], [cat s ]> num pl listopad, 2005 ć [ cat s ] → [ cat np ] cat v arg-st Y ę cat v arg-st elist cat v arg-st first X rest Y → [ cat X ] NP i S 3 listopad, 2005 Drzewo wywodu 4 J zyk generowany przez UG [cat s] cat v arg-st <> w = a1 ... an nale y do j zyka generowanego przez gramatyk G ( w ∈ L(G)) je eli ci g δ =A1, ..., An, otrzymany w wyniku zast pienia wyrazów ai opisami słownikowymi jest unifikowalny z jakim ci giem otrzymanym na drodze wywodu z symbolu pocz tkowego Ŝ ę ę [cat s] Ŝ ą ą cat v arg-st <s> cat v arg-st <> ś ą ą (je eli istnieje wywód w G rozpoczynaj cy si od symbolu startowego i ko cz cy si form δ ’, tak , e δ δ’ ≠ ) Ŝ [cat np] cat v [cat np] [cat np] cat v arg-st <np, s> arg-st <np> [cat np] John listopad, 2005 told Paul he loved ą ń ą ę ą ą ę Ŝ Ann. 5 listopad, 2005 6 1 Równowa no UG i maszyny Turinga Gramatyki unifikacyjne s typu 0 - to znaczy moc ich równowa na jest mocy maszyny Turinga (generuj j zyki rekurencyjnie przeliczalne) ą Ŝ Formalizmy unifikacyjne ą ę Oznacza to, e nie istnieje procedura, która dla dowolnej gramatyki unifikacyjnej G i ci gu w okre li, czy ci g ten nale y do j zyka generowanego przez G. FUG Functional Unification Grammar LFG GPSG Generalized Phrase Structure Grammar CUG Categorial Unification Grammar HPSG Head-driven Phrase Structure Grammar ... Lexical-Functional Grammar Ŝ ą Ŝ ś ą ę listopad, 2005 7 listopad, 2005 HPSG HPSG, hierarchia typó typów HeadHead-driven Phrase Structure Grammar sign PHON phon SYNSEM synsem Teoria lingwistyczna (Pollard & Sag, 1987, 1994) o podstawach formalnych (istniej logiki aksjomatyzuj ce teorie HPSG) ą ą Teoria oparta na ograniczeniach: wyra enie lingwistyczne jest gramatyczne je li spełnia (jednocze nie) wszystkie nakładane przez gramatyk ograniczenia. Ŝ ś ś word ę 8 phrase HD-DTR sign NONHD-DTR list(sign) Gramatyka HPSG składa si z: ę – sygnatury zawieraj ce opis struktury obiektów (typy, ą atrybuty), – teorii składaj cej si z ogranicze nakładanych na obiekty ą ę Sygnatura zawiera opis struktury obiektów (typy, atrybuty). • Sign - ka dy obiekt lingwistyczny, word -słowo, phrase - fraza ń opisywane przez sygnatur . Ŝ ę listopad, 2005 9 listopad, 2005 10 Typy w HPSG, cd. cd. synsem LOCAL local CAT Do j zyka opisywanego przez gramatyk HPSG nale wyra enia, które spełniaj jednocze nie wszystkie ograniczenia nało one przez t gramatyk . Brak poj cia wywodu, wszystko dane deklaratywnie. ę ę Ŝ category HEAD head ARG-ST args SUBJ list_of_synsems COMPS list_of_synsems CONTENT listopad, 2005 Ograniczenia ą Ŝ Ŝ ą ś ę ę ę Zasada elementu głównego: phrase SYNSEM | LOCAL | CAT | HEAD 1 HD-DTR | SYNSEM | LOCAL | CAT | HEAD 1 content 11 listopad, 2005 12 2 Realizacja wymaga , zasada walencji Phrase i Przykł Przykład SYNSEM | LOCAL | CAT | VAL elist HD-DTR | SYNSEM | LOCAL | CAT | VAL 1 NON-HD-DTRS 2 word PHON <daje> SYNSEM synsem LOC local CAT HEAD verb VFORM fin VAL < 1 NP [nom] [3, sing], 2 NP [dat], 3 NP [acc] > ARG-ST args SUBJ 1 synsem-signs( 1 , 2 ) Zasada walencji mówi, e frazy musz mie pust list VAL, a ich składniki musz odpowiada wymaganiom zapisanym na li cie VAL elementu głównego frazy. Ŝ ą ą ć ą COMPS < 2 , 3 > ę ć ś listopad, 2005 PHON 13 <Jan pisze list > SYNS synsem LOC local CAT cat HEAD 4 SUBCAT <> ARG-ST < 11, 12 > HD-DTR PHON < pisze > SYNS synsem LOC local CAT HEAD 4 listopad, 2005 W słowniku w opisie ‘pisze’: SUBCAT < 1 NP[nom], 2 NP[acc]> 14 Systemy implementuj ce HPSG Jan pisze list H pisze NH NH Jan list ALE, The Attribute Logic Engine, Carpernter, 1992 - efektywny system zachowuj cy elementy gramatyki PSG (CFG) LKB - Stanford, efektywny system nieco ograniczaj cy moc HPSG ConTRoll - Tuebingen, nieefektywny, ‘idealistyczny’ system TRALE - Tuebingen, nowa, efektywniejsza wersja ConTrolla (wykorzystanie do wiadcze z systemu ALE) ą verb VFORM fin SUBCAT < 11 , 12 > AGR-ST < 11 , 12 > NON-HD - -DTRS < PHON <Jan> , PHON <list> > SYNS 11 synsem SYNS 12 synsem LOC local LOC local CAT cat CAT cat HEAD noun HEAD noun CASE nom CASE acc SUBCAT <> SUBCAT <> listopad, 2005 AGR-ST < > AGR-ST < > 15 ą ć ń listopad, 2005 16 Reguł Reguły gramatyczne, ALE Przypadek dopeł dopełnie schema1 rule % wszystkie wymagania za hd-dtr (hd_val_ph, phon Mphon, synsem:loc:cat:val:(subj: [ ], comps: [ ]), hd_dtr: HDtr, non_hd_dtrs: NHdtr) ===> cat> (HDtr, phon:Hphon, synsem:loc:cat:val:(subj:[Subj],comps:Comps)), goal> ( najwyzej_trzy(Comps), cp_comp((loc:cat:head:major:(nominal_t, agr:case:Case)), Neg) if cp_comp_case(Case, Neg). cp_comp((loc:cat:head:major:(@not_nominal)), Neg) if true. Przypadkiem strukturalnym dla dopełnie czasownika nie zanegowanego jest biernik: ń cp_comp_case(acc_t, no_t) if synsems_to_signs([Subj|Comps], Slist), true. … dla dopełnie czasownika zanegowanego – dopełniacz: ń permutation(Slist, NHdtr)), cp_comp_case(gen_t, yes_t) if cats> (NHdtr), goal> ( wysycone_wym_l(NHdtr), sign_list_phon(NHphon, NHdtr), ą cp_comp_case(lex_t, Neg) if append(NHphon,Hphon, Mphon),case_principle(Hdtr)). listopad, 2005 true. Przypadki leksykalne s akceptowane bezwarunkowo: 17 listopad, 2005 true. 18 3 LKB, hierarchia typó typów sł słów listopad, 2005 LKB, hierarchia typó typów sł słów 19 listopad, 2005 20 LKB, prezentacja rozbioró rozbiorów Semantyka j zyka naturalnego Przypadki głębokie (role semantyczne) Rachunek predykatów I rzędu DRT (Discourse Representation Theory) Literatura dodatkowa: Logic, Language and Meaning, L. T. F. Gamut, The University of Chicago Press, 1991. listopad, 2005 21 Zapis znaczenia, przypadki gł gł bokie Semantyka czyli znaczenie ustalenie co jest znaczeniem konkretnego wyra enia w j zyku naturalnym Ŝ Je li zbudujemy drzewo budowy syntaktycznej zdania, to mo emy pokusi si o przyporz dkowanie poszczególnych elementów składniowych (wymaga i modyfikatorów) do ról semantycznych (przypadków gł bokich), jakie poszczególne obiekty pełni w sytuacji opisywanej przez czasownik. Liczba przypadków gł bokich i ich nazwy nie s ci le ustalone, a ich u ycie zale y od konkretnego czasownika. Podstawowe role semantyczne s ustalone (cho czasami inaczej nazywane), ale na potrzeby ró nych teorii czy dla konkretnych zastosowa wprowadza si ró ne zestawy ról rozró niaj cych istotne z punktu widzenia tego zastosowania funkcje. ś Ŝ ę ć ę ą ń – nazwy obiektów, relacji mi dzy nimi, ... ę ę – sieci semantyczne wskazuj ce na hierarchi i ą ę ą pokrewie stwo terminów ń ustalenie sposobu reprezentowania znaczenia okre lenie niezb dnego zakresu wiedzy pragmatycznej okre lenie zasad wnioskowania ę Ŝ ę ś ś ą ś ś Ŝ ą ć Ŝ ń listopad, 2005 23 listopad, 2005 ę Ŝ Ŝ ą 24 4 Zapis znaczenia, przypadki gł gł bokie Rola znaczenie przykład AGENT wykonawca Kot rozlał mleko. EXPERIENCER doświadczający zdarzenia Jana boli głowa. FORCE siła wywołująca (niecelowo) Wiatr złamał drzewo. THEME obiekt Kiedy rozbił\ lód. RESULT rezultat Wybudował \dom. CONTENT cytat/treść Jan spytał ``Byłeś tam sam?''. INSTRUMENT uŜyte narzędzie Uderzył go kijem. BENEFICIARY ktoś na rzecz kogo Kupił mu dom. or RECIPENT odbyła się akcja SOURCE miejsce początkowe Przyleciał z ParyŜa. GOAL miejsce docelowe Poszedł do kina. S (Na strychu Jan zobaczył potwora) PP (modyfikator) NP (podmiot) VP Prep NP N V NP (dopełnienie) na Jan zobaczył potwora N strychu predykat: zobaczyć aktor Jan obiekt potwór miejsce strych listopad, 2005 Zapis znaczenia, przypadki gł gł bokie 25 listopad, 2005 Rachunek predykató predykatów I rz du „Naturalną” metodą reprezentowania semantyki jest rachunek predykatów I rzędu Nie jest to idealny sposób zapisu, nie pozwala na wyraŜenie wszystkich znaczeń, ale ma wiele właściwych cech: – pozwala zapisać czy jakiś fakt jest prawdziwy czy fałszywy – pozwala zapisywać pytania (uŜycie zmiennych) – są metody wnioskowania Wybór rachunku pred. I rzędu nie jest całkowicie arbitralny czy sterowany konkretnymi aplikacjami. MoŜna zauwaŜyć pewne analogie między językiem naturalnym a językiem rachunku predykatów. Cechy rachunku pred. I rzędu: wprowadzenie zmiennych, uŜycie kwantyfikatorów, częściowo kompozycyjna semantyka 26 Analiza semantyczna listopad, 2005 27 Analiza semantyczna to proces przekształcenia wyraŜenia lingwistycznego w zapis jego znaczenia Są miliony sposobów dokonania takiego przekształcenia, od rozwiązań całkowicie ad hoc, opracowanych na potrzeby konkretnych aplikacji do wyrafinowanych metod teoretycznych o często wątpliwym znaczeniu praktycznym Większość metod analizy semantycznej opiera się na wynikach analizy syntaktycznej (albo jest dokonywana równolegle z nią) listopad, 2005 28 Przykł Przykład Semantyka kompozycyjna Większość metod zapisu znaczenia zakłada Filemon pije mleko KOMPOZYCYJNOŚĆ semantyki, tzn. przyjmuje załoŜenie, Ŝe znaczenie większych fragmentów teksu (zdania) moŜe zostać określona jako funkcja znaczeń jego elementów, czyli słów i fraz Na czy polega to w praktyce? PokaŜemy na przykładzie zdania: Filemon pije mleko listopad, 2005 29 S ∃ e Isa(e, Picie) ∧ Pij cy(e, Filemon) ∧ Pity(e, Mleko) ą NP VP NP Proper-Noun Verb Filemon pije listopad, 2005 Mass-Noun mleko 30 5 Rozszerzone reguł reguły syntaktyczne Jak uzyskać znaczenie zdania ze znaczenia elementów? Dołączymy do reguł gramatyki CFG dodatkowe informacje (podobnie jak miało to miejsce przy rozszerzaniu CFG do gramatyk unifikacyjnych) Reguła gramatyki będzie miała teraz postać: Wyra enia Lambda Jak włączyć semantykę argumentów do semantyki czasownika? WyraŜenia Lambda : λx.P(x) λ x.P(x)(A) P(A) A → α1 ... αn { f(α αj.sem, ... , αk.sem) } W powyŜszym przykładzie: Verb → pije {λ λ xλ λy. {∃ ∃e Isa(e, Picie) ∧ Pijący(e, y) ∧ Pity(e, x)} ProperNoun→ → Filemon {Filemon} MassNoun → mleko {Mleko} NP → ProperNoun {ProperNoun:sem} NP → MassNoun {MassNoun:sem} Verb → pije {∃ ∃ e, x, y Isa(e, Picie) ∧ Pijący(e, x) ∧ Pity(e, y)} listopad, 2005 S → NP VP VP → Verb NP 31 {VP:sem(NP:sem)} {Verb:sem(NP:sem)} listopad, 2005 przykł przykład 32 Wprowadzenie termó termów zł zło onych W restauracji podają mięso. Rozwiązaniem problemu jest taki zapis semantyki fraz rzeczownikowych, aby jej elementy były dostępne „z zewnątrz”: Wprowadzenie „termów złoŜonych” i sposobu ich przekształcania: Wydaje się, Ŝe interpretacją powyŜszego zdania powinno być: ∃ e,x Isa(e, Serving) ∧ Server(e, x) ∧ Served(e, Meat) ∧ Isa(x, Restaurant) < Quantifier variable body > np. ∃ x Isa(x, Restaurant) ale, jeŜeli załoŜymy, Ŝe interpretacją wyrazu ‘restauracja’ jest wyraŜenie: ∃x Isa(x, Restaurant) to jak uzyskać powyŜsze tłumaczenie z: λxλ λy.∃ ∃ e Isa(e, Serving) ∧ Server(e, y) ∧ Served(e, x) Proste zastąpienie zmiennej wyraŜeniem λ nie prowadzi do właściwego rezultatu. Wynikiem jest: ∃ e Isa(e, Serving) ∧ Server(e, ∃ xIsa(x, Restaurant)) ∧ Served(e, Meat) niestety powyŜszy zapis nie jest wyraŜeniem rach. pred. I rz. (FOPC) ∃ e Isa(e, Serving) ∧ Server(e, < ∃ xIsa(x, Restaurant) >) ∧ Served(e, Meat) Przekształcenie na wyraŜenie logiki I rzędu: P (< Quantifier variable body >) ⇒ listopad, 2005 33 Wprowadzenie termó termów zł zło onych Quantifier variable body Connective P(variable) Server(e, < ∃ xIsa(x, Restaurant) >) ⇒ ∃ xIsa(x, Restaurant) ∧ Server(e, x) listopad, 2005 34 Przykł Przykład analizy semantycznej Przekształcenie na wyraŜenie logiki I rzędu: S P (< kwantyfikator zmienna treść >) ⇒ kwantyfikator zmienna treść spójnik_logiczny P(zmienna) ∃ e Isa(e, Picie) ∧ Pijący(e, Filemnon) ∧ Pity(e, Mleko) NP Filemon VP λ x.∃ ∃ e Isa(e, Picie) ∧ Pijący(e, x) ∧ Pity(e, Mleko)} P (< ∃ zmienna treść >) => ∃ zmienna treść ∧ P(zmienna) P (< ∀ zmienna treść >) => ∀ zmienna treść ⇒ P(zmienna) NP Server(e, < ∃ x Isa(x, Restaurant) >) (jaka restauracja) ⇒ ∃ x Isa(x, Restaurant) ∧ Server(e, x) Server(e, < ∀ x Isa(x, Restaurant) >) (ka da restauracja) ⇒ ∀ x Isa(x, Restaurant) ⇒ Server(e, x) Proper-Noun Filemon Verb Mleko Mass-Noun Mleko ś Filemon Ŝ listopad, 2005 35 listopad, 2005 pije mleko λ yx.∃ ∃ e Isa(e, Picie) ∧ Pijący(e, y) ∧ Pity(e, y)} 36 6 Wnioskowanie Modus ponens Nie chcemy tylko ‘kopiować’ faktów, ale teŜ wyciągać wnioski, np. Jeśli wiemy, Ŝe X dostał Oskara za rolę w filmie Y, to wiemy teŜ Ŝe X jest (dobrym, znanym, uznanym) aktorem, wiemy czym się w przybliŜeniu zajmował w czasie, gdy kręcony był ten film, Ŝe zna reŜysera i aktorów, którzy grali inne główne role ... Język reprezentacji wiedzy musi uwzględniać wnioskowanie mechanizmy wyliczania wartości prawda lub fałsz dla stwierdzeń, które nie pojawiają się bezpośrednio w danych listopad, 2005 Standardową regułą wnioskowania dla logiki pierwszego rzędu jest modu ponens α , α ⇒β β (jeŜeli wiemy Ŝe α oraz Ŝe α ⇒β to moŜemy wywnioskować β ) np. 37 Mruczek jest kotem, Jeśli x jest kotem, to x lubi mleko Mruczek lubi mleko listopad, 2005 Forward and backward chaining Rezolucja Modus ponens - wnioskowanie wprzód dodając do bazy nowy fakt wyliczamy wszystkie jego konsekwencje Wnioskowanie wstecz (od pytania do faktów) mając pytanie, dopasowujemy go do formuł w bazie danych, jeśli uda nam się dowieść wszystkich przesłanek, fakt jest prawdziwy, np. Pytamy czy Mruczek lubi mleko, znajdujemy formułę Jeśli x jest kotem, to x lubi mleko, dokonujemy podstawienia xMruczek i otrzymujemy do sprawdzenia przesłankę zdania Mruczek lubi mleko, która jest juŜ w bazie danych, a więc pytanie uznajemy za udowodnione. listopad, 2005 39 Wnioskowanie wprzód i wstecz nie są zupełne, tj. są twierdzenia, które są prawdziwe, ale nie mogą być za pomocą tych metod udowodnione Metodą zupełną jest rezolucja (ale jest kosztowniejsza) aby udowodnić p w ramach teorii T zakładamy, Ŝe prawdziwe jest ¬ p i próbujemy dojść do sprzeczności 40 DRT - Discourse Representation Theory listopad, 2005 Inne metody reprezentacji semantyki 38 DRT Situation semantics Montague grammar ... metoda reprezentacji znaczenia wypowiedzi polegająca na konstruowaniu specjalnej struktury, nazwanej DRS (Discourse Representation Structure); Kamp i Reyle (1991); Struktura ta składa się z dwóch części: – zbioru obiektów (discourse referents), zwanych uniwersum, – zbioru warunków opisujących zaleŜności między obiektami. Przykładowo, zdanie Jones owns Ulysses (Jones posiada Ulissesa) moŜna przedstawić w postaci następującej struktury DRS: x y Jones (x) Ulysses(y) [x owns y] listopad, 2005 41 listopad, 2005 42 7 Reguł Reguły budowy struktur DRS Reguł Reguły budowy struktur DRS, cd Budowa reprezentacji semantycznej wypowiedzi w teorii DRT polega na stopniowym przekształcaniu struktury syntaktycznej za pomocą odpowiednich reguł konstrukcyjnych. Kolejność stosowania reguł zaleŜy od miejsca występowania struktur spełniających warunki ich zastosowania - jako pierwszą wybiera się regułę dla której odpowiednia struktura znajduje się najwyŜej w analizowanym drzewie. Reguły mogą zmieniać strukturę oraz rozszerzać uniwersum DRS o nowe zmienne referencyjne. Warunkiem zadziałania reguły jest wykrycie w analizowanej strukturze poddrzewa spełniającego pewne warunki odnoszące się bezpośrednio do jej struktury. W przypadku gdy dwie struktury znajdują się na tym samym poziomie naleŜy poprowadzić równolegle dwie analizy, w kaŜdej z nich wybierając inną regułę jako pierwszą. Uzyskanie w wyniku tego róŜnych struktur DRS odpowiada sytuacji niejednoznaczności analizowanego tekstu. listopad, 2005 43 listopad, 2005 44 CR.PN - reguł reguła dla rzeczownikó rzeczowników CR.PN własnych konfiguracje wyzwalające regułę: S S NP Gen=b lub VP VP’ V ⇒ NP Gen=b PN NP Gen=b PN PN u a a zmiana uniwersum: dołączenie nowej zmiennej referencyjnej u; (nazwa róŜna od wszystkich juŜ występujących w DRS) zmiana zbioru warunków: dołączenie warunków a(u), Gen(u)= b zmiana struktury : wstawienie węzła u zamiast poddrzewa listopad, 2005 45 listopad, 2005 S VP’ NP Gen=-hum PN 2. Do struktury DRS dołączone zostanie wyraŜenie Jones(x) wiąŜące zmienną x z reprezentowanym przez nią obiektem. Po tym kroku analizy struktura DRS przedstawiać się będzie następująco: x Jones (x) [x owns Ulysses] VP V 46 Analiza przykł przykładu, cd 1. Reguła CR.PN ekstrahuje podmiot, tworząc dla niego odpowiednią zmienną referencyjną (x). owns VP’ a Analiza przykł przykładu x VP’ u a(u) Gen(u) = b S Ulysses PowyŜsze drzewo jest w sposób skrócony zapisywane jako: [x owns Ulysses] listopad, 2005 47 listopad, 2005 48 8 Analiza przykł przykładu, 4 CR.NEG - reguł reguła dla negacji 3. Kolejnym krokiem jest wyekstrahowanie obiektu posiadania i przypisanie mu takŜe zmiennej referencyjnej (y). W ten sposób uzyskamy pokazany na wstępie wynik: konfiguracja g wyzwalająca regułę: VP’ AUX xy Jones (x) Ulysses(y) [x owns y] not VP zamiana struktury zawierającej g na: S ¬ u VP’ VP listopad, 2005 49 listopad, 2005 Anafory CR.NEG, przykł przykład John owns a car. x,y John(x) car(y) John owns a car. He likes it. John does not own a car x John(x) y ¬ own(x,y) ∃ y(car(y) ^ own(j,y)) x,y John(x) car(y) own(x,y) likes(x,y) car(y) own(x,y) ¬∃ y(car(y) ^ own(j,y)) listopad, 2005 51 a. John doesn't own Ulysses. b. He likes it (however). ¬ x,y John(x) Ulysses(y) ¬ listopad, 2005 ¬ y car(y) own(x,y) z=? w=? likes(z,w) listopad, 2005 52 DRT A man walks in a park. He whistles. A man walks in a park and whistles. own(x,y) own(x,y) DRT always puts proper names into the main DRS. x,w,z John(x) Motywacja (typowa) : rozwiązanie problemów, z którymi nie radzą sobie inne teorie: interpretacja zaimków, powiązanie fraz rzeczownikowych i zaimków (w ramach zdania i pomiędzy zdaniami) interpretacja informacji o czasie i aspekcie DRS dla (a i b): x,y John(x) Ulysses(y) John does not own a car. ?He likes it. You can only pick up antecedents from the current DRS or DRSs you're embedded in. Anafory w zdaniach zanegowanych DRS dla (a): 50 w=?? z=?? likes(z,w) ∃ x(man(x) ∧ walk_in_a_park(x) ∧ whistle(x)) ... trzeba znać cały tekst A man walks in a park. He whistles. Apparently he is in a good mood. 53 listopad, 2005 54 9 Semantyka w HPSG synsem LOCAL local CAT Semantyka w HPSG, cd. cd. nominal_object INDEX index RESTR list_of_psoa category HEAD head SUBCAT list_of_synsems CONTENT content psoa RELN content nominal_object (NP) Ŝ 55 listopad, 2005 Semantyka w HPSG, przykł przykład ą PHNON <Piotr kupił ksiąŜkę> SYNSEM | LOCAL CATEGORY | HEAD 4 CONTENT psoa RESTR psoa RELN kupi AGENT 2 OBJECT 1 ć HD-DTR | SYNSEM | LOCAL |CATEGORY |HEAD 4 verb NONHD-DTRS < SYNSEM | ... INDEX 2 SYNSEM | ... INDEX 1 > > Ŝ listopad, 2005 57 listopad, 2005 58 Prolog - j zyk do implementacji Liczne inne problemy.. 56 Semantyka w HPSG, przykł przykład 2 PHNON <ksiąŜka> SYNSEM | LOCAL CATEGORY | HEAD | noun nominal_object INDEX 1 index gender fem number singular person 3rd RESTR < psoa RELN ksi ka INSTANCE 1 rel_name i argumenty zale ne od relacji, np. INSTANCE index psoa (p_state_of affairs) (VP) listopad, 2005 CONTENT index gender gender number number person person gramatyk zaleŜności czasowe aspekt czasowników (idę, poszłam, chadzam) reprezentowanie przekonań (niekonieczne obiektywnie prawdziwych) 1971, Alain Colmeraurer i Phillip Roussel program podawany jest jako pewien zestaw zaleŜności, a obliczenia są dowodem pewnego twierdzenia w oparciu o te zaleŜności. Język oparty o logikę pierwszego rzędu ograniczenie klauzul to klauzul Horna, (co najwyŜej jeden niezanegowany element) dla których moŜna szybko dokonać dowiedzenia czy jest ona prawdziwa czy nie (na drodze rezolucji, tj. generowania nowych klauzul a dojdzie si do sprzeczno ci.) ustalona metoda analizy left-to-right, dept-first-search kolejność ewaluacji klauzul zgodna z porządkiem tekstowym główna operacja - unifikacja zmiennych Ŝ listopad, 2005 59 listopad, 2005 ę ś 60 10 Prolog, podstawowe fakty Prolog, podstawowe fakty W Prologu jeśli nazwa zaczyna się od małej litery - to stała, jeśli od wielkiej - zmienna. Program w Prologu składa się z informacji a) dane/fakty postaci owoc(dąb, Ŝołądź). b) zaleŜności młodszy(X,Z) :- młodszy(X, Y), młodszy(Y,Z). Pytania formułuje się podając klauzulę ze zmiennymi. Odpowiedzią są wszystkie utoŜsamienia zmiennych prowadzące do uzyskania prawdziwej formuły, np. młodszy(jan, michał). młodszy(michał, wiktor). młodszy(wiktor, zenek). młodszy(X,Z) :- młodszy(X, Y), młodszy(Y,Z). {dla kaŜdych X, Y, Z, jeśli X jest młodszy od Y, a Y jest młodszy od Z, to X jest młodszy od Z} młodszy(jan, X). młodszy(zenek,jan). ( po lewej stronie moŜe być tylko jeden predykat, a:- b, c czytamy ‘jeśli bi c to a’) listopad, 2005 61 listopad, 2005 Prolog, podstawowe fakty Nazywając predykaty trzeba pamiętać o jakim kierunku” myślimy (w poprzednim przykładzie kto jest od kogo młodszy). Zamieniając miejscami zmienne i stałe zmieniamy „kierunek” pytania, np. podwładny(jan, michał). 62 Prolog, konkatenacja list X= michał, wiktor, zenek No ‘jan’ jest powdładnym ‘michała’ podwładny(michał, wiktor). Zapis [a,b,c] lub [a | [b,c]] Sklejamy dwie listy tworz c trzeci list . ą ą ę append([], L, L). % sklejenie pustej listy z dowoln list daj t drug append([X | L1], L2, [X | L3]) :- append(L1, L2, L3). ą ą ę ę ą % je li pierwsza lista nie jest pusta, to bierzemy ten pierwszy % element na pocz tek listy wynikowej i rekurencyjnie sklejamy reszt % listy pierwszej (krótsz o 1 element) z list drug ś ą podwładny(jan, X). podwładny(X,jan). podwładny(X,Y). Kogo podwładnym jest ‘jan’? Kto jest podwładnym ‘jana’? wszystkie pary listopad, 2005 ą ą append([1,2],[3,4], X). X = [1,2,3,4] append([1,2], X, [1,2,5,6,7]). X = [5,6,7] 63 listopad, 2005 64 Prolog - zapis gramatyk Prolog ę ą Język Prolog jest podstawowym językiem do pisania gramatyk. Większość wymienionych środowisk programistycznych jest nakładką na Prolog (wyjątek to LKB korzystający z Lispu, drugiego waŜnego języka w tej dziedzinie) Niestety nawet uproszczone dowodzenie twierdzeń, jakim jest rezolucja jest drogie, a więc efektywność systemów korzystających z Prologu nie moŜe być zbyt wielka NajwaŜniejsze kompilatory Prologu: % klauzule pomocnicze: % div1 - podział ostatniej listy na dwie niepuste podlisty S1, S2 divide1([],S,S). divide1([X|S1],S2,[X|S]):-divide1(S1,S2,S). nempty([X|_]). div1(S1,S2,S) :- divide1(S1,S2,S),nempty(S1), nempty(S2). --np.. div1([Piękna, kotka],[długo spała], [Piękna, kotka, długo, spała]). – komercyjny Sicstus Prolog – nie komercyjny SWI Prolog ... listopad, 2005 65 listopad, 2005 66 11 Prolog - zapis gramatyk s(L):- div1(L1,L2,L), np(L1,G), vp(L2,G). np(L,G):- n(L,G). np(L,G):- div1(L1,L2,L), adjp(L1,G), np(L2,G). vp(L,G):- v(L,G). adjp(L,G):- adj(L,G). adj([piekny],masc). % G - uzgodnienie rodzaju adj([piekna],fem). v([spal],masc). v([spala],fem). n([pies],masc). n([kotka],fem). listopad, 2005 Ujednoznacznianie sł słów (WSD, Word sense disambiguation) 67 listopad, 2005 68 Powi zania mi dzy sł słowami homonimy - jednakowy kształt słowa, róŜne znaczenia homofony - jednakowe brzmienie słów, róŜna pisownia, znaczenie polisemia - wielość powiązanych znaczeń jednego słowa – np. pokój (pomieszczenie) i pokój (przeciwieństwo wojny) Zadania: ustalenie ile i jakich znaczeń posiada dane słowo rozpoznawanie w jakim konkretnym znaczeniu wystąpiło dane słowo - word sense disambiguation – np. moŜe, morze – np. góra (piętro domu, część ubrania ...) Synonimy - róŜne leksemy o tym samym (prawie) znaczeniu (mogące się nawzajem zastąpić w pewnym kontekście) hyponimy - leksemy o szerszym znaczeniu taksonomia, hierarchia pojęć – np. pojazd mechaniczny vs. samochód, listopad, 2005 69 WordNet - baza danych o znaczeniach sł słów 94474 10319 20170 4546 70 Przykł Przykładowy opis znacze Fragment opisu rzeczownika bass w bazie WordNet: Utworzona ręcznie baza zawierająca opisy i powiązania semantyczne dla słów danego języka (pierwszy był angielski, nie ma jeszcze dla polskiego) zakres WordNet 1.6 dla angielskiego liczba form liczba znaczeń rzeczowniki czasowniki przymiotniki przysłówki listopad, 2005 116317 22066 29881 5677 1. bass - the lowest part of the musical range 2. bass, bass part - the lowest part in polyphonic music 3. bass, basso - an adult male singer with the lowest voice 4. sea bass, bass - flesh of lean-flesh saltwater fish 5. fresh water bass, bass - any of varoius North American lean-fleshed freshwater fishes 6. bass, bass voice, basso ... 7. bass ... 8. bass ... – WordNet nie zawiera słów z klas zamkniętych, np. spójników – w praktyce mało słów ma wiele znaczeń listopad, 2005 71 listopad, 2005 72 12 Relacje w WordNet Przykł Przykładowy opis hiponimii definicja pojęcie -> pojęcie nadrzędne pojęcie-> pojęcie podrzędne grupa -> członek członek ->grupa ma części jest elementem jest przeciwieństwem Sense 3 bass, basso -- (an adult singer with the lowest voice) => singer, vocalist => musician, instrumentalist, player => performer, performing artist => entertainer => person, individual, someone ... => life form, organism, being ... => entity, something => causal agent, cause, causal agency => entity, something Rzeczowniki relacja hypernym hyponym has-member member-of has-part part-of antonym przykład breakfast->meal meal -> lunch katedra->profesor pilot -> załoga stół -> blat talerz -> serwis pierwszy ->ostatni listopad, 2005 73 listopad, 2005 Role, FrameNet Rola Selekcja znacze - ograniczenia na role przykład AGENT EXPERIENCER FORCE THEME RESULT CONTENT INSTRUMENT BENEFICIARY SOURCE GOAL ‘eat something’ Kot rozlał mleko. Jana boli głowa. Wiatr złamał drzewo. Kiedy rozbił lód. (uczestnik doświadczający skutków) Wybudował dom. Jan spytał „Byłeś tam sam?”. Uderzył go kijem. Kupił mu dom. Przyleciał z ParyŜa. Poszedł do szkoły. listopad, 2005 74 – *I wanna eat someplace that’s close to ICSI. – I wanna eat some really cheap Chinese food right now. AGENT THEME 75 Formuł Formułowanie ogranicze I /I *someplace ... / ...food Czasownik eat wymaga, by w roli THEME występował „obiekt jadalny” listopad, 2005 76 Problemy z ujednoznacznianiem Przedmiot dla czasownika eat musi być jadalny: Logika pierwszego rzędu: Hierarchia hiponimii w WordNet ∃ e,x,y eating(e) ∧ Agent(e,x) ∧ Theme(e,y) ∧ Isa(y,EdibleThing) Theme {food, nutrient} (jeden z 60000 klasyfikatorów, te pojęcia musza znaleźć się w hierarchii) hamburger, beefburger -- (a fried cake of minced meet served on a ban) => sandwich => snack food => dish => nutriment, nourishment, sustenance ... =>food nutrient => substance, matter => object, physical object => entity, something listopad, 2005 RóŜne ograniczenia na typ argumentów mogą pomóc przy ujednoznacznianiu przykładów: – Which airlines serve Denver? - Pojedź do serwisu. – Which one serves breakfast? - UŜyj tego granatowego serwisu. Ale: 77 niedostateczny kontekst: – Jaki serwis polecasz? Sytuacje niecodzienne – On naprawdę zjadł szklankę ! Przeczenie – ale złota nie dało się jeść Bajki dla dzieci, sny...: – śnił2005 mi się latający krokodyl, piŜama w róŜowe słonie listopad, 78 13 Ujednoznacznianie Reguły probabilistyczne niczego (prawie) nie wykluczamy całkowicie, podajemy preferencje algorytm podaje to znaczenie, dla którego prawdopodobieństwo jest w danym kontekście największe odpowiednia metoda dla niejednoznacznych czasowników, ale przy jednoznacznych argumentach Metody „machine learning” uczenie się na podstawie korpusów anotowanych morfologicznie znajdowanie kontekstów uŜycia i wyznaczanie prawdopodobieństw dla poszczególnych znaczeń listopad, 2005 79 14