Gramatyki unifikacyjne (UG)

Transkrypt

Gramatyki unifikacyjne (UG)
Gramatyki unifikacyjne (UG)
Gramatyki unifikacyjne (UG),
Semantyka j zyka naturalnego
Wieloznaczno słów
Zapis własności języka naturalnego w
gramatykach unifikacyjnych. Przykład
formalizmu - HPSG.
ę
ś
ć
Literatura dodatkowa: Shieber, S. M. An Introduction to
Unification-Based Approaches to Grammar, CSLI Stanford, 1986
Pollard, C., I. Sag, Head-Driven Phrase Structure Grammar,
The University of Chicago Press, 1994.
listopad, 2005
1
listopad, 2005
2
Lista wymaga
Realizacja wymaga
opis wymaga umieszczamy w strukturze atrybutów
przypisanej danemu wyrazowi jako warto atrybutu arg-st
ń
ś
sleep
cat v
arg-st elist
num pl
meet
ć
Realizacja wymaga polega b dzie na ‘skracaniu’ listy arg-st
w momencie rozpoznania frazy opisanej przez jej kolejny
element
ń
brak dopełnie
ń
cat v
arg-st [cat np ] jedno dopełnienie, NP
num pl
cat v
dwa dopełnienia:
arg-st < [ cat np ], [cat np ]>
NP i NP
num pl
cat v
dwa dopełnienia:
give
tell
arg-st < [cat np ], [cat s ]>
num pl
listopad, 2005
ć
[ cat s ] → [ cat np ]
cat v
arg-st Y
ę
cat v
arg-st elist
cat v
arg-st first X
rest Y
→
[ cat X ]
NP i S
3
listopad, 2005
Drzewo wywodu
4
J zyk generowany przez UG
[cat s]
cat v
arg-st <>
w = a1 ... an nale y do j zyka generowanego przez
gramatyk G ( w ∈ L(G)) je eli ci g δ =A1, ..., An, otrzymany
w wyniku zast pienia wyrazów ai opisami słownikowymi jest
unifikowalny z jakim ci giem otrzymanym na drodze
wywodu z symbolu pocz tkowego
Ŝ
ę
ę
[cat s]
Ŝ
ą
ą
cat v
arg-st <s>
cat v
arg-st <>
ś
ą
ą
(je eli istnieje wywód w G rozpoczynaj cy si od symbolu
startowego i ko cz cy si form δ ’, tak , e
δ δ’ ≠
)
Ŝ
[cat np] cat v
[cat np] [cat np] cat v
arg-st <np, s>
arg-st <np> [cat np]
John
listopad, 2005
told
Paul
he
loved
ą
ń
ą
ę
ą
ą
ę
Ŝ
Ann.
5
listopad, 2005
6
1
Równowa no UG i maszyny
Turinga
Gramatyki unifikacyjne s typu 0 - to znaczy moc ich
równowa na jest mocy maszyny Turinga (generuj j zyki
rekurencyjnie przeliczalne)
ą
Ŝ
Formalizmy unifikacyjne
ą
ę
Oznacza to, e nie istnieje procedura, która dla dowolnej
gramatyki unifikacyjnej G i ci gu w okre li, czy ci g ten
nale y do j zyka generowanego przez G.
FUG Functional Unification Grammar
LFG
GPSG Generalized Phrase Structure Grammar
CUG Categorial Unification Grammar
HPSG Head-driven Phrase Structure Grammar
...
Lexical-Functional Grammar
Ŝ
ą
Ŝ
ś
ą
ę
listopad, 2005
7
listopad, 2005
HPSG
HPSG, hierarchia typó
typów
HeadHead-driven Phrase Structure Grammar
sign
PHON phon
SYNSEM synsem
Teoria lingwistyczna (Pollard & Sag, 1987, 1994) o podstawach
formalnych (istniej logiki aksjomatyzuj ce teorie HPSG)
ą
ą
Teoria oparta na ograniczeniach: wyra enie lingwistyczne jest
gramatyczne je li spełnia (jednocze nie) wszystkie nakładane
przez gramatyk ograniczenia.
Ŝ
ś
ś
word
ę
8
phrase
HD-DTR sign
NONHD-DTR list(sign)
Gramatyka HPSG składa si z:
ę
– sygnatury zawieraj ce opis struktury obiektów (typy,
ą
atrybuty),
– teorii składaj cej si z ogranicze nakładanych na obiekty
ą
ę
Sygnatura zawiera opis struktury obiektów (typy, atrybuty).
•
Sign - ka dy obiekt lingwistyczny, word -słowo, phrase - fraza
ń
opisywane przez sygnatur .
Ŝ
ę
listopad, 2005
9
listopad, 2005
10
Typy w HPSG, cd.
cd.
synsem
LOCAL
local
CAT
Do j zyka opisywanego przez gramatyk HPSG nale
wyra enia, które spełniaj jednocze nie wszystkie
ograniczenia nało one przez t gramatyk .
Brak poj cia wywodu, wszystko dane deklaratywnie.
ę
ę
Ŝ
category
HEAD
head
ARG-ST args
SUBJ list_of_synsems
COMPS list_of_synsems
CONTENT
listopad, 2005
Ograniczenia
ą
Ŝ
Ŝ
ą
ś
ę
ę
ę
Zasada elementu głównego:
phrase
SYNSEM | LOCAL | CAT | HEAD
1
HD-DTR | SYNSEM | LOCAL | CAT | HEAD 1
content
11
listopad, 2005
12
2
Realizacja wymaga , zasada
walencji
Phrase
i
Przykł
Przykład
SYNSEM | LOCAL | CAT | VAL elist
HD-DTR | SYNSEM | LOCAL | CAT | VAL 1
NON-HD-DTRS 2
word
PHON <daje>
SYNSEM synsem
LOC local
CAT HEAD
verb
VFORM fin
VAL < 1 NP [nom] [3, sing], 2 NP [dat], 3 NP [acc] >
ARG-ST args
SUBJ 1
synsem-signs( 1 , 2 )
Zasada walencji mówi, e frazy musz mie pust list
VAL, a ich składniki musz odpowiada wymaganiom
zapisanym na li cie VAL elementu głównego frazy.
Ŝ
ą
ą
ć
ą
COMPS < 2 , 3 >
ę
ć
ś
listopad, 2005
PHON
13
<Jan pisze list >
SYNS
synsem
LOC local
CAT cat
HEAD 4
SUBCAT <>
ARG-ST < 11, 12 >
HD-DTR
PHON < pisze >
SYNS synsem
LOC local
CAT HEAD 4
listopad, 2005
W słowniku w opisie ‘pisze’:
SUBCAT < 1 NP[nom], 2 NP[acc]>
14
Systemy implementuj ce HPSG
Jan pisze list
H
pisze
NH
NH
Jan
list
ALE, The Attribute Logic Engine, Carpernter, 1992 - efektywny
system zachowuj cy elementy gramatyki PSG (CFG)
LKB - Stanford, efektywny system nieco ograniczaj cy moc
HPSG
ConTRoll - Tuebingen, nieefektywny, ‘idealistyczny’ system
TRALE - Tuebingen, nowa, efektywniejsza wersja ConTrolla
(wykorzystanie do wiadcze z systemu ALE)
ą
verb
VFORM fin
SUBCAT < 11 , 12 >
AGR-ST < 11 , 12 >
NON-HD - -DTRS
< PHON <Jan>
, PHON <list>
>
SYNS 11 synsem
SYNS 12 synsem
LOC local
LOC local
CAT cat
CAT cat
HEAD noun
HEAD noun
CASE nom
CASE acc
SUBCAT <>
SUBCAT <>
listopad, 2005
AGR-ST < >
AGR-ST < > 15
ą
ć
ń
listopad, 2005
16
Reguł
Reguły gramatyczne, ALE
Przypadek dopeł
dopełnie
schema1 rule
% wszystkie wymagania za hd-dtr
(hd_val_ph,
phon Mphon, synsem:loc:cat:val:(subj: [ ], comps: [ ]),
hd_dtr: HDtr, non_hd_dtrs: NHdtr)
===>
cat> (HDtr, phon:Hphon,
synsem:loc:cat:val:(subj:[Subj],comps:Comps)),
goal> ( najwyzej_trzy(Comps),
cp_comp((loc:cat:head:major:(nominal_t, agr:case:Case)), Neg) if
cp_comp_case(Case, Neg).
cp_comp((loc:cat:head:major:(@not_nominal)), Neg) if
true.
Przypadkiem strukturalnym dla dopełnie czasownika nie zanegowanego jest
biernik:
ń
cp_comp_case(acc_t, no_t) if
synsems_to_signs([Subj|Comps], Slist),
true.
… dla dopełnie czasownika zanegowanego – dopełniacz:
ń
permutation(Slist, NHdtr)),
cp_comp_case(gen_t, yes_t) if
cats> (NHdtr),
goal> ( wysycone_wym_l(NHdtr), sign_list_phon(NHphon, NHdtr),
ą
cp_comp_case(lex_t, Neg) if
append(NHphon,Hphon, Mphon),case_principle(Hdtr)).
listopad, 2005
true.
Przypadki leksykalne s akceptowane bezwarunkowo:
17
listopad, 2005
true.
18
3
LKB, hierarchia typó
typów sł
słów
listopad, 2005
LKB, hierarchia typó
typów sł
słów
19
listopad, 2005
20
LKB, prezentacja rozbioró
rozbiorów
Semantyka j zyka naturalnego
Przypadki głębokie (role semantyczne)
Rachunek predykatów I rzędu
DRT (Discourse Representation Theory)
Literatura dodatkowa: Logic, Language and Meaning,
L. T. F. Gamut, The University of Chicago Press, 1991.
listopad, 2005
21
Zapis znaczenia, przypadki gł
gł bokie
Semantyka czyli znaczenie
ustalenie co jest znaczeniem konkretnego wyra enia w
j zyku naturalnym
Ŝ
Je li zbudujemy drzewo budowy syntaktycznej zdania, to
mo emy pokusi si o przyporz dkowanie poszczególnych
elementów składniowych (wymaga i modyfikatorów) do ról
semantycznych (przypadków gł bokich), jakie poszczególne
obiekty pełni w sytuacji opisywanej przez czasownik.
Liczba przypadków gł bokich i ich nazwy nie s ci le ustalone,
a ich u ycie zale y od konkretnego czasownika.
Podstawowe role semantyczne s ustalone (cho czasami inaczej
nazywane), ale na potrzeby ró nych teorii czy dla konkretnych
zastosowa wprowadza si ró ne zestawy ról rozró niaj cych
istotne z punktu widzenia tego zastosowania funkcje.
ś
Ŝ
ę
ć
ę
ą
ń
– nazwy obiektów, relacji mi dzy nimi, ...
ę
ę
– sieci semantyczne wskazuj ce na hierarchi i
ą
ę
ą
pokrewie stwo terminów
ń
ustalenie sposobu reprezentowania znaczenia
okre lenie niezb dnego zakresu wiedzy pragmatycznej
okre lenie zasad wnioskowania
ę
Ŝ
ę
ś
ś
ą
ś
ś
Ŝ
ą
ć
Ŝ
ń
listopad, 2005
23
listopad, 2005
ę
Ŝ
Ŝ
ą
24
4
Zapis znaczenia, przypadki gł
gł bokie
Rola
znaczenie
przykład
AGENT
wykonawca
Kot rozlał mleko.
EXPERIENCER doświadczający zdarzenia Jana boli głowa.
FORCE
siła wywołująca (niecelowo) Wiatr złamał drzewo.
THEME
obiekt
Kiedy rozbił\ lód.
RESULT
rezultat
Wybudował \dom.
CONTENT
cytat/treść
Jan spytał ``Byłeś tam sam?''.
INSTRUMENT uŜyte narzędzie
Uderzył go kijem.
BENEFICIARY ktoś na rzecz kogo
Kupił mu dom.
or RECIPENT odbyła się akcja
SOURCE
miejsce początkowe
Przyleciał z ParyŜa.
GOAL
miejsce docelowe
Poszedł do kina.
S (Na strychu Jan zobaczył potwora)
PP (modyfikator)
NP (podmiot)
VP
Prep NP
N
V
NP (dopełnienie)
na
Jan
zobaczył
potwora
N
strychu
predykat: zobaczyć
aktor Jan
obiekt potwór
miejsce strych
listopad, 2005
Zapis znaczenia, przypadki gł
gł bokie
25
listopad, 2005
Rachunek predykató
predykatów I rz du
„Naturalną” metodą reprezentowania semantyki jest rachunek
predykatów I rzędu
Nie jest to idealny sposób zapisu, nie pozwala na wyraŜenie
wszystkich znaczeń, ale ma wiele właściwych cech:
– pozwala zapisać czy jakiś fakt jest prawdziwy czy fałszywy
– pozwala zapisywać pytania (uŜycie zmiennych)
– są metody wnioskowania
Wybór rachunku pred. I rzędu nie jest całkowicie arbitralny czy
sterowany konkretnymi aplikacjami. MoŜna zauwaŜyć pewne
analogie między językiem naturalnym a językiem rachunku
predykatów.
Cechy rachunku pred. I rzędu: wprowadzenie zmiennych, uŜycie
kwantyfikatorów, częściowo kompozycyjna semantyka
26
Analiza semantyczna
listopad, 2005
27
Analiza semantyczna to proces przekształcenia wyraŜenia
lingwistycznego w zapis jego znaczenia
Są miliony sposobów dokonania takiego przekształcenia, od
rozwiązań całkowicie ad hoc, opracowanych na potrzeby
konkretnych aplikacji do wyrafinowanych metod
teoretycznych o często wątpliwym znaczeniu praktycznym
Większość metod analizy semantycznej opiera się na
wynikach analizy syntaktycznej (albo jest dokonywana
równolegle z nią)
listopad, 2005
28
Przykł
Przykład
Semantyka kompozycyjna
Większość metod zapisu znaczenia zakłada
Filemon pije mleko
KOMPOZYCYJNOŚĆ
semantyki, tzn. przyjmuje załoŜenie, Ŝe znaczenie
większych fragmentów teksu (zdania) moŜe zostać
określona jako funkcja znaczeń jego elementów, czyli słów
i fraz
Na czy polega to w praktyce? PokaŜemy na przykładzie
zdania:
Filemon pije mleko
listopad, 2005
29
S ∃ e Isa(e, Picie) ∧ Pij cy(e, Filemon) ∧ Pity(e, Mleko)
ą
NP
VP
NP
Proper-Noun
Verb
Filemon
pije
listopad, 2005
Mass-Noun
mleko
30
5
Rozszerzone reguł
reguły syntaktyczne
Jak uzyskać znaczenie zdania ze znaczenia elementów?
Dołączymy do reguł gramatyki CFG dodatkowe informacje
(podobnie jak miało to miejsce przy rozszerzaniu CFG do
gramatyk unifikacyjnych)
Reguła gramatyki będzie miała teraz postać:
Wyra enia Lambda
Jak włączyć semantykę argumentów do semantyki czasownika?
WyraŜenia Lambda :
λx.P(x)
λ x.P(x)(A)
P(A)
A → α1 ... αn { f(α
αj.sem, ... , αk.sem) }
W powyŜszym przykładzie:
Verb → pije
{λ
λ xλ
λy. {∃
∃e Isa(e, Picie) ∧ Pijący(e, y) ∧ Pity(e, x)}
ProperNoun→
→ Filemon {Filemon}
MassNoun → mleko
{Mleko}
NP → ProperNoun
{ProperNoun:sem}
NP → MassNoun
{MassNoun:sem}
Verb → pije {∃
∃ e, x, y Isa(e, Picie) ∧ Pijący(e, x) ∧ Pity(e, y)}
listopad, 2005
S → NP VP
VP → Verb NP
31
{VP:sem(NP:sem)}
{Verb:sem(NP:sem)}
listopad, 2005
przykł
przykład
32
Wprowadzenie termó
termów zł
zło onych
W restauracji podają mięso.
Rozwiązaniem problemu jest taki zapis semantyki fraz
rzeczownikowych, aby jej elementy były dostępne „z zewnątrz”:
Wprowadzenie „termów złoŜonych” i sposobu ich przekształcania:
Wydaje się, Ŝe interpretacją powyŜszego zdania powinno być:
∃ e,x Isa(e, Serving) ∧ Server(e, x) ∧ Served(e, Meat) ∧ Isa(x,
Restaurant)
< Quantifier variable body > np. ∃ x Isa(x, Restaurant)
ale, jeŜeli załoŜymy, Ŝe interpretacją wyrazu ‘restauracja’ jest wyraŜenie:
∃x Isa(x, Restaurant)
to jak uzyskać powyŜsze tłumaczenie z:
λxλ
λy.∃
∃ e Isa(e, Serving) ∧ Server(e, y) ∧ Served(e, x)
Proste zastąpienie zmiennej wyraŜeniem λ nie prowadzi do właściwego
rezultatu. Wynikiem jest:
∃ e Isa(e, Serving) ∧ Server(e, ∃ xIsa(x, Restaurant)) ∧ Served(e, Meat)
niestety powyŜszy zapis nie jest wyraŜeniem rach. pred. I rz. (FOPC)
∃ e Isa(e, Serving) ∧ Server(e, < ∃ xIsa(x, Restaurant) >) ∧ Served(e,
Meat)
Przekształcenie na wyraŜenie logiki I rzędu:
P (< Quantifier variable body >) ⇒
listopad, 2005
33
Wprowadzenie termó
termów zł
zło onych
Quantifier variable body Connective P(variable)
Server(e, < ∃ xIsa(x, Restaurant) >)
⇒ ∃ xIsa(x, Restaurant) ∧ Server(e, x)
listopad, 2005
34
Przykł
Przykład analizy semantycznej
Przekształcenie na wyraŜenie logiki I rzędu:
S
P (< kwantyfikator zmienna treść >) ⇒
kwantyfikator zmienna treść spójnik_logiczny P(zmienna)
∃ e Isa(e, Picie) ∧ Pijący(e, Filemnon) ∧ Pity(e, Mleko)
NP Filemon
VP
λ x.∃
∃ e Isa(e, Picie) ∧ Pijący(e, x) ∧ Pity(e, Mleko)}
P (< ∃ zmienna treść >) => ∃ zmienna treść ∧ P(zmienna)
P (< ∀ zmienna treść >) => ∀ zmienna treść ⇒ P(zmienna)
NP
Server(e, < ∃ x Isa(x, Restaurant) >) (jaka restauracja)
⇒ ∃ x Isa(x, Restaurant) ∧ Server(e, x)
Server(e, < ∀ x Isa(x, Restaurant) >) (ka da restauracja)
⇒ ∀ x Isa(x, Restaurant) ⇒ Server(e, x)
Proper-Noun
Filemon
Verb
Mleko
Mass-Noun Mleko
ś
Filemon
Ŝ
listopad, 2005
35
listopad, 2005
pije
mleko
λ yx.∃
∃ e Isa(e, Picie) ∧ Pijący(e, y) ∧ Pity(e, y)}
36
6
Wnioskowanie
Modus ponens
Nie chcemy tylko ‘kopiować’ faktów, ale teŜ wyciągać
wnioski,
np. Jeśli wiemy, Ŝe X dostał Oskara za rolę w filmie Y, to wiemy teŜ Ŝe
X jest (dobrym, znanym, uznanym) aktorem, wiemy czym się w
przybliŜeniu zajmował w czasie, gdy kręcony był ten film, Ŝe zna
reŜysera i aktorów, którzy grali inne główne role ...
Język reprezentacji wiedzy musi uwzględniać wnioskowanie mechanizmy wyliczania wartości prawda lub fałsz dla
stwierdzeń, które nie pojawiają się bezpośrednio w danych
listopad, 2005
Standardową regułą wnioskowania dla logiki pierwszego
rzędu jest modu ponens
α , α ⇒β
β
(jeŜeli wiemy Ŝe α oraz Ŝe α ⇒β to moŜemy wywnioskować β )
np.
37
Mruczek jest kotem,
Jeśli x jest kotem, to x lubi mleko
Mruczek lubi mleko
listopad, 2005
Forward and backward chaining
Rezolucja
Modus ponens - wnioskowanie wprzód
dodając do bazy nowy fakt wyliczamy wszystkie jego konsekwencje
Wnioskowanie wstecz (od pytania do faktów) mając pytanie, dopasowujemy go do formuł w bazie danych, jeśli uda
nam się dowieść wszystkich przesłanek, fakt jest prawdziwy, np.
Pytamy czy Mruczek lubi mleko, znajdujemy formułę
Jeśli x jest kotem, to x lubi mleko, dokonujemy podstawienia xMruczek i otrzymujemy do sprawdzenia przesłankę zdania Mruczek
lubi mleko, która jest juŜ w bazie danych, a więc pytanie uznajemy za
udowodnione.
listopad, 2005
39
Wnioskowanie wprzód i wstecz nie są zupełne, tj. są
twierdzenia, które są prawdziwe, ale nie mogą być za pomocą
tych metod udowodnione
Metodą zupełną jest rezolucja (ale jest kosztowniejsza) aby udowodnić p w ramach teorii T zakładamy, Ŝe
prawdziwe jest ¬ p i próbujemy dojść do sprzeczności
40
DRT - Discourse Representation Theory
listopad, 2005
Inne metody reprezentacji
semantyki
38
DRT
Situation semantics
Montague grammar
...
metoda reprezentacji znaczenia wypowiedzi polegająca na
konstruowaniu specjalnej struktury, nazwanej DRS (Discourse
Representation Structure); Kamp i Reyle (1991);
Struktura ta składa się z dwóch części:
– zbioru obiektów (discourse referents), zwanych uniwersum,
– zbioru warunków opisujących zaleŜności między obiektami.
Przykładowo, zdanie Jones owns Ulysses (Jones posiada
Ulissesa) moŜna przedstawić w postaci następującej struktury
DRS:
x y
Jones (x)
Ulysses(y)
[x owns y]
listopad, 2005
41
listopad, 2005
42
7
Reguł
Reguły budowy struktur DRS
Reguł
Reguły budowy struktur DRS, cd
Budowa reprezentacji semantycznej wypowiedzi w teorii DRT polega
na stopniowym przekształcaniu struktury syntaktycznej za pomocą
odpowiednich reguł konstrukcyjnych.
Kolejność stosowania reguł zaleŜy od miejsca występowania struktur
spełniających warunki ich zastosowania - jako pierwszą wybiera się
regułę dla której odpowiednia struktura znajduje się najwyŜej w
analizowanym drzewie.
Reguły mogą zmieniać strukturę oraz rozszerzać uniwersum DRS o
nowe zmienne referencyjne.
Warunkiem zadziałania reguły jest wykrycie w analizowanej
strukturze poddrzewa spełniającego pewne warunki odnoszące się
bezpośrednio do jej struktury.
W przypadku gdy dwie struktury znajdują się na tym samym
poziomie naleŜy poprowadzić równolegle dwie analizy, w kaŜdej z
nich wybierając inną regułę jako pierwszą.
Uzyskanie w wyniku tego róŜnych struktur DRS odpowiada sytuacji
niejednoznaczności analizowanego tekstu.
listopad, 2005
43
listopad, 2005
44
CR.PN - reguł
reguła dla rzeczownikó
rzeczowników
CR.PN
własnych
konfiguracje wyzwalające regułę:
S
S
NP Gen=b
lub
VP
VP’
V
⇒
NP Gen=b
PN
NP Gen=b
PN
PN
u
a
a
zmiana uniwersum: dołączenie nowej zmiennej referencyjnej u; (nazwa
róŜna od wszystkich juŜ występujących w DRS)
zmiana zbioru warunków: dołączenie warunków a(u), Gen(u)= b
zmiana struktury : wstawienie węzła u zamiast poddrzewa
listopad, 2005
45
listopad, 2005
S
VP’
NP Gen=-hum
PN
2. Do struktury DRS dołączone zostanie wyraŜenie Jones(x)
wiąŜące zmienną x z reprezentowanym przez nią obiektem.
Po tym kroku analizy struktura DRS przedstawiać się będzie
następująco:
x
Jones (x)
[x owns Ulysses]
VP
V
46
Analiza przykł
przykładu, cd
1. Reguła CR.PN ekstrahuje podmiot, tworząc dla niego odpowiednią
zmienną referencyjną (x).
owns
VP’
a
Analiza przykł
przykładu
x
VP’
u
a(u)
Gen(u) = b
S
Ulysses
PowyŜsze drzewo jest w sposób skrócony zapisywane jako: [x owns Ulysses]
listopad, 2005
47
listopad, 2005
48
8
Analiza przykł
przykładu, 4
CR.NEG - reguł
reguła dla negacji
3. Kolejnym krokiem jest wyekstrahowanie obiektu posiadania
i przypisanie mu takŜe zmiennej referencyjnej (y). W ten
sposób uzyskamy pokazany na wstępie wynik:
konfiguracja g wyzwalająca regułę:
VP’
AUX
xy
Jones (x)
Ulysses(y)
[x owns y]
not
VP
zamiana struktury zawierającej g na:
S
¬
u
VP’
VP
listopad, 2005
49
listopad, 2005
Anafory
CR.NEG, przykł
przykład
John owns a car.
x,y
John(x)
car(y)
John owns a car.
He likes it.
John does not own a car
x
John(x)
y
¬
own(x,y)
∃ y(car(y) ^ own(j,y))
x,y
John(x)
car(y)
own(x,y)
likes(x,y)
car(y)
own(x,y)
¬∃ y(car(y) ^ own(j,y))
listopad, 2005
51
a. John doesn't own Ulysses.
b. He likes it (however).
¬
x,y
John(x)
Ulysses(y)
¬
listopad, 2005
¬
y
car(y)
own(x,y)
z=?
w=?
likes(z,w)
listopad, 2005
52
DRT
A man walks in a park. He whistles.
A man walks in a park and whistles.
own(x,y)
own(x,y)
DRT always puts
proper names into the main DRS.
x,w,z
John(x)
Motywacja (typowa) : rozwiązanie problemów, z którymi nie
radzą sobie inne teorie:
interpretacja zaimków, powiązanie fraz rzeczownikowych i
zaimków (w ramach zdania i pomiędzy zdaniami)
interpretacja informacji o czasie i aspekcie
DRS dla (a i b):
x,y
John(x)
Ulysses(y)
John does not own a car.
?He likes it.
You can only pick
up antecedents from
the current DRS or
DRSs you're
embedded in.
Anafory w zdaniach zanegowanych
DRS dla (a):
50
w=??
z=??
likes(z,w)
∃ x(man(x) ∧ walk_in_a_park(x) ∧ whistle(x))
... trzeba znać cały tekst
A man walks in a park. He whistles. Apparently he is in a good mood.
53
listopad, 2005
54
9
Semantyka w HPSG
synsem
LOCAL local
CAT
Semantyka w HPSG, cd.
cd.
nominal_object
INDEX index
RESTR list_of_psoa
category
HEAD
head
SUBCAT list_of_synsems
CONTENT
content
psoa
RELN
content
nominal_object
(NP)
Ŝ
55
listopad, 2005
Semantyka w HPSG, przykł
przykład
ą
PHNON <Piotr kupił ksiąŜkę>
SYNSEM | LOCAL
CATEGORY | HEAD 4
CONTENT psoa
RESTR psoa
RELN kupi
AGENT 2
OBJECT 1
ć
HD-DTR | SYNSEM | LOCAL |CATEGORY |HEAD 4 verb
NONHD-DTRS < SYNSEM | ... INDEX 2
SYNSEM | ... INDEX 1 >
>
Ŝ
listopad, 2005
57
listopad, 2005
58
Prolog - j zyk do implementacji
Liczne inne problemy..
56
Semantyka w HPSG, przykł
przykład 2
PHNON <ksiąŜka>
SYNSEM | LOCAL
CATEGORY | HEAD | noun
nominal_object
INDEX 1
index
gender fem
number singular
person 3rd
RESTR <
psoa
RELN ksi ka
INSTANCE 1
rel_name
i argumenty zale ne od relacji, np.
INSTANCE
index
psoa (p_state_of affairs)
(VP)
listopad, 2005
CONTENT
index
gender gender
number number
person person
gramatyk
zaleŜności czasowe
aspekt czasowników (idę, poszłam, chadzam)
reprezentowanie przekonań (niekonieczne obiektywnie
prawdziwych)
1971, Alain Colmeraurer i Phillip Roussel
program podawany jest jako pewien zestaw zaleŜności, a
obliczenia są dowodem pewnego twierdzenia w oparciu o te
zaleŜności.
Język oparty o logikę pierwszego rzędu
ograniczenie klauzul to klauzul Horna, (co najwyŜej jeden
niezanegowany element) dla których moŜna szybko dokonać
dowiedzenia czy jest ona prawdziwa czy nie (na drodze rezolucji, tj.
generowania nowych klauzul a dojdzie si do sprzeczno ci.)
ustalona metoda analizy left-to-right, dept-first-search
kolejność ewaluacji klauzul zgodna z porządkiem tekstowym
główna operacja - unifikacja zmiennych
Ŝ
listopad, 2005
59
listopad, 2005
ę
ś
60
10
Prolog, podstawowe fakty
Prolog, podstawowe fakty
W Prologu jeśli nazwa zaczyna się od małej litery - to stała, jeśli od
wielkiej - zmienna.
Program w Prologu składa się z informacji
a) dane/fakty postaci
owoc(dąb, Ŝołądź).
b) zaleŜności
młodszy(X,Z) :- młodszy(X, Y), młodszy(Y,Z).
Pytania formułuje się podając klauzulę ze zmiennymi. Odpowiedzią
są wszystkie utoŜsamienia zmiennych prowadzące do uzyskania
prawdziwej formuły, np.
młodszy(jan, michał).
młodszy(michał, wiktor).
młodszy(wiktor, zenek).
młodszy(X,Z) :- młodszy(X, Y), młodszy(Y,Z).
{dla kaŜdych X, Y, Z, jeśli X jest młodszy od Y, a Y jest
młodszy od Z, to X jest młodszy od Z}
młodszy(jan, X).
młodszy(zenek,jan).
( po lewej stronie moŜe być tylko jeden predykat,
a:- b, c czytamy ‘jeśli bi c to a’)
listopad, 2005
61
listopad, 2005
Prolog, podstawowe fakty
Nazywając predykaty trzeba pamiętać o jakim kierunku” myślimy (w
poprzednim przykładzie kto jest od kogo młodszy).
Zamieniając miejscami zmienne i stałe zmieniamy „kierunek”
pytania, np.
podwładny(jan, michał).
62
Prolog, konkatenacja list
X= michał, wiktor, zenek
No
‘jan’ jest powdładnym ‘michała’
podwładny(michał, wiktor).
Zapis [a,b,c] lub [a | [b,c]]
Sklejamy dwie listy tworz c trzeci list .
ą
ą
ę
append([], L, L).
% sklejenie pustej listy z dowoln list daj t drug
append([X | L1], L2, [X | L3]) :- append(L1, L2, L3).
ą
ą
ę
ę
ą
% je li pierwsza lista nie jest pusta, to bierzemy ten pierwszy
% element na pocz tek listy wynikowej i rekurencyjnie sklejamy reszt
% listy pierwszej (krótsz o 1 element) z list drug
ś
ą
podwładny(jan, X).
podwładny(X,jan).
podwładny(X,Y).
Kogo podwładnym jest ‘jan’?
Kto jest podwładnym ‘jana’?
wszystkie pary
listopad, 2005
ą
ą
append([1,2],[3,4], X).
X = [1,2,3,4]
append([1,2], X, [1,2,5,6,7]). X = [5,6,7]
63
listopad, 2005
64
Prolog - zapis gramatyk
Prolog
ę
ą
Język Prolog jest podstawowym językiem do pisania
gramatyk.
Większość wymienionych środowisk programistycznych jest
nakładką na Prolog (wyjątek to LKB korzystający z Lispu,
drugiego waŜnego języka w tej dziedzinie)
Niestety nawet uproszczone dowodzenie twierdzeń, jakim jest
rezolucja jest drogie, a więc efektywność systemów
korzystających z Prologu nie moŜe być zbyt wielka
NajwaŜniejsze kompilatory Prologu:
% klauzule pomocnicze:
% div1 - podział ostatniej listy na dwie niepuste podlisty S1, S2
divide1([],S,S).
divide1([X|S1],S2,[X|S]):-divide1(S1,S2,S).
nempty([X|_]).
div1(S1,S2,S) :- divide1(S1,S2,S),nempty(S1), nempty(S2).
--np.. div1([Piękna, kotka],[długo spała], [Piękna, kotka, długo, spała]).
– komercyjny Sicstus Prolog
– nie komercyjny SWI Prolog ...
listopad, 2005
65
listopad, 2005
66
11
Prolog - zapis gramatyk
s(L):- div1(L1,L2,L),
np(L1,G), vp(L2,G).
np(L,G):- n(L,G).
np(L,G):- div1(L1,L2,L), adjp(L1,G), np(L2,G).
vp(L,G):- v(L,G).
adjp(L,G):- adj(L,G).
adj([piekny],masc).
% G - uzgodnienie rodzaju
adj([piekna],fem).
v([spal],masc).
v([spala],fem).
n([pies],masc).
n([kotka],fem).
listopad, 2005
Ujednoznacznianie sł
słów
(WSD, Word sense disambiguation)
67
listopad, 2005
68
Powi zania mi dzy sł
słowami
homonimy - jednakowy kształt słowa, róŜne znaczenia
homofony - jednakowe brzmienie słów, róŜna pisownia,
znaczenie
polisemia - wielość powiązanych znaczeń jednego słowa
– np. pokój (pomieszczenie) i pokój (przeciwieństwo wojny)
Zadania:
ustalenie ile i jakich znaczeń posiada dane słowo
rozpoznawanie w jakim konkretnym znaczeniu wystąpiło
dane słowo - word sense disambiguation
– np. moŜe, morze
– np. góra (piętro domu, część ubrania ...)
Synonimy - róŜne leksemy o tym samym (prawie) znaczeniu
(mogące się nawzajem zastąpić w pewnym kontekście)
hyponimy - leksemy o szerszym znaczeniu
taksonomia, hierarchia pojęć
– np. pojazd mechaniczny vs. samochód,
listopad, 2005
69
WordNet - baza danych o
znaczeniach sł
słów
94474
10319
20170
4546
70
Przykł
Przykładowy opis znacze
Fragment opisu rzeczownika bass w bazie WordNet:
Utworzona ręcznie baza zawierająca opisy i powiązania
semantyczne dla słów danego języka (pierwszy był angielski,
nie ma jeszcze dla polskiego)
zakres WordNet 1.6 dla angielskiego
liczba form liczba znaczeń
rzeczowniki
czasowniki
przymiotniki
przysłówki
listopad, 2005
116317
22066
29881
5677
1. bass - the lowest part of the musical range
2. bass, bass part - the lowest part in polyphonic music
3. bass, basso - an adult male singer with the lowest voice
4. sea bass, bass - flesh of lean-flesh saltwater fish
5. fresh water bass, bass - any of varoius North American lean-fleshed
freshwater fishes
6. bass, bass voice, basso ...
7. bass ...
8. bass ...
– WordNet nie zawiera słów z klas zamkniętych, np. spójników
– w praktyce mało słów ma wiele znaczeń
listopad, 2005
71
listopad, 2005
72
12
Relacje w WordNet
Przykł
Przykładowy opis hiponimii
definicja
pojęcie -> pojęcie nadrzędne
pojęcie-> pojęcie podrzędne
grupa -> członek
członek ->grupa
ma części
jest elementem
jest przeciwieństwem
Sense 3
bass, basso -- (an adult singer with the lowest voice)
=> singer, vocalist
=> musician, instrumentalist, player
=> performer, performing artist
=> entertainer
=> person, individual, someone ...
=> life form, organism, being ...
=> entity, something
=> causal agent, cause, causal agency
=> entity, something
Rzeczowniki
relacja
hypernym
hyponym
has-member
member-of
has-part
part-of
antonym
przykład
breakfast->meal
meal -> lunch
katedra->profesor
pilot -> załoga
stół -> blat
talerz -> serwis
pierwszy ->ostatni
listopad, 2005
73
listopad, 2005
Role, FrameNet
Rola
Selekcja znacze - ograniczenia
na role
przykład
AGENT
EXPERIENCER
FORCE
THEME
RESULT
CONTENT
INSTRUMENT
BENEFICIARY
SOURCE
GOAL
‘eat something’
Kot rozlał mleko.
Jana boli głowa.
Wiatr złamał drzewo.
Kiedy rozbił lód. (uczestnik doświadczający skutków)
Wybudował dom.
Jan spytał „Byłeś tam sam?”.
Uderzył go kijem.
Kupił mu dom.
Przyleciał z ParyŜa.
Poszedł do szkoły.
listopad, 2005
74
– *I wanna eat someplace that’s close to ICSI.
– I wanna eat some really cheap Chinese food right now.
AGENT
THEME
75
Formuł
Formułowanie ogranicze
I
/I
*someplace ... / ...food
Czasownik eat wymaga, by w roli THEME występował
„obiekt jadalny”
listopad, 2005
76
Problemy z ujednoznacznianiem
Przedmiot dla czasownika eat musi być jadalny:
Logika pierwszego rzędu:
Hierarchia hiponimii w WordNet
∃ e,x,y eating(e) ∧ Agent(e,x) ∧ Theme(e,y) ∧ Isa(y,EdibleThing)
Theme {food, nutrient} (jeden z 60000 klasyfikatorów, te pojęcia musza
znaleźć się w hierarchii)
hamburger, beefburger -- (a fried cake of minced meet served on a ban)
=> sandwich
=> snack food
=> dish
=> nutriment, nourishment, sustenance ...
=>food nutrient
=> substance, matter => object, physical object
=> entity, something
listopad, 2005
RóŜne ograniczenia na typ argumentów mogą pomóc przy
ujednoznacznianiu przykładów:
– Which airlines serve Denver? - Pojedź do serwisu.
– Which one serves breakfast? - UŜyj tego granatowego serwisu.
Ale:
77
niedostateczny kontekst:
– Jaki serwis polecasz?
Sytuacje niecodzienne
– On naprawdę zjadł szklankę !
Przeczenie
– ale złota nie dało się jeść
Bajki dla dzieci, sny...:
– śnił2005
mi się latający krokodyl, piŜama w róŜowe słonie
listopad,
78
13
Ujednoznacznianie
Reguły probabilistyczne
niczego (prawie) nie wykluczamy całkowicie, podajemy
preferencje
algorytm podaje to znaczenie, dla którego prawdopodobieństwo
jest w danym kontekście największe
odpowiednia metoda dla niejednoznacznych czasowników, ale
przy jednoznacznych argumentach
Metody „machine learning”
uczenie się na podstawie korpusów anotowanych morfologicznie
znajdowanie kontekstów uŜycia i wyznaczanie
prawdopodobieństw dla poszczególnych znaczeń
listopad, 2005
79
14