prezentacja PDF

Transkrypt

prezentacja PDF
Kompozycyjny opis semantyki
polskich fraz nominalnych w oparciu
o metody semantyki dynamicznej
Maciej Piasecki
Wydziałowy Zakład Informatyki
Wydział Informatyki i Zarządzania
Politechnika Wrocławska
Plan
• Cel pracy
• Realizacja celu
• Samoorganizująca się Logika Struktur (SLS) –
język reprezentacji znaczenia
• Notacja graficzna SLS
• Model znaczenia polskiej frazy nominalnej
• Koncepcja wykorzystania SLS w
implementacji
• Ograniczenia i dalsze prace
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Cel pracy
Celem pracy było skonstruowanie
formalnego języka reprezentacji
znaczenie polskiej frazy nominalnej
(FN) a następnie jego wykorzystanie do
opracowania formalnego opisu
znaczenia szerokiego podzbioru
polskich FN.
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Fraza nominalna — definicja
(Saloni i Świdziński, Składnia współczesnego języka
polskiego, PWN, 1998)
– fraza wymagana frazy finitywnej
(czasownikowej),
– realizowana jako grupa: rzeczownikowa,
przymiotnikowa (eliptyczne imiesłowy),
liczebnikowa (liczebnik+rzeczownik),
zdaniowa (zdania względne).
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Realizacja celu
• Etap 1
– konstrukcja języka reprezentacji znaczenia (JRZ) języka logicznego wyższego rzędu z typami nazwanego Samoorganizująca się Logika Struktur
(SLS)
• Etap 2
– opracowanie formalnego opisu znaczenia
szerokiego podzbioru polskich FN, opartego na
niedospecyfikowanych wyrażeniach SLS, jako
reprezentacji znaczenia poszczególnych
jednostek leksykalnych
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS – zakres opisu
• Samoorganizująca się Logika Struktur
• Reprezentacja znaczenia frazy nominalnej w
dyskursie (wielozdaniowej wypowiedzi)
• Kompozycyjny i łączny opis wielu aspektów
znaczenia FN:
– deskryptywnego – informacja opisowa
– kwantyfikacji – kwantyfikator uogólniony Mostowskiego
– referencji – odniesienia wyrażenia językowego do bytów
pozajęzykowych
– presupozycji – warunków sensowności użycia
– anafory - relacja semantyczno-składniowa pomiędzy dwoma
wyrażeniami językowymi w dyskursie (np. FN, zwanej
poprzednikiem anaforycznym, i odnoszącym się do niej
zaimkiem)
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - podstawowe założenia
• Punkt startu to kompozycyjna reprezentacja anafory
– referencyjna FN – oczekiwanie identyfikacji referenta
– anaforyczna FN – oczekiwanie identyfikacji poprzednika
anaforycznego
– wspólny jest proces identyfikacji elementu reprezentacji
kontekstu interpretacji
– element ten nazywany będzie znacznikiem dyskursu
– identyfikacja na poziomie języka przedmiotowego
• Konieczność reprezentacji
– wykorzystywanych znaczników
– zmiennych powiązań pomiędzy znacznikami
• Dynamiczna koncepcja znaczenia
– znaczenie jako relacja na stanach kontekstu interpretacji
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS – charakterystyka formalna
• SLS to język logiki wyższego rzędu z typami
• Typy podstawowe
– e (entities) – wartości typu e reprezentują byty
– t (truth values) – wartości logicznych
– m (‘memory’) – wartości typu m to znaczniki dyskursu
• denotacja typu m to dowolny nieskończony zbiór z nałożonym
porządkiem liniowym <M
• istnieje element minimalny P0
• Konstruktory typów złożonych
– typów funkcyjnych
– typów, których denotacja to produkt kartezjański
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS – stany
i dynamika znaczenia
• Stan to element denotacji złożonego typu
• Stan początkowy S0 = 〈P0, ∅, {〈P0, ∅〉} 〉
znaczniki
ostatnio aktywowany
następny
…
‘pamięć’:
wartościowanie
w stanie
…
…
znaczniki
aktywowane
wcześniej
powiązania
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - komponent kontekstu (1)
• Formuły dynamiczne - termy interpretowane jako
relacje na stanach
• Aktywacja znacznika:
– ↓ – operator – relacja na stanach
– zwiększa zbiór aktywnych znaczników o następnik ostatnio
aktywowanego znacznika
– rozszerza niedeterministycznie funkcję wartościująca w
stanie
operator ↓
stan wejściowy
stan wyjściowy
P0
...
Pn
P0
...
Pn
Pn+1
przypisana
pewna wartość
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - komponent kontekstu (2)
• Operator referencji ↑
– dla podanego znacznika i zbioru obiektów generuje relację
na stanach
– odnajduje pośród znaczników dostępnych (warunek
strukturalny) te, które są dopasowane pod względem
właściwości (warunek semantyczny),
• zawieranie się pojęciowe wartości w zbiorze podanym jako
argument
– dodaje dla odnalezionych znaczników pary do listy powiązań
w danym stanie
stan wyjściowy
operator
↑(
P
,
X)
n
stan wejściowy
P0
...
Pn
P0
⊆X
... Pk ... Pi ... Pn
Yk ⊆ X Yi ⊆ X
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
⊆X
SLS - komponent kontekstu (3)
• Pseudo-operatory (skróty notacyjne)
– dynamicznej: negacji (not), implikacji (⇒) i dysjunkcji (or)
• łączą formuły dynamiczne
• ‘domykają’ zbiór aktywnych znaczników
– operator sekwencji (;)
• odpowiada koniunkcji
• stan wyjściowy pierwszej formuły staje się stanem wejściowym
drugiej
• Presupozycja
– operatory presupozycji unikalnej i słabej
– warunek możliwości zmiany stanu (aktualizacji)
• rozszerzenia listy powiązań o dokładnie jedną lub przynajmniej
jedną parę znaczników dyskursu
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS – aspekt deskryptywny
• Predykaty
– ‘rzeczownikowy’ – którego denotacją jest zbiór obiektów
– ‘czasownikowy’ – którego denotacją jest zbiór konfiguracji
kolekcji
,…,
,…,
,…,
• Operatory pobrania dla podanego stanu
– ostatnio aktywowanego znacznika
– i wartości podanego znacznika
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
,…
SLS - kwantyfikacja i mnogość
• Proto-kwantyfikatory
– funktor generujący kwantyfikator uogólniony
– wykorzystywane w reprezentacji aspektu kwantyfikacji
Niech Z to wartość znacznika
a
C
N2(three)(Z)
2(three)(Z)
three(Z)
..
.
..
.
kolektywna
..
.
neutralna
D1(three)(Z)
..
.
dystrybutywna
three:= λX.λY.[ |X∩Y|= 3 ∧ Y⊆X]
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS – kwantyfikacja jako opis
struktur relacji (1)
• Pojęcie zależności liczebnościowej
– operatory niezależności i zależności liczebnościowej ‘<‘
Qthree<Qtwo
zmodyfikowane
proto-kwantyfikatory
i ich zależności operator
…
zbiór potencjalnych konfiguracji kolekcji
Qthree<Qtwo macierzowy
Qtwo>Qthree
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
……
SLS – kwantyfikacja jako opis
struktur relacji (2)
zbiór potencjalnych konfiguracji kolekcji
…
…
denotacja predykatu czasownikowego
,…,
,…,
,…,
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
,…
Notacja graficzna podzbioru SLS
(GSLS)
d
λN.
three
N
:=λN.〈 λp.λi.λj.N(p, i, j),
D1(three), λi.λj.( #(Q(i), j) ) 〉
Trzech egzaminatorów sprawdziło
dwie prace.
sprawdził
d
egzaminator
three
d
d
d
two
praca
:= λi.λj.∃k.( ∃r.(↓(i, r) ∧ ?1( λi.λj.(#(∇(r),i)⊆egzaminator ∧ i=j), ∇(r), r, k) )
∧ ∃l.( ↓(k, l) ∧ ?1( λi.λj.(#(∇(l),i)⊆praca ∧ i=j), ∇(l), l, j) ) ∧
?2( λi.λj.⊗2( Φ(δ, δ, sprawdził), M2(ω(<), ω(>), D1(three)( #(Q(i),j) ),
D1(two)( #(Q(k),j) ) ), #(Q(i),k), #(Q(k),j) ), Q(i), Q(k), i, j ) )
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Wyrażenia podstawowe GSLS (1)
•
wyrażenie predykatu rzeczownikowego
p
λp.
•
p
λN.λp.
mężczyzna
młody
N
przykłady wyrażeń kwantyfikatora uogólnionego
d
λN.
N
three
:=λN.〈 λp.λi.λj.N(p, i, j),
D1(three), λi.λj.( #(Q(i), j) ) 〉
kwantyfikator absolutny
d
λN.
N
most
|…|>0
kwantyfikator relatywny
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Wyrażenia podstawowe GSLS (2)
•
niedospecyfikowane wyrażenie kwantyfikatora
h1
λN.
•
three
N
+{ {〈 h1, c 〉}, {〈 h1, n 〉}, {〈 h1, d 〉} }
wyrażenie zależności kontekstowej
λQ.
Q
1..n
aktywacja znacznika
aktywacja znacznika +
operator referencji +
presupozycja słaba
1
aktywacja znacznika +
operator referencji +
presupozycja unikalna
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Wyrażenia podstawowe GSLS (3)
•
niedospecyfikowane wyrażenie predykatu czasownikowego
λN1.λN2.
N1
sprawdził
h2
h1
N2
h3
+{ {〈 h1, o1 〉, 〈 h2, o2 〉, 〈 h3, z 〉 : o1,o2∈{c, n, d} ∧ z∈{ 〈’<’, ‘>’〉,
〈’>’, ‘<’〉, 〈’<’, ‘<’〉, 〈’:’, ‘:’〉 } ∧ cdv_match2(〈o1, o2〉, z) }
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Zastosowanie SLS jako JRZ
• Dostosowanie formalizmu gramatyki opartego na
unifikacji wartości atrybutów
• Konstrukcja uproszczonego mechanizmu
niedospecyfikowanej reprezentacji semantycznej
• Definicja leksykonu znaczeń poszczególnych
leksemów
• Konstrukcja reguł gramatyki opisujących:
– podzbiór języka angielskiego (porównanie siły ekspresji)
– podzbiór języka polskiego (model znaczenia FN)
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Formalizm gramatyki i
mechanizm niedospecyfikowania
• Mechanizm niedospecyfikowania (N-SLS)
– wprowadzenie meta-zmiennych do wyrażeń
λN1. 〈 λi.λj.∃k.(↓(i,k) ∧ N1(∇(k), k, j) ),
λi.λj.h1_n(two)( #(Q(i),j) ), ω 〉 + {{〈 h1, c 〉}, {〈 h1, n 〉}, {〈 h1, d 〉}}
– określenie reguł podstawiania wyrażeń za meta-zmienne
– mechanizm deterministycznego przemianowania metazmiennych
• Schemat reguły gramatyki (SN-SLS):
Katw+R(t1, ..., tn)+L(F1, ..., Fn)
→ Kat1+t1+F1 ... Katn+tn+Fn {Cond}
– reguły leksykalne – specyfikacja formy leksemu
– reguły konstruujące frazę
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Porównanie SN-SLS z innymi
teoriami znaczenia dyskursu
• Gramatyka opisująca podzbiór języka angielskiego
– przykład reguły leksykalnej
PRO[Num=sing, Gen=male, Case=+nom/-nom, Quant=ind, Refer=+,
Var=h1, Lex=”they/them”] +
h
1
person
– przykład reguły konstruujące frazę
1..n
exstpl
+{ {〈h1, c〉}, {〈h1, n〉}, {〈h1, d〉}
S[Num=α]+ V([Θ(FV,FN)]N)
+ { f: ∃fV∈FV.∃fN∈FN.
(f=fV •(Θ(fV,fN)°fN)∧ [f]([Θ(fV,fN)]u) = [f]([Θ(fV,fN)]NP.Var) } →
NP[Num=α, Gen=β, Case=+nom, Gap= -, Var=v] +N + FN
VP’[Num=α, Tense=η, VarLst=uw] +V + FV
{∃fv∈FV.∃fN∈FV.[fv]u = [fN]v}
Propozycje rozwiązań dla wybranych problematycznych
konstrukcji językowych i znaczeń
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Model znaczenia polskiej frazy
nominalnej
• Gramatyka podzbioru języka polskiego oparta na
SN-SLS
– opis składniowy
• szczegółowy w zakresie FN
• uproszczony w zakresie opisu ‘frazy czasownikowej’ i zdania
– kompozycyjny opis semantyczny
• Określenie możliwych znaczeń fraz FN w
poszczególnych konstrukcjach ze względu na
identyfikowane aspekty:
– weryfikacja na podstawie znaczeń opisywanych w literaturze
lingwistycznej
– oraz kompetencję językową autora
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Struktura składniowosemantyczna FN – punkt wyjścia
•
Analizy strukturalno-funkcjonalne
– Topolińska (1984), Grzegorczykowa (1996)
•
Analizy ‘czysto’ semantyczne
– Grzegorczykowa (1996), Kosseska-Toszewa (1992), Karolak (1990),
Borkowska (1984)
•
Nie sformalizowane lub ‘częściowo’ sformalizowane analizy składniowe
– Saloni i Świdziński (1998)
•
Sformalizowane opisy polskiej składni
– ‘powierzchniowe’ gramatyki DCG
• Szpakowicz (1983), Świdziński (1992), Vetulani (w przyg., POLINT)
– prace oparte na paradygmacie Government and Binding Theory
• Węgrzynek (1995), Derwojedowa et. al. (w przyg.)
– prace zrealizowane w formalizmie HPSG
• Przepiórkowski (1999), Marciniak (2002), Mykowiecka (2001), Przepiórkowski et.
al. (2001)
•
Prace kognitywne dotyczące semantyki FN
– Szwedek (1976)
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Pojęcie determinatora
(K. Węgrzynek „Składnia przymiotnika w ujęciu generatywnotransformacyjnym” 1995)
• Składniowe, formalne kryterium przynależności do
kategorii przymiotnika:
– podstawowe pozycje w strukturze głębokiej
VP → V AdjP
NP1 → AdjP N
NP1 → N AdjP
- pozycja przyłącznikowa
- pozycja w FN (przyrzecznikowa),
- pozycja we FN
– test podstawieniowy
1) Chłopak jest wysoki.
2) błędne koło, ślepa uliczka
3) tygrys bengalski, logarytm naturalny
4) *tygrys groźny bengalski, *bardzo biały kruk
5) *Chłopiec jest ten / ów / jakiś / pewien / żaden / każdy / niejeden.
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Podstawowa struktura
składniowo-semantyczna FN (1)
•
•
Brak całościowego formalnego opisu składni FN
Mechanizmy obecne w większości FN:
– aktywacja znacznika i pewna forma kwantyfikacji
•
Propozycja syntetyczna
– wstępny szkielet:
FN (PS f1)
FN → DetP NumNP
DetP (PS d1)
DetP → (ModP) Det
NumNP → NumP Nker Det (LI 3)
NumP (PS n1a)
NKer’ (PS k2)
– przykłady:
NumOne (LI 6a)
NKer (PS k1)
tych
1) *każdy ten mężczyzna
2) mężczyzna / mężczyźni
3) tych trzech mężczyzn
4) jakiś pięciu mężczyzn
5) ?każdych trzech mężczyzn
NumNP (PS n1)
trzech
N (LI 8a)
mężczyzn
- obserwacja: maksimum jedna DetP ∼ maksimum jeden znacznik
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Podstawowa struktura
składniowo-semantyczna FN (2)
• Det jako źródło aktywacji (c.d.)
– problem: liczne FN pozbawione DetP
– za: FN w konstrukcji z atrybutywnym być nie mogą mieć
DetP i nie mogą być anaforyzowane
1) Jan jest dobrym lekarzem1. Ten lekarz1 ...
2) Jan jest ?tym / ?jakimś / *pewnym lekarzem.
• Lokalizacja mechanizmu kwantyfikacji
– potencjalne ‘źródła’:
• reprezentacja semantyczna NumP
• morfologiczna liczba mnoga
– problem: aspekt kwantyfikacji w wielu Det np. jakiś
1) tych trzech mężczyzn
3) ?wszyscy (ci) trzej mężczyźni
2) ?każdych trzech mężczyzn
4) każdy z tych mężczyzn
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Reprezentacja
niekwantyfikujących Det
LI1) Det[Case=mian/dop/.../woł, GNum=mos-poj / mos-mno / ... / pt-mno,
Neg= –/+, Quant= –, Lex= jakiś / jacyś / ... ]+
LI2) Det[Case=mian/dop/.../woł, GNum=mos-poj / mos-mno / ... /
pt-mno, Neg= –/+,Quant= –,
Lex= pewien / pewni / ... ]+
1..n
LI3) Det[Case=mian/dop/.../woł, GNum=mos-poj / ... /
pt-mno, Neg= –/+, Quant= –, Lex= ten / ci / ...]+
1
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Kwantyfikujące Det
LI4a) Det[Case=mian/dop/.../woł, GNum=mos-poj / mzw-poj / mnż-poj / ... ,
Neg= –/+, Quant= +, Var=d,
d
Lex= każdy / każdy / każde / ...]+
λN.
every
N
|…|>0
||every|| := λX.λY.[ X=Y ]
LI4b) Det[Case=mian/dop/.../woł, GNum=mos-mno / mzw-mno / mnż-mno
/..., Neg= –/+,Quant= +, Var=h1 , Lex= wszyscy / wszystkie / ... ] +
h1
λN.
N
every
+{ {〈 h1, c 〉}, {〈 h1, n 〉}, {〈 h1, d 〉} }
|…|>0
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Kwantyfikujące Det - przykłady
•
Odmiana każdy i wszyscy
1) *Każdy mieszkaniec zgromadził się na placu.
2) Jan zapakował wszystkie książki, część razem, część
osobno do pudełek.
3) Wszyscy zawodnicy zaliczyli po jednej wysokości.
•
Relatywny charakter
4) *Istnieje(ą) każdy człowiek / wszyscy ludzie, który / którzy...
5) *Istnieje ten człowiek, który ...
6) Istnieje jakiś / pewien uczeń, który ...
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Liczebniki
LI 6) Num[Case=mian/dop/.../woł, GNum= mos-mno / mzw-mno / mnżmno /..., NClass=C1, Neg= +, Quant= –, Var=h1 , Lex= kilku / kilka ] +
h1
λN.
few
N
+{ {〈 h1, c 〉}, {〈 h1, n 〉}, {〈 h1, d 〉} }
||few|| := λX.λY.[| X∩Y |>2 ∧ | X∩Y |<ε ∧ Y⊆X]
LI 6a) NumOne[Case=mian/dop/.../woł, GNum= mos-mno / mzw-mno /
mnż-mno /..., NClass=C0, Neg= +, Quant= –, Var=h1,
Lex= dwaj / dwa/...] +
h
1
λN.
N
||two|| := λX.λY.[|X∩Y |=2 ∧ Y⊆X]
two
+{ {〈 h1, c 〉}, {〈 h1, n 〉}, {〈 h1, d 〉} }
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
‘Pełna’ FN
FN (PS f1)
tych trzech mężczyzn
DetP (PS d1)
Det (LI 3)
tych
NumNP (PS n1)
NumP (PS n1a)
NKer’ (PS k2)
NumOne (LI 6a)
NKer (PS k1)
trzech
N (LI 8a)
mężczyzn
(
1
h1
three
h1
( mężczyzna ))= mężczyzna three
1
+{ {〈 h1, c 〉}, {〈 h1, n 〉}, {〈 h1, d 〉} }
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Brak Det we FN
•
Modyfikatory referencyjności (dokonujące type lift)
AL:=λQ.
Q
Q
RWL:=λQ.
1..n
•
Q
RSL:=λQ.
1
Problem referencyjnego użycia FN z NumP
Na ulicę bawiąc się piłką1 wyszła mała dziewczynka. Piłka1 potoczyła się pod stopy
jakiegoś przechodnia.
Dwóch / kilku profesorów1 sprawdziło prace. Profesorowie1 opuścili pokój.
*Dwóch/kilku profesorów1 sprawdziło prace. Dwóch/ kilku profesorów1 opuściło pokój.
•
Reguły
PS f2) FN[...,Var=w, ...]+ AL(N)+FN → NumNP[...,QLifted= –,...,Var=w]+N+FN
PS f3) FN[...,Var=w, ...]+h1([Θ( {{〈h1,AL〉}},FN)]N)
+{ f: ∃fD∈{{〈h1,AL〉}, {〈h1,RWL〉}, {〈h1,RSL〉}}.∃fN∈FN.(f=fD •(Θ(fD , fN)°fN) } →
NumNP[...,QLifted= +,...,Var=w]+N+FN
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Brak NumP we FN
• Modyfikatory kwantyfikacji
– aktywowane morfologiczną liczbą
h1
d
QLSG:=λN.
N
exstsg
QLPL:=λN.
N
exstpl
+{ {〈 h1, c 〉}, {〈 h1, n 〉}, {〈 h1, d 〉} }
PS nn2) NumNP[..., QLifted= +, NClass=C0, Var=d ] + QLSG(N)+FN →
NKer’[..., GNum= mos-poj / mzw-poj /..., VarAgr= -]+N+FN
PS nn3) NumNP[...,QLifted= +, NClass=C0, Var=h1 ]
+ QLPL([Θ( {{〈h1,c〉}}, FN)]N)
+{ f: ∃fL∈{{〈h1,c〉}, {〈h1,n〉}, {〈h1,d〉}}.∃fN∈FN.(f=fL •(Θ(fL , fN)°fN) } →
NKer’[Case=α, GNum= mos-mno / mzw-mno /..., VarAgr= -]+N+FN
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Przykład zastosowania
modyfikatorów
mężczyźni
FN (PS f3)
NumNP (PS nn3)
(
h1 λN.
N
h2
exstpl
( mężczyzna ))
NKer’ (PS k2)
NKer (PS k1)
N (LI 8a)
mężczyźni
+{{〈h1,AL〉,〈h2,c〉}, {〈h1,RWL〉,〈h2,c〉},
{〈h1,RSL〉,〈h2,c〉}, {〈h1,AL〉,〈h2,n〉}, ...}
||exstsg|| := λX.λY.[(X∩Y) ≠ ∅ ∧ Y⊆X ]
||exstpl|| := λX.λY.[| X∩Y | ≥ 2 ∧ Y⊆X ]
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Zaproponowana struktura
reprezentacji semantycznej FN
• Proponowana reprezentacja semantyczna FN
to trójka:
– aktywacja znacznika, opcjonalny operator
referencji+modyfikator presupozycji, predykat
reprezentujący aspekt deskryptywny
– zmodyfikowany kwantyfikator = rodzina zbiorów
kolekcji
– reprezentacja wpływu referencyjności na relacje
zależnościowe (tzw. ogranicznik)
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Przykład niedospecyfikowanej
reprezentacji znaczenia zdania
Trzech mężczyzn przeniosło dwa stoły.
przenieśli
h5 h1
mężczyzna three
h2
+{{〈h1,d〉, 〈h2,d〉, 〈 h3, 〈’<’, ‘>’〉 〉, 〈h4,d〉, 〈h5,d〉},
{〈h1,d〉, 〈h2,d〉, 〈 h3, 〈’>’, ‘<’〉 〉, 〈h4,d〉, 〈h5,d〉},
h4
{〈h1,d〉, 〈h2,d〉, 〈 h3, 〈’<’, ‘<’〉 〉, 〈h4,d〉, 〈h5,d〉},
two stół
...}
h3
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Składanie (zmodyfikowanych)
proto-kwantyfikatorów
D1(thirty)
..
.
CNd( D1(thirty), D1(three) )
30
..
.
..
.
D1(three)
..
.
..
.
CNd:= λQ1.λQ2.λX.λZ.∃Y1.∃Y2.( Q1(X)(Y1) ∧ Q2(X)(Y2) ∧ UY1∩UY2=∅ ∧ Y1∪Y2=Z)
CNM:= λL1.λL2.λN.〈 (L2(N))1, CNd( (L1(N))2, (L2(N))2 ), (L2(N))3〉
CNc:=λQ1.λQ2.λX.λZ.∃Y1.∃Y2.( Q1(X)(Y1) ∧ Q2(X)(Y2) ∧ UY1∩UY2=∅
∧ Z(U(Y1∪Y2)) ∧|Z|=1)
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
33
Reprezentacja
liczebników złożonych
PS n3) NumTenP[Case=α, GNum=η, NClass=β, Var=w]
+CNM([Θ(Fcnm,F1)]L1)( [Θ3(Fcnm,F1,F2)]L2)
+{ f: ∃fC∈Fcnm.∃f1∈F1.∃f2∈F2.(f=( fC•(Θ(fC,f1)°f1)•(Θ3(fC,f1, f2)°f2) )
∧ [f]([Θ(fC,f1)]u) = [f]([(Θ3(fC,f1, f2)°f2]w)
∧ (([f]h1= CNc ∧ [f]([Θ(fC,f1)]u) =c)
∨ ([f]h1= CNn ∧ [f]([Θ(fC,f1)]u) =n)
∨ ([f]h1= CNd ∧ [f]([Θ(fC,f1)]u) =d))} →
NumTen[Case=α, GNum=η, NClass=β, Var=u]+L1+F1
NumOne[Case=α, GNum=η, NClass=µ, Var=w]+L2+F2
{∃f1∈F1.∃f2∈F2.([f1]u=[f2]w}
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Koncepcja wykorzystania SLS
w implementacji
•
•
System dialogu z użytkownikiem w języku polskim (ang.
Question and Answering)
Dwie drogi:
– ‘klasyczna’ – realizacja implementacji w Prologu
– poszukiwanie efektywnych metod przetwarzania
•
Etapy przetwarzania:
wstępna segmentacja tekstu, analiza morfologiczna, parsing składniowy,
konstrukcja reprezentacji semantycznej, interpretacja reprezentacji
semantycznej (analiza pragmatyczna)
•
•
Implementacja mechanizmu niedospecyfikowania
Reprezentacja stanu:
– znaczniki dyskursu jako zmienne Prologu
– stan jako lista list (wykorzystanie meta-predykatów)
•
Obsługa zapytań poprzez określenie możliwych wartości
znaczników aktywowanych w formułach dynamicznych
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Ograniczenia i dalsze prace
•
•
•
Rozszerzenie opisu na inne rodzaje anafory np. anaforę do
własności
Rozszerzenie zakresu opisu na FN, których denotacją są masy
lub substancje
Szczegółowa analiza związku pomiędzy linearną pozycją FN w
zdaniu a jej znaczeniem
– wprowadzenie mechanizmu selektywnej eliminacji nadmiarowych
wypełnień
•
•
•
•
Bardziej szczegółowy opis frazy czasownikowej i anafory
wewnątrzzdaniowej
Integracja reprezentacji semantycznej z mechanizmami
reprezentacji wiedzy
Opracowanie systemu wnioskowania dla SLS
Konstrukcja efektywnych algorytmów przetwarzania i
wnioskowania
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Sentences, States, Links and
Discourse
• Sequential merging:
– the output state becomes the input state
• Dynamic formulae representing sentences are linked
by self-organised links
activated DRs
link
…
…
proto-quantifiers
…
the most recently
activated DR
assignments
structures of relations
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Examples:
Reference and Accessibility (1)
[The man who smiles]12 does not hate Bill3. He1
respects Bill3.
respect
hate
man
1
smile
d
not
person
exstsg
d
d
exstsg
d
d
d
d
exstsg
named_Billl
1
person
d
d
existsg
1..n
1
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
d
existsg
named_Billl
1
Examples:
Reference and Accessibility (2)
[The man who smiles]12 does not hate Bill3. He1
respects Bill3.
see
d
I
d
see
d
d
d
exstsg
exstsg
man
d
d
exstsg
exstsg
I
d
initial context
named_Bill
respect
hate
man
1
smile
d
not
person
exstsg
d
d
exstsg
d
d
d
d
exstsg
named_Bill
1
person
d
d
exstsg
1..n
1
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
d
exstsg
named_Bill
1
Znaczenie i jego opis formalny
• Brak jednej, powszechnie akceptowanej
koncepcji znaczenia [Encyklopedia JO]
– znaczenie jako relacja dwuargumentowa:
x znaczy y
• Języki reprezentacji znaczenia
– języki formalne o precyzyjnie określonej
semantyce
translacja
wyrażenie
języka
naturalnego
interpretacja
wyrażenie
JRZ
warunki prawdziwości
/ zmiana w kontekście
model
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Kompozycyjna reprezentacja
znaczenia
• Zasada kompozycyjności (Frege, Montague)
wyrażenia składowe
znaczenia wyrażeń składowych
reguła (funkcja)
składniowa
funkcja
semantyczna
wyrażenie złożone
znaczenie wyrażenie złożone
– wprowadzona do logiki przez Fregego,
– zastosowana konsekwentnie w lingwistyce
informatycznej przez Montague
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Język reprezentacji znaczenia –
rozwiązanie najprostsze
• Logika predykatów pierwszego rzędu (LP)
– zalety:
• prostota, dobrze poznane własności, łatwa
implementacja
– ograniczenia
• kwantyfikacja (mnogość) – np. większość mężczyzn
• anafora [Encyklopedia JO]
„zjawisko składniowe – relacja, która wiąże ze sobą 2
wyrażenia : anaforyzowane i anaforyczne [...] Wyrażenie
anaforyczne, które nie ma własnego sensu, stanowi
swoisty odsyłacz do wcześniej użytego wyrażenia
anaforyzowanego, zwanego poprzednikiem
(antecedensem) relacji anaforycznej, z którego odczytać
można komunikowany sens.”
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
LP – problemy z anaforą
• Ośle zdania
– If Pedro1 owns a donkey2 he1 beats it2.
– ∃x[(donkey(x)∧own(pedro,x))→like(pedro,x)]
– ∀x[(donkey(x)∧own(pedro,x))→beat(pedro,x)]
• Wpływ negacji na anaforę
– A man1 is walking in the park. He1 is whistling.
– *It is not the case that every man1 is not walking in
the park. He1 is enjoying himself1.
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Dynamiczna koncepcja
znaczenia na przykładzie DRT
• Discourse Representation Theory (DRT)
• Discourse Representation Structures (DRS)
x
man(x)
walk_in_park(x)
x,y
man(x)
walk_in_park(x)
y=x
gen(x, male)
whistle(y)
– znaczniki dyskursu
(discourse markers/
referents)
– warunki (conditions)
– znaczenie = zmiana w kontekście interpretacji
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
Problemy kompozycyjnych wersji
DRT
• Cechy wspólne:
– rachunek lambda z typami
– operacja sekwencyjnego łączenia DRS’ów
• Problemy z reprezentacją anafory
– większość rozwiązań zakłada uprzednią
koindeksację powiązań anaforycznych na
poziomie składniowym
– przypisanie znaczników na podstawie indeksów
• ||a1||CDRT:=λP’λP([u1|];P(u1);P’(u1))
• ||man||CDRT:=λv[|farmer{v}]
• ||him1||CDRT:=λP(P(u1))
– u1 został zwrócony przez funkcję odczytującą drzewo
struktury składniowej
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - typy
• Typy podstawowe
– e (entities) De ≠ ∅, t (truth values) Dt = {0,1}
– m (znaczników, ‘memmory’) Dm = M, gdzie:
• dowolny nieskończony zbiór z nałożonym porządkiem
liniowym <M
• element minimalny P0, ∀p∈Dm.(P0<M p ∨ P0=p)
• Konstruktory typów złożonych
– (a b), gdzie D(a b) = DbDa
– (a1•a2•...an), gdzie
=
D(a1 •a2 •...•an )
D a1 × Da 2 × ...Da n
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - typ stany
• Typ złożony s := ( m•((m•m)t)•(m(et)) )
– Stan początkowy S0 = 〈P0, ∅, {〈P0, ∅〉} 〉
znaczniki
ostatnio aktywowany
następny
…
‘pamięć’:
wartościowanie
w stanie
…
…
znaczniki
aktywowane
wcześniej
powiązania
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - komponent kontekstu (1)
• Formuły dynamiczne - termy typu ( s(st) )
• Aktywacja znacznika:
– ↓ - typu: ( s(st) )
– zwiększa zbiór aktywnych znaczników o następnik
ostatnio aktywowanego znacznika
– rozszerza niedeterministycznie funkcję
wartościująca w stanie
||↓||:= λi.λj.[ (j)1= succ((i)1) ∧ (j)2=(i)2
∀p.[p≠succ((i)1) → [(j)3(p)=(i)3(p)] ].
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - komponent kontekstu (2)
• Operator referencji
– ↑- typu: (m ((et) (s (st))))
– odnajduje pośród znaczników dostępnych
(warunek strukturalny) te, które są dopasowane
pod względem właściwości (warunek
semantyczny),
• zawieranie się pojęciowe wartości w zbiorze podanym
jako argument
– dodaje dla odnalezionych znaczników pary do listy
powiązań w danym stanie
||↑||:= λp2.λX1.λi.λj.[ (j)1=(i)1 ∧ (j)2=(i)2
∪ { 〈 p1,p2〉: P0<m p1 ∧ (i)3(p1)⊆X1} ∧ (j)3=(i)3 ∧ WNR(j) ]
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - komponent kontekstu (3)
• Pseudo-operatory
– dynamicznej: negacji, implikacji i dysjunkcji
• ‘domykają’ zbiór aktywnych znaczników
λT.not T := λi.λj.( ∃k.T(i,k) ∧ (j)1=(i)1 ∧ (j)2=(i)2
∧ ((¬∃k.[T(i,k) ∧ WKI(k)] ∧ (j)3=(i)3 ) ∨
( ∃k.[T(i,k) ∧ WKI(k)] ∧∀p.[(p<msucc((i)1) ) → (j)3(p)=∅ ])) )
λT1.λT2.( T1(i,k) ⇒ T2(k,j) ) := λi.λj.( not( T1(i,k) ; (not T2(k,j)) ) )
λT1.λT2.( T1(i,k) or T2(k,j) ) :=
λi.λj.( not( (not T1(i,k)) ; (not T2(k,j)) ) )
– operator sekwencji
T1(i,k) ; T2(k,j):= λi.λj.( ∃k.[T1(i,k) ∧ T2(k,j)] )
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS - komponent kontekstu (4)
• Presupozycja
– operatory presupozycji unikalnej i słabej
(referential indefinite, krypto-nieokreślone)
– ι, ε - modyfikatory operatora referencji - typu
( (m ((et) (s (st)))) (m ((et) (s (st)))) )
– warunek nałożony na możliwość zmiany operatory wymagają aby lista powiązań:
• ι - została rozszerzona o dokładnie jedną parę
||ι|| := λR.λp2.λX1.λi.λj.[ R(p,X1,i,j) ∧ |(j)2\(i)2|=1 ]
• ε - została rozszerzona o przynajmniej jedną parę,
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
SLS – aspekt deskryptywny
• Predykaty
– ‘rzeczownikowy’ - typu (et)
– ‘czasownikowy’ - typu ((et)i t) t), gdzie i∈Nat
,…,
,…,
,…,
• Pobranie wartości znacznika
– operator # - typu (s (m (et))),
• ||#|| := λp.λi.[ (i)3(p) ] np. #(∇(j),j) ⊆ paper
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.
,…
SLS - kwantyfikacja i mnogość
• Determinatory jako proto-kwantyfikatory
– funktory typu ((et) ((et) t))
Z=#(∇(j),j),
three(Z)
..
.
a
C 2(three)(Z)
N2(three)(Z)
..
.
..
.
kolektywna
neutralna
D1(three)(Z)
..
.
dystrybutywna
three:= λX.λY.[ |X∩Y|= 2 ∧ Y⊆X]
Kompozycyjny opis semantyki polskich fraz nominalnych w oparciu o metody semantyki dynamicznej.