w10

Transkrypt

w10
Składnia
Składnia to nauka o związkach wyrazów w zdaniu, szyku wyrazów i
roli pełnionej przez wyrazy.
Zapis składni powinien w łatwy sposób umożliwiać jej opis i
wykorzystanie w automatycznej analizie zdania.
Analiza składniowa dostarcza informacji o związkach wyrazów w
zdaniu, najczęściej w postaci drzewa.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(248 / 272)
Klasyfikacja opisów składni
Ze względu na zakres:
z szerokim pokryciem
specjalizowane
Ze względu na rodzaj opisywanych zależności:
wyodrębniające części zdania
zależnościowe
Ze względu na sposób przechowywania reguł składniowych:
zleksykalizowane
bez leksykalizacji
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(249 / 272)
Gramatyki transformacyjne
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(250 / 272)
Gramatyki transformacyjne
.
XP
spec.
X’
X
dopełnienia
X (także X0 ) – element główny (ang. head), XP (także X′′ , X, X2 ) – fraza
X („P” w angielskim pochodzi od phrase, po angielsku XP jest nazywane
maximal projection (of X), X′ (także X – intermediate projection) –
kategoria pośrednia.
Reguły:
XP → Spec. X′
X′ → X dopełnienia
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(251 / 272)
Gramatyki transformacyjne
.
CP[+q]
C′
C[+q]
IP
NP
∆
John
I′
I[+fin]
VP
V[+aux]
|
has
V′
VP[+en]
V[+en]
|
read
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
V′
NP
∆
the book
10. Metody opisu składni
(252 / 272)
Gramatyki transformacyjne
.
CP[+q]
C′
V[+aux]
|
hasi
IP
NP
∆
John
I[+fin]
|
ti
I′
VP
V[+aux]
|
ti
V′
VP[+en]
V[+en]
|
read
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
V′
NP
∆
the book
10. Metody opisu składni
(253 / 272)
Gramatyki transformacyjne
.
CP[+q]
C′
C[+q]
NP
∆
John
IP
I′
I[+fin]
VP
V[+aux]
|
has
V′
VP[+en]
V′
V[+en]
NP[+wh]
|
D[+wh]
read
|
which
N′
N
book
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(254 / 272)
Gramatyki transformacyjne
.
CP[+q]
NP[+wh]
∆
C
which booki [+q]
|
hasj
C′
NP
∆
John
IP
I[+fin]
|
tj
I′
VP
V[+aux]
|
tj
V′
VP[+en]
V[+en]
|
read
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
V′
NP[+wh]
ti
10. Metody opisu składni
(255 / 272)
Lexical-Functional Grammar
Analiza zdania w tej gramatyce opiera się na dwóch strukturach:
c-structure (z ang. constituent structure) i
f-structure (z ang. functional structure).
C-structure ma postać drzew uzyskanych z użyciem gramatyki
bezkontekstowej. Może mieć różną postać w różnych językach. F-structure
ma postać par (cecha, wartość) i reprezentuje powiązania często odległych
od siebie fragmentów zdania.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(256 / 272)
Lexical-Functional Grammar
.
S1
S(↑=↓)
NP(↑ subj =↓)
VP(↑=↓)
NNP(↑=↓)
VBZ(↑=↓)
. John( . ↑ pred =′ john′
.
. ↑ num = sg
.
. ↑ pers = 3)
. has( . ↑ pred =′ have′ )
. VP . ↑ xcomp =↓
.
. ↑ obj =↓ obj
VBN(↑=↓)
. read( . ↑ pred =′ read′
.
. ↑ tense = past)
NP(↑ obj =↓)
DT(↑ spec:det =↓)
NN(↑=↓)
. book( . ↑ pred =′ book′
.
. ↑ num = sg
the(↑ pred =′ the′ )
.
. ↑ pers = 3)
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(257 / 272)
Lexical-Functional Grammar
.
S1
wszystkie cechy dzielone z wyższym węzłem
S(↑=↓)
NP(↑ subj =↓)
VP(↑=↓)
NNP(↑=↓)
VBZ(↑=↓)
. John( . ↑ pred =′ john′
.
. ↑ num = sg
.
. ↑ pers = 3)
. has( . ↑ pred =′ have′ )
cecha pred dzielona z wyższym węzłem
. VP . ↑ xcomp =↓
.
. ↑ obj =↓ obj
VBN(↑=↓)
. read( . ↑ pred =′ read′
.
. ↑ tense = past)
NP(↑ obj =↓)
DT(↑ spec:det =↓)
NN(↑=↓)
. book( . ↑ pred =′ book′
.
. ↑ num = sg
the(↑ pred =′ the′ )
.
. ↑ pers = 3)
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(258 / 272)
Lexical-Functional Grammar
.
S1
S(↑=↓)
AUX(↑=↓)
NP(↑ subj =↓)
Has(↑ pred =′ has′ )
NNP(↑=↓)
VP(↑ xcomp =↓, ↑ obj =↓ obj)
VB(↑=↓)
′
. John( . ↑ pred = John′
.
. ↑ num = sg
.
. ↑ pers = 3)
Jan Daciuk, KISI, ETI, PG
NP(↑ obj =↓)
′
read(↑ pred = read )
Przetwarzanie języka naturalnego
DT(↑ spec:det =↓)
′
NN(↑=↓)
′
the(↑ pred = the )
. book( . ↑ pred =′ book′
.
. ↑ num = sg
.
. ↑ pers = 3)
10. Metody opisu składni
(259 / 272)
Head-Driven Phrase Structure Grammar
HPSG wywodzi się z GPSG (ang. Generalized Phrase Structure
Grammar).
Gramatyka zleksykalizowana – informacje o łączliwości słów w
słowniku.
Gramatyka unifikacyjna – poszczególne obiekty posiadają cechy, na
które można nakładać ograniczenia odwzorowujące zjawiska
zachodzące w języku.
Część ograniczeń jest zapisywana bezpośrednio za pomocą
współdzielenia cech.
Część ograniczeń wynika z ogólnych zasad, takich jak zasada elementu
głównego, zasada struktury argumentów, czy zasada walencji.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(260 / 272)
Head-Driven Phrase Structure Grammar

word

phon






















ss | lc


















⟨
⟩
dał

local













cat


















cont


 Zarówno
słowa,



 jak i zdania są

opisywane
przez



category




 struktury cech.



verb








gender
masc




1
 Współdzielenie
head




person 3rd 


 wartości

number sg
cech






 zapisywane jest za

valence


⟨ ⟩ 



 pomocą liczb w

subj

1

val





⟨
⟩
 kwadratach,

np.


2,3
comps



⟨
⟩
1
:
wartość
cechy


1 NP[nom] 4 , 2 NP[dat] 5 , 3 NP[acc] 6

arg-st
 SS|LC|CAT|HEAD




give
 jest
tożsama



giver
4



 wartością
cechy
given

6



SS|LC|CAT|VAL|SUBJ
.
5
recipient
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(261 / 272)
Tree Adjoining Grammar
Gramatyka istnieje w wielu wersjach (XTAG, LTAG, …), dla których istnieją
różne analizatory składniowe. Podstawowe cechy:
Z każdym słowem w słowniku związane jest drzewo określające
miejsce słowa w zdaniu – rolę, jaką pełni w składni.
Każde podstawowa struktura (w TAG – drzewo) posiada co najmniej
jeden symbol końcowy (słowo). Innymi słowy: TAG jest gramatyką
zleksykalizowaną.
Przy dokonywaniu analizy składniowej zdania wykonuje się dwie
operacje na drzewach:
zastępowanie (ang. substitution)
dołączanie (ang. adjunction)
Na każdą z operacji można nałożyć dodatkowe warunki za pomocą
unifikacji.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(262 / 272)
Tree Adjoining Grammar – Zastępowanie
Jeden z liści drzewa jest zastępowany poddrzewem o tej samej etykiecie.
IP.
DP
I′
I
VP
.
.
DP
DP
V
DP
John
a book
reads
W wyniku zastępowania dokonanego na liściach trzeciego drzewa
otrzymamy:
IP.
DP
I′
John I
VP
V
DP
reads a book
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(263 / 272)
Tree Adjoining Grammar – dołączanie
Podstawowe drzewa dzielimy na dwie kategorie:
1. pomocnicze: korzeń drzewa ma tę samą etykietę (kategorię) co
wyznaczony liść drzewa
.2 początkowe: wszystkie inne
Dołączanie polega na wstawieniu drzewa pomocniczego o korzeniu A z
etykietą X i wyznaczonym liściem B o tej samej etykiecie do innego drzewa
w miejsce węzła C o etykiecie X w taki sposób, że rodzic węzła C staje się
rodzicem węzła A, a dzieci węzła C stają się dziećmi węzła B.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(264 / 272)
Tree Adjoining Grammar – dołączanie
IP.
I′
DP
John I
.
VP
VP
V
reads
DP
a book
patiently VP
Po operacji dołączenia otrzymamy:
IP.
DP
I′
John
I
VP
patiently
Jan Daciuk, KISI, ETI, PG
VP
V
DP
reads
a book
Przetwarzanie języka naturalnego
10. Metody opisu składni
(265 / 272)
Link Grammar
W tej gramatyce słowa w słowniku wyposażone są w zestawy
uporządkowanych, nazwanych wiązań. Wiązania dzielą się na lewostronne
(łączą się z wiązaniami innych słów leżących w tekście na lewo od danego
słowa) i prawostronne (analogicznie). Lewo- i prawostronne wiązania
uporządkowane są pod względem odległości słów, z których wiązaniami się
łączą. Słowo może mieć kilka alternatywnych zestawów wiązań.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(266 / 272)
Link Grammar
Ciąg słów jest zdaniem rozpoznawanym przez gramatykę, jeżeli wiązania
uda się połączyć w graf spełniający następujące warunki:
planarność – wiązania nie przecinają się;
łączliwość – wiązania wystarczają do połączenia wszystkich słów
zdania;
spełnialność – połączenia spełniają wszystkie wymagania nakładane
przez wiązania słów w zdaniu.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(267 / 272)
Link Grammar
Xp
Wd
Ss
.
LEFT-WALL John.b
PP
has.v
Os
Ds
read.v the
book.n
.
book.n
.
Xp
PP
Qd
.
LEFT-WALL
Jan Daciuk, KISI, ETI, PG
Os
Ds
SIs
has.v
John.b
Przetwarzanie języka naturalnego
read.v the
10. Metody opisu składni
(268 / 272)
Link Grammar
Xp
Bsm
PP
Rw
Wq
Ds*w
.
which
book.n
LEFT-WALL
SIs
John.b
has.v
read.v
?
read.v
?
read.v
?
Xp
Pv
Ss
Ds*w
Ws
.
which
book.n
LEFT-WALL
Os
John.b
has.v
Xp
I*j
Ss
Ds*w
Ws
.
which
book.n
LEFT-WALL
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
Os
has.v
John.b
10. Metody opisu składni
(269 / 272)
Definite Clause Grammar
DCG jest rodzajem gramatyki metamorficznej. Jest ściśle związana z
konkretnym językiem programowania – prologiem. Nie oznacza to, że nie
można pisać analizatorów składniowych innych gramatyk w prologu, np.
Alpino – analizator składniowy HPSG dla języka niderlandzkiego – jest
napisany właśnie w prologu.
Jedyna do niedawna pełna gramatyka języka polskiego (napisana przez
Stanisława Szpakowicza, a rozwijana także przez Marka Świdzińskiego) jest
gramatyką DCG.
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(270 / 272)
Literatura dotycząca składni
Andrew Radford, Transformational Grammar. A First Course,
Cambridge Textbooks in Linguistics, Cambridge University Press,
1988.
Cheryl A. Black, A Step-by-Step Introduction to the Government and
Binding Theory of Syntax, Summer Institute of Linguistics, 1999.
Dostępne pod:
http:
//www.sil.org/americas/mexico/ling/E002-IntroGB.pdf
Joan Bresnan, Lexical-Functional Syntax, Blackwell, 2001.
Mary Dalrymple, Lexical Functional Grammar, San Diego: Academic
Press, 2001.
Magdalene Grantson, Lexical Functional Grammar: Analysis and
Implementation, raport techniczny, Lund University, 2002. Dostępne
pod:
http://www.cs.lth.se/EDA171/Reports/2001/magdalene.pdf
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(271 / 272)
Literatura dotycząca składni
Carl Pollard, Ivan A. Sag,Head-Driven Phrase Structure Grammars,
University of Chicago Press, 1994.
Adam Przepiórkowski, Anna Kupść, Małgorzata Marciniak, Agnieszka
Mykowiecka, Formalny opis języka polskiego. Teoria i implementacja,
Akademicka Oficyna Wydawnicza Exit, Warszawa 2002.
Stefan Müller, Head-Driven Phrase Structure Grammar. Eine
Einführung, Stauffenburg Einführungen Nr. 17, Tübingen:
Stauffenburg Verlag, 2008. Dostępne pod:
http://hpsg.fu-berlin.de/~stefan/Pub/hpsg-lehrbuch.html
Daniel Sleator, Davy Temperley, Parsing English with a Link
Grammar, Third International Workshop on Parsing Technologies,
1993. Dostępny pod:
http://www.cs.cmu.edu/afs/cs.cmu.edu/project/link/pub/
www/papers/ps/LG-IWPT93.pdf
Jan Daciuk, KISI, ETI, PG
Przetwarzanie języka naturalnego
10. Metody opisu składni
(272 / 272)

Podobne dokumenty