1 4. Formalny opis j zyka naturalnego Analiza

Transkrypt

1 4. Formalny opis j zyka naturalnego Analiza
Analiza morfologiczna
Analiza morfologiczna to przypisywanie formie słowa jego
formy podstawowej oraz zestawu warto ci cech
gramatycznych
ś
4. Formalny opis j zyka
naturalnego
(form podstawowa dla rzeczowników i przymiotników jest forma
mianownika liczby pojedynczej, dla czasowników bezokolicznik)
ą
Analiza morfologiczna.
Rozpoznawanie morfemów, np.koty -> kot +N +PL+nom
metoda: kaskada FST - wyj cie z jednego jest wej ciem do
kolejnego
ś
Struktury artybutów. Unifikacja.
pa dziernik, 2004
1
ź
pa dziernik, 2004
2
ź
Najprostsza analiza morfologiczna
ś
Prosty sł
słownik
bardzo prosty automat angielskie rzeczowniki
reg. plural
plural (-s)
q0
c
q1
a
t
s
q2
irreg-pl
g
r
ε
irreg-sg
dog (q1), dogs(q2), fox(q2), foxes (q2)
o
o
e
Kolejne kroki:
doł czenie słów (przej cia po ka dej literze)
modelowanie uogólnie (np. ko cówki regularne typu -ing)
s
e
e
ś
ą
Ŝ
ń
car, cars, cat, cats, goose, geese
?fox, foxes
ń
ź
pa dziernik, 2004
ź
3
pa dziernik, 2004
Analiza morfologiczna
Rozpoznawanie morfemów, np.
FST (Finite State Transducer)
4
FST - Tnum
koty -> kot +N +PL
przypisanie słowom tagów oznaczaj cych liczb gramtyczn
ą
(a - skrócony zapis a : a
ę
^ - granica morfemu
ą
# - granica słowa)
mapowanie mi dzy dwoma poziomami opisu
ę
leksykalny ->
powierzchniowy
ś
c
a
t
+N
c
a
t
s
q0
+PL
ź
5
+N :
irreg-pl-noun-stem
ź
pa dziernik, 2004
ε
+PL : ^s#
q7
+SG:#
q5
+SG:#
q4
+N :
q3
ś
kaskada FST - wyj cie z jednego jest wej ciem do kolejnego
pa dziernik, 2004
reg. noun stem
q1
irreg-sg-noun-stem
q2
ε
q6
+N :
+ PL : #
ε
6
1
FST - Tnum ο Tstems
Reguł
Reguły ortograficzne
ś
Analiza morfologiczna - kaskada (zło enie)
f
o
x
Ŝ
c
a
t
Dla po redniej postaci tekstu mo emy zdefiniowa reguły
implementuj ce ró ne zasady ortograficzne, np
Ŝ
ą
+N: ε
g
ć
Ŝ
– Wprowadzenie znaczników ko ca morfemu pozwala na
ń
implementacj reguł wprowadzania -e- mi dzy spółgłoski ‘z’, ‘s’ i
‘x’ a ko cówk -s
– reguła ta mo e by zaimplementowana jako kolejny transducer
ę
ń
d
o
+ PL:^s#
ę
ę
Ŝ
ć
+SG:#
+PL:#
m
u: ε
o:i
s:c
+N : ε
e
pa dziernik, 2004
7
ź
pa dziernik, 2004
Kolejny poziom analizy
FST - Tstems
reg-noun-stem | cat
q0
8
ź
@ :@ (cokolwiek)
q1
Analiza morfologiczna - (foxes)
poziom leksykalny
irreg-sg-noun-stem | goose
irreg-pl-noun-stem | g o:e o:e s e
poziom po redni
ś
foxes
poziom leksykalny
poziom po redni
ś
f
o
x
+N
f
o
x
^
poziom
powierzchniowy
+PL
s
ź
x
+N
+PL
f
o
x
^
s
f
o
x
e
s
#
ź
9
pa dziernik, 2004
10
Analizatory morfologiczne dla
polskiego
Analizatory morfologiczne
Ró nice pomi dzy analizatorami:
Ŝ
o
#
pa dziernik, 2004
f
Morfeusz, http://nlp.ipipan.waw.pl/~wolinski/morfeusz/morfeusz,
PoMor, analizator firmy MorphoLogic, W gry,
ę
analizator AMOR (IJP UW),
SAM, analizator oparty o indeks a tergo Tokarskiego (2002), dost pny
ę
–sposób analizy
–reakcja na nieznane słowa
–zestaw przyj tych znaczników morfosyntaktycznych (format
ę
zwracanych rezultatów)
ę
bezpłatnie do celów niekomercyjnych pod adresem:
http://www.mimuw.edu.pl/~kszafran/SAM-dists/, obecnie nierozwijany;
LEM, produkt firmy LEX, Pozna ; prof. Zygmunt Vetulani,
([email protected]),
XeLDA, produkt firmy XEROX: tokenizer i analizator morfologiczny; wersja
demo http://www.xrce.xerox.com/competencies/content-analysis/demos/polish
narz dzia Jana Daciuka do analizy morfologicznej dost pne bezpłatnie do celów
niekomercyjnych pod adresem: http://www.pg.gda.pl/~jandac/fsa.html
analizator firmy TiP , działaj cy m.in. w programie MsWord,
baza fleksyjna j zyka polskiego, Kraków, AGH; prof. Wiesław Lubaszewski:
http://www.icsr.agh.edu.pl/fleksbaz/,
analizator opracowany na potrzeby systemu tłumacz cego POLENG, Filip
Grali ski, [email protected].
ń
ę
–raczej nie warto budowa kolejnego przed sprawdzeniem istniej cych
ć
ą
ę
ą
ę
ą
ń
ź
pa dziernik, 2004
11
ź
pa dziernik, 2004
12
2
Anotowanie informacjami
morfoskł
morfoskładniowymi
Synteza morfologiczna
Synteza morfologiczna (proces odwrotny do analizy) to
ustalenie formy słowa na podstawie jego formy podstawowej
oraz zestawu warto ci cech gramatycznych
Przypisywanie słowom kategorii składniowej (part of
i warto ci cech morfologicznych, np.
piła: V, os3, liczba poj., r. e ski , czas przeszły
N, liczba poj.,r. e ski, mian.
ś
speech tagging)
ś
Ŝ
Ŝ
Poniewa transducery opisuj przekształcenia dwukierunkowe, ta
sama kaskada transducerów mo e słu y do analizy i do syntezy
morfologicznej.
(oczywi cie nie ka da analiza morfologiczna jest w ten sposób
zaimplementowana)
Ŝ
ą
Ŝ
Ŝ
ć
ń
ń
zastosowanie ( zamiana tekstu na mow , wyszukiwanie
informacji, analiza składniowa, tłumaczenie)
ę
Ŝ
ś
Dane: - zbiór tagów (indeksów, etykiet) tagset
– słownik zawieraj cy słowa wraz z ich tagami
ą
– tekst do analizy
ś
pa dziernik, 2004
13
ź
Znajomo celu wpływa istotnie na sposób wykonania
zadania anotowania tekstu
pa dziernik, 2004
14
ź
ć
Tagset
Tagowanie
ś
Spis wszystkich kombinacji wybranych cech gramatycznych dla
danego j zyka
Tagowanie to przypisywanie słowom w tek cie
jednoznacznych oznacze morfoskładniowych
ń
ę
– T ⊂ C1×C2×... ×Cn
Problemy:
Tagi podlegaj standardowemu prawu dystrybucji:
– wi kszo słów ma tylko jedn kategori składniow
– z pozostałej cz
wi kszo słów ma dwie kategorie …
ą
– zwykle ci g liter i cyfr:
ą
ę
system skrótów: NNS (gen. noun, plural)
system pozycyjny: pozycja i odpowiada Ci:
– AAMP3----2A---- (gen. Adj., Masc., Pl., 3rd case (dative),
comparative (2nd degree of comparison), Affirmative (no
negation))
– tense, person, variant, etc.: N/A (oznaczone ‘-’)
ć
ś
ą
ę
ś
ć
ę
ś
Oczywi cie, cz sto pojawiaj ce si słowa cz sto maj wi cej ni jeden
tag:
ę
ś
ą
ę
ę
ą
ę
Ŝ
np. lub (czasownik i spójnik), mam (czasownik i rzeczownik),
je, lecz, klej, bro
ń
! Stosunkowo łatwo przypisa tagi poszczególnym słowom, ale nie tak
łatwo przypisa tagi słowom w tek cie
ć
ć
ą
ę
ć
ś
tzn. problemem jest stwierdzenie, które z jednakowo wygl daj cych słów
zostało u yte w danym miejscu tekstu.
najbardziej znane: Brown, Penn, Multext[-East], ...
ą
ą
Ŝ
ź
pa dziernik, 2004
ź
15
pa dziernik, 2004
Tagowanie reguł
regułowe
16
Tagowanie reguł
regułowe dla polskiego
ś
1. R cznie opracowane reguły okre lania tagów:
Adverbial-that rule
(That is white,I consider that bad. vs. It isn’t that bad.)
dane wej ciowe: "that" + wszystkie mo liwe jego tagi
if (+1 A/ADV/QUANT); /* if next word is adj, adverb, or quantier */
(+2 SENT-LIM);
/* and following which is a sentence boundary, */
(NOT -1 SVOC/A);
/* and the previous word is not a verb like */
ę
1.
2.
ś
Ŝ
Tager stworzony na potrzeby korpusu PWN
Przykładowe reguły:
zasada:
czasownik w liczbie pojedynczej nie wyst puje z podmiotami w
liczbie mnogiej,
Implementacja:
w kontek cie ograniczonym przez spójniki lub znaki
interpunkcyjne nie mo e jednocze nie wyst pi czasownik w
liczbie pojedynczej i rzeczownik w mianowniku liczby mnogiej,
ę
ś
/* `consider' which allows adjs as object complements*/
ś
then eliminate non-ADV tags
else eliminate ADV tag
ś
osi gana skuteczno
ą
ć
Ŝ
to od 91 do 97%
ź
2. wykorzystanie metod statystycznych (dokładny opis pó niej)
ź
pa dziernik, 2004
ą
ć
czasownik w liczbie mnogiej nie wyst puje z podmiotami w
liczbie pojedynczej, chyba e s to podmioty szeregowe,
2004przed form miejscownika wyst puje albo inny18
blisko
dopa dziernik,
miejscownik albo jeden z przyimków \emph{na, po, w, przy, o}.
ę
Ŝ
ą
ś
17
ź
ć
ą
ę
3
Alternatywne podej cia
Gramatyki unifikacyjne (UG).
dopuszczenie innych metod powstawania fraz ni tylko
konkatenacja,
uwzgl dnienie innych powi za syntaktycznych ni tylko
struktura frazowa (nawet przy zachowaniu konkatenacji
jako jedynej operacji),
zawarcie informacji bezpo rednio w opisach słów (w
słowniku) - leksykalizm,
rezygnacja z atomowych zmiennych lub w ogóle z reguł
CFG,
uwzgl dnienie semantyki.
Zapis własności języka naturalnego w gramatykach
unifikacyjnych.
Ŝ
ę
ą
ń
Ŝ
ś
Literatura dodatkowa: Shieber, S. M. An Introduction to
Unification-Based Approaches to Grammar, CSLI Stanford, 1986
pa dziernik, 2004
19
ź
ę
pa dziernik, 2004
Atrybuty i struktury atrybutó
atrybutów
(AVM)
Rozszerzenie formalizmu CFG
Motywacja: doł czenie uzgodnie (np. liczba, osoba, rodzaj).
Metoda: rozszerzenie CFG o mechanizmy oparte o struktury
atrybutów - wzbogacenie symboli terminalnych i
nieterminalnych o zestawy cech.
ą
20
ź
ń
Struktury atrybutów (Attribute-value matrices (AVMs)) to
zbiór par cecha - warto takich, e:
ś
ć
Ŝ
atrybuty s symbolami atomowymi
warto ci atrybutów s albo atomami albo innymi
strukturami atrybutów
ą
ś
ą
ś
Własno ci metody:
feature-1 value-1
feature-2 value-2
...
feature-n value-n
– odpowiednia do opisu wielu zjawisk w j zyku naturalnym, nawet
ę
tak skomplikowanych jak zale no ci nielokalne.
– Zachowuje podstawow struktur frazow opisywan przez CFG
Ŝ
ą
ś
ę
ą
ą
ź
pa dziernik, 2004
ź
21
pa dziernik, 2004
Struktury atrybutó
atrybutów jako grafy
Przykł
Przykłady
liczba poj.
number sg
liczba poj.
osoba trzecia
fraza rzecz.
liczba poj.
osoba trzecia
22
(zorientowane, acykliczne)
cat np
agreement number sg
number sg
person 3
person 3
CAT
cat
np
number sg
person 3
NP
NUMBER
SG
cat np
agreement
⇐ Tego nie osi gniemy
ą
number sg
person 3
ju za pomoc atrybutów
bez struktury wewn trznej
Ŝ
3
ą
ę
AGREEMENT
PERSON
ź
pa dziernik, 2004
23
ź
pa dziernik, 2004
24
4
Zmienne
Wspó
Wspólne podstruktury
W ramach jednej struktury atrybuty mog „podziela ” warto ci.
Oznacza to, e ich warto ci s dokładnie te same struktury.
ą
rodzaje notacji:
Ŝ
num X([ ])
pers 1st
num 1
pers 1st
ś
ą
ć
ś
ą
cat s
head agreement 1
num X
pers 1st
number sg
person 3rd
[ agreement 1 ]
subject
ś
podzielanie warto ci (value sharing, reentrancy):
CAT
f X(a)
g X(a)
S
f 1 a
g 1
AGREEMENT
NUMBER
SG
!
HEAD
SUBJECT
pa dziernik, 2004
25
ź
cie ki
Struktura atrybutów to obiekt syntaktyczny składaj cy si ze
sko czonego (mo e by pusty) zbioru par nazwa atrybutu-warto .
Atrybuty nale do sko czonego, okre lonego z góry dla ka dej
gramatyki zbioru cech.
Warto ci atrybutów pochodz z danego, sko czonego zbioru atomów
lub s tak e strukturami atrybutów.
Struktura atrybutów mo e mie przypisana zmienn
dwa wyst pienia tej samej zmiennej w ramach jednej struktury
oznaczaj t sam warto
Zbiory nazw atrybutów oraz warto ci atomowych tworz sygnatur
danej gramatyki.
ą
ń
number sg
person 3rd
[ agreement 1 ]
Ŝ
Ŝ
zapis cie ki:
head | agreement | number lub <head, agreement, number>
head | subject | agreement | number
Ŝ
ś
ś
ń
ą
ć
Ŝ
ś
ń
Ŝ
Ŝ
ć
ą
ą
ą
ą
ą
ą
ś
ć
ą
ś
ę
val(A,cat) = s
val(A, head|subject |agreement|number) = sg
ź
pa dziernik, 2004
27
Poprawno
ę
ć
ś
ą
ś
warto ci:
26
AVM - charakterystyka
A= cat s
head agreement 1
subject
3rd
PERSON
AGREEMENT
pa dziernik, 2004
ź
ź
pa dziernik, 2004
AVM
Warto ci atrybutó
atrybutów ( cie ek)
Struktura atrybutów jest poprawna (well-formed), je eli
wszystkie wyst pienia tych samych zmiennych zwi zane s z
tymi samymi warto ciami.
Ŝ
ą
28
ą
ś
val(A, Fi) -- warto
ć
atrybutu Fi w strukturze A
ą
ś
well-formed
f X(a)
czyli
g [ h X(a) ]
not well-formed
f
g
not well-formed
f X ([H a])
g X ([H b])
ź
pa dziernik, 2004
f 1 a
g [h 1
A=[f X] B= [f Y]
]
val(A, f) = val(B, f) = [ ]
C=
1 [h a ]
1 b
f X
g X(a)
val(C, f) = a
29
ź
pa dziernik, 2004
D=
f Y
g X(a)
val(D, f) = [ ]
30
5
Pochł
Pochłanianie (subsumption
(subsumption,, ⊆)
Warto ci atrybutó
atrybutów a uto samianie
A1 =
f1 [ g a ]
f2 [ g a ]
A2 = f1 1 [ g a ]
f2 1
Informacje reprezentowane przez ró ne struktury atrybutów mog
by porównywane. Relacj wyznaczaj ca porz dek cz ciowy
struktur atrybutów jest pochłanianie.
Ŝ
ć
val( A1, f1 ) = val( A1, f2 ) = val( A2, f1 ) = val( A2, f2 ) = [g a ]
ę
Załó my, e do AVM b d cej warto ci f1 w A1 i A2 dodana
jest cecha h o warto ci b:
Ŝ
Ŝ
ę
ą
g a
h b
f2 g a
A2’ = f1
1
ą
ę
ą
ę
ą
ś
A1’ = f1
ą
ą
ś
Niech A i B b d strukturami atrybutów opartymi o t sam
sygnatur . Mówimy, e A pochłania B (A jest bardziej ogólne ni B, B
jest bardziej specyficzne ni A, A ⊆ B ) je eli:
ś
ą
ę
ą
Ŝ
Ŝ
Ŝ
Ŝ
1. Je li A jest atomem, to B jest identycznym atomem.
2. Dla ka dego atrybutu F, je eli F okre lone jest w A (F∈
∈dom(A)), to F
okre lone jest w B (F ∈ dom(B)) i warto F w A pochłania warto F
w B (val(A,F) ⊆ val(B, F))
3. Je eli dwie cie ki w A s uto samione, to te same cie ki uto samione
s w B.
g a
h b
ś
Ŝ
f2 1
Ŝ
ś
ś
teraz
val( A1’, f1 ) = val( A2’, f1 ) = val( A2’, f2 ) ≠ val( A1’, f2 )
ś
Ŝ
Ŝ
ś
ą
ć
ś
Ŝ
ś
Ŝ
ć
Ŝ
ą
pa dziernik, 2004
31
ź
pa dziernik, 2004
Pochł
Pochłanianie
Pochł
Pochłanianie, wł
własno ci
Pusta struktura [ ] jest struktur najbardziej ogóln (nie
reprezentuje adnej informacji), pochłaniaj ca wszystkie
inne struktury (tak e atomowe).
[ ] ⊆ [ num poj ]
[ num X ] ⊆ [ num poj ]
(X to skrót notacyjny X [ ])
ą
Ŝ
32
ź
ą
ś
Relacja pochłaniania wyznacza porz dek cz ciowy.
ą
ę
ą
Ŝ
Wi cej informacji -> bardziej specyficzna struktura
num poj
⊆
num poj
pers 3
Uto samienie warto ci to te dodanie informacji
num1 poj ⊆
num1 1 poj
num2 poj
num2 1
Nie ka de dwie struktury s w tej relacji:
Ŝ
ró ne warto ci tego samego atrybutu
[ num sg ] ⊇ [ num pl ]
⊆
ró ne zbiory atrybutów
[ num sg ] ⊇ [ pers third ]
⊆
ę
ś
Ŝ
Ŝ
ź
pa dziernik, 2004
ą
ś
Ŝ
Ŝ
ź
33
pa dziernik, 2004
34
Pochł
Pochłanianie, wł
własno ci, cd.
cd.
Operacje na AVM
Co mo emy chcie zrobi ze strukturami atrybutów ?
Ŝ
ć
ć
– sprawdzi kompatybilno
ć
Element najmniejszy: struktura pusta pochłania ka d
inn :
∀A, [ ] ⊆ A
Ŝ
ś
ć
(niesprzeczno
ś
ć
dwóch struktur)
– poł czy informacje zawarte w dwóch strukturach
ą
ą
ć
⇓
ą
Zwrotno : ∀ A, A ⊆ A
Przechodnio : je eli A ⊆ B i B ⊆ C to A ⊆ C.
unifikacja
ś
ć
ś
ć
– znale
Ŝ
ź
ć
struktur ogólniejsz od danych dwóch struktur
ę
ą
⇓
generalizacja
ź
pa dziernik, 2004
35
ź
pa dziernik, 2004
36
6
Unifikacja,
Unifikacja, proste przykł
przykłady
Unifikacja, , to operacja ł czenia informacji zawartych w
dwóch strukturach atrybutów.
Wynikiem B C jest najbardziej ogólna struktura, która jest
bardziej specyficzna ni B i C, o ile taka istnieje.
A = B C wtw. gdy A najbardziej ogólna struktura tak , e
B ⊆ A i C ⊆ A.
ą
Dwie struktury s unifikowalne, je eli składaj si z
kompatybilnych opisów atrybutów:
ą
Ŝ
ą
ę
Ŝ
ą
[ liczba sg]
[ liczba sg]
[ liczba sg]
unifikacja ł
[ liczba sg]
Je eli wynik unifikacji istnieje, to mówimy, e dwie struktury
s unifikowalne b d zgodne.
Ŝ
Ŝ
ą
ą
ź
Je eli wynik unifikacji nie istnieje, mówimy e dwie struktury
s sprzeczne i oznaczamy to przez
W terminach porz dku wyznaczonego przez pochłanianie
wynik unifikacji to najmniejsze górne ograniczenie (lub)
Ŝ
[ liczba sg] =
[ liczba sg ]
Ŝ
Niepowodzenie!
[ liczba mnoga] =
[ liczba [] ] = [ liczba sg ]
czy ró ne atrybuty:
[osoba 3rd] =
liczba sg
osoba 3rd
ą
Ŝ
Ŝ
ą
ą
argumentów.
pa dziernik, 2004
37
ź
pa dziernik, 2004
Unifikacja, przykł
przykłady
Unifikacja, przykł
przykłady
Struktura pusta jest elementem neutralnym unifikacji:
[ agr [num sg]]
[]
38
ź
Uto samienie:
Ŝ
f [num sg ]
g [pers third]
= [ agr [num sg]]
f
g
1
1
=
unifikacja „wchłania” struktury bardziej ogólne:
f
1
g
1
num sg
pers third
ś
[ num sg ]
num sg
pers third
=
Zmienne, po cz ciowym ukonkretnieniu, nie gin :
num sg
pers third
ę
[f X]
ą
[ f a ] = [ f X(a) ]
...i mog by wykorzystane do dalszych uto samie :
ą
ć
[f X]
ź
pa dziernik, 2004
Ŝ
[g X] = f X(a)
g X
ź
39
pa dziernik, 2004
40
Unifikacja, przykł
przykłady
Własno ci unifikacji
[ g X ] = [f X(a)]
[f a]
ń
warto ci równe
idempotencja:
A
A=A
A
B=B
ś
f [ num sg ]
g [num sg ]
ś
[f [ pers third ]] = f
num sg
pers third
g [ num sg ]
... warto ci uot samione
ś
Ŝ
f 1 [ num sg ]
g 1
[f [ pers third ]] = f 1
przemienno :
ł czno :
A (B
absorpcja
If A ⊆ B then A B = B
monotoniczno :
If A ⊆ B then for every C, A
ć
ś
ą
ć
A
C) = (A B)
C
ś
ć
num sg
pers third
C⊆B
C
(uniikacja A z C pochłania wynik unifikacji B z C)
g 1
ź
pa dziernik, 2004
41
ź
pa dziernik, 2004
42
7
Generalizacja,
Generalizacja, wł
własno ci
ś
Generalizacja (anty-unifikacja) to odwrotno
Wynikiem generalizacji jest najbardziej specyficzna
(najmniej ogólna) struktura atrybutów, która jest bardziej
ogólna od obu argumentów
ć
unifikacji.
W treminach porz dku wyznaczonego przez relacj
pochłaniania wynikiem generalizacji jest najwi ksze dolne
ograniczenie (greatest lower bound, glb) dwóch struktur
atrybutów. Inaczej ni w przypadku unifikacji generalizacja
nigdy nie “zawodzi”.
ą
ę
Generalizacja redukuje informacje
[num sg ]
[pers third ]
=[]
ró ne atomy nie daj si poł czy :
[ num sg ]
[ num pl ]
=[]
pusta struktura jest zerem operacji
uto samienie mo e zosta utracone
Ŝ
ą
ę
ą
[agr [num sg ]]
ę
Ŝ
ć
[]=[]
Ŝ
ć
Ŝ
pa dziernik, 2004
f [ num sg ]
g [ num sg ]
43
ź
f
g
1 [ num sg ] = f [num sg]
1
g [num sg]
pa dziernik, 2004
44
ź
„Utypowione”
Utypowione” struktury atrybutó
atrybutów
„Utypowione”
Utypowione” struktury atrybutó
atrybutów
Strukturom atrybutów mo na przypisa typ. Typy mog tworzy
hierarchi (wielohierarchi ). Definicja typu to nazwa oraz lista
atrybutów i typów ich warto ci. Obiekty nale ce do podtypu
dziedzicz definicje atrybutów od wszystkich swoich nadtypów.
Ŝ
ę
ć
ą
ć
ę
ś
Ŝ
ą
ą
3sgmas-agr
top
a
Atr1
a [Atr1 b]
a1 [Atr2 c]
b
a2
b1
a
Atr2 c
b
NUMBER sg
PERSON 3rd
GENDER masc
AGR
c
a1
Atr1 b1
Atr2 c
b2
3sgmas-agr
b
Atr1 a1
AGR
3sgmas
NUMBER sg
PERSON 3rd
GENDER masc
3sgmas
dwie konwencje zapisywania nazw typów, my b dziemy
zapisywa „na górze” struktury
ę
kolor niebieski – nazwy typów, kolor zielony – nazwy atrybutów
ć
ź
pa dziernik, 2004
45
ź
pa dziernik, 2004
46
Hierarchia typó
typów
Dziedziczenie
ą
ć
ę
Obiekty nale ce do podtypu dziedzicz definicje atrybutów
od wszystkich swoich nadtypów.
Typy mog tworzy hierarchi (wielohierarchi ).
Ŝ
ę
nom ≤nom-gen ≤ case-type
ą
ą
verb
case-type
verb1 sg verb2sg verb3sg
gen-dat
acc-dat
nom-gen
nom-acc
dat
gen
acc
nom
... verb3pl
verb_npacc verb_acc_dat ...
verb3sg_npacc
ź
pa dziernik, 2004
47
ź
pa dziernik, 2004
48
8
Unifikacja utypowionych struktur
atrybutó
atrybutów
Dziedziczenie
verb
verb3sg
Dwie struktury atrybutów f1 i f2 o typach t1 i t2 unifikuj
si je eli:
ę
agr person person
number number
gender gender
agr person 3
number sg
gender gender
a) f1 i f2 unifikuj si
b) okre lone jest najmniejsze górne ograniczenie dla typów t1 i t2
(zbiory obiektów opisywanych przez t1 i t2 nie s rozł czne)
ą
verb3sg_npacc
subcat < noun
>
case acc
ą
widzi
nom-acc
CASE cval
person 3
number sg
gender gender
subcat < noun
>
case acc
OBL −
49
ź
ą
Przykład:
agr
pa dziernik, 2004
ę
ś
verb_npacc
ą
Ŝ
nom-gen
CASE cval
= nom
CASE cval
OBL {+, −}
OBL −
pa dziernik, 2004
50
ź
Unifikacja utypowionych AVM, cd
Unifikacja utypowionych struktur mo e wi c zawie ,
nawet je eli same opisy s unifikowalne:
Ŝ
Ŝ
ę
ś
ć
ą
nom
CASE cval
OBL -
dat
CASE cval
OBL -
=
Przykład: je eli zdefiniujemy rzeczowniki i przymiotniki w
sposób nast puj cy:
noun
adj
CASE cval
CASE cval
NUMBER nval
NUMBER nval
GENDER gval
GENDER gval
Ŝ
ę
ą
Dzi kuj za uwag .
ę
ę
ę
powy sze opisy nigdy si nie uzgodni (zunifikuj ).
Ŝ
ź
pa dziernik, 2004
ę
ą
ą
51
ź
pa dziernik, 2004
52
9

Podobne dokumenty