1 In ynieria lingwistyczna 2. Formalny opis j zyków

Transkrypt

1 In ynieria lingwistyczna 2. Formalny opis j zyków
In ynieria lingwistyczna
2. Formalny opis j zykó
zyków
naturalnych.
Agnieszka Mykowiecka
Instytut Podstaw Informatyki, PAN
[email protected]
Gramatyki formalne.
Składnia. Morfologia.
materiały z wykładów na stronie:
http:\\www.ipipan.waw.pl\~agn\inl.htm
ź
pa dziernik, 2005
1
pa dziernik, 2005
2
ź
Tokenizacja
Tokenizacja
Najcz ciej wyró niane typy elementów tekstu, czyli klasy
tokenowe to:
ci g małych liter poprzedzonych wielk liter , np. Kraków,
ci g składaj cy si tylko z wielkich liter, np. PZU,
ci g małych liter, np. dom
ci g liter małych i wielkich, np. PeKaO
ci g cyfr,
ci g cyfr z wewn trzn kropk lub przecinkiem,
data,
znak interpunkcyjny,
tokeny charakterystyczne dla okre lonych zastosowa , np. tag
j zyka HTML, adress e-mail, adres strony www.
Ŝ
pierwszym zadaniem jest stwierdzenie z jakimi słowami (i
innymi elementami tekstu) mamy do czynienia.
ę
ś
ą
20.10.2001 Jerzy K. wrócił do Jeleniej Góry.
Mógłby po prostu zadzwoni .
ą
ą
ś
ć
ą
ą
ę
ą
ą
Zadanie tokenizatora:
– identyfikacja podstawowych elementów tekstu
– ew. podział na zdania
ą
ą
ę
ą
ą
ś
ń
ę
pa dziernik, 2005
3
ź
pa dziernik, 2005
4
ź
Słowotwó
owotwórstwo
Morfologia - opis sł
słów
Wiele słów pochodzi od innych, mo na by zatem nie
umieszcza ich w słownikach, ale reguły słowotwórcze nie s
wcale takie regularne:
Ŝ
Morfologia - nauka o budowie słów z morfemów:
ć
– temat (stem) - no nik znaczenia
ś
– przed- i przyrostki (affixes) - no niki cech gramatycznych lub
ą
ś
zmiany znaczenia
fleksja (inflectional morphology)
uzyskiwanie form o znaczeniu tematu mog cych pełni
okre lone funkcje gramatyczne
słowotwórstwo (derivational morphology)
np. zebra -> zebranie
ą
ć
A writer is someone that writes, and a stinger is something
that stings. But finger don’t fing and ... haberdashers don’t
haberdash.
Richard Lederer, Crazy English
Pisarz to kto kto pisze, k liwa uwaga k sa, ale palec nie
palcuje, ...
ś
ą
ś
ą
ś
pali - palacz , czyta - czytacz
ć
ć
ć
chodzi - chodzenie - chód, biega - bieganie
czeka - czekanie - czek (?!)
ć
ć
- bieg
ć
pa dziernik, 2005
ź
5
pa dziernik, 2005 nie b dziemy si zajmowa
Słowotwórstwem
ź
ę
ę
ć
6
1
Skł
Składniki wyra e j zyka
naturalnego - słowa
Analiza morfologiczna
Analiza morfologiczna to przypisywanie formie słowa jego
formy podstawowej oraz zestawu warto ci cech
gramatycznych
typy słów
– słowa funkcyjne: i, e ...
– słowa „leksykalne”: ko , szuka ...
– idiomy: ciemno cho oko wykol, drze koty
ś
Ŝ
ń
ć
ć
(form podstawowa dla rzeczowników i przymiotników jest forma
mianownika liczby pojedynczej, dla czasowników bezokolicznik)
ć
frazy o znaczeniu nie b d cym funkcj znacze składników:
ą
ą
ę
ń
ą
Rozpoznawanie morfemów, np.koty -> kot +N +PL+nom
metoda: kaskada FST - wyj cie z jednego jest wej ciem do
kolejnego
ś
biały kruk, skrzynia biegów
powi zania z innymi słowami
ą
szukać czego?
ś
ksiąŜka o czym? z czego?
słownik: zbiór informacji o słowach i charakterystycznych dla
nich zwi zkach z innymi słowami
ą
Do tematu analizy morfologicznej jeszcze wrócimy
pa dziernik, 2005
7
ź
pa dziernik, 2005
8
ź
Cechy sł
słów - kategoria skł
składniowa
Cechy gramatyczne sł
słów
Słowa mog mie wiele form ró ni cych si warto ciami
cech gramatycznych:
Ŝ
Słowa nale ce do danego j zyka naturalnego dziel si na wiele (ok.
Ŝ
ą
ę
ą
ę
kilkunastu) kategorii składniowych. Słowa z tej samej kategorii mog
wyst powa w zdaniach w tym samym miejscu (pomijamy tu sensowno ).
ą
ę
ć
ś
ą
ć
ą
ę
ś
– czasowniki (liczba, osoba, czas) [number, person, time]
– rzeczowniki (przypadek, liczba) [case, number]
– przymiotniki (przypadek, rodzaj, liczba, stopie )
ć
Najwa niejsze kategorie składniowe to:
Ŝ
ń
ś
– czasowniki ( pi, daje, ...)
– rzeczowniki (przypadek, dom, szcz cie, ...)
Verbs
Nouns
– przymiotniki (wesoły, ...)
Adjectives
– przysłówki (wesoło, ...)
Adverbs
– przyimki (na, pod, ...)
Prepositions
Numerals
ś
ę
[case, gender, num deg]
[deg]
– przysłówki (stopie )
ń
– liczebniki (dwa, sto pi
ę
ć
, ...)
Słowa mog te mie własne (niezmienne) warto ci cech:
Ŝ
ą
ć
ś
– rzeczowniki: rodzaj
– czasowniki: tryb, aspekt
– spójniki podrz dne (który, poniewa , ...)
ę
Ŝ
– spójniki współrz dne (i, lub, oraz, ...) ...
Conjunctions
ę
pa dziernik, 2005
9
ź
Cechy gramatyczne sł
słów
pa dziernik, 2005
10
ź
Cechy gramatyczne sł
słów - rodzaj
number [liczba] singular (pojedyncza), plural (mnoga);
gender [rodzaj]
case [przypadek] nominative (mianownik), genetive (dopełniacz),
dative (celownik), accusative (biernik),
instrumental (narz dnik), locative (miejscownik),
vocative (wołacz);
ń
masc (m ski), fem ( e ski), neut (nijaki),
hum-masc (m skoosobowy) - faceci
nonhum-masc (niem skoosobowy) – psy, kobiety, stoły
Ŝ
ę
ę
ę
person [osoba ] 1st (os. 1), 2nd (os. 2), 3rd (os.3)
ę
Dodatkowo warto wprowadzi podział rodzaju m skiego na:
hum-masc
m1
(facet, lekarz)
anim-masc m2
(kot, robak)
inanim-masc m3
(stół, ołówek)
ć
degree [stopie ] positive
ń
(równy), comparative (wy szy),
Ŝ
superlative (najwy szy)
Ŝ
aspect
[aspekt ] imperfect (niedokonany), perfect (dokonany)
ę
negation [negacja] affirmative (twierdzenie), negative (zaprzeczenie)
time
[czas]
pa dziernik, 2005
ź
present
(tera niejszy), past (przeszły),
future
(przyszły)
ź
...
11
pa dziernik, 2005
ź
12
2
Skł
Składniki wyra e j zyka
naturalnego - frazy
Skł
Składnia
wiedza o sposobie łączenia słów we frazy,
a fraz w zdania
• Frazy (phrases) to spójne składniowo i semantycznie ci gi
słów/fraz (zdania, składaj ce si z fraz, tak e s frazami).
ą
Potrzeba informacji składniowych:
ą
– analiza i korekta gramatyczna,
ń
– analiza pyta do baz danych,
– generowanie wypowiedzi, tłumaczenie.
Istniej ce opisy formalne j zyka polskiego:
ą
Ŝ
ą
Frazy zbudowane s na ogół wokół jednego słowa – elementu
głównego, okre laj cego cechy frazy widoczne na zewn trz,
(te cechy to na przykład rodzaj i przypadek)
podział fraz w zale no ci od typu elementu głównego:
ą
ś
– wyszukiwanie informacji,
ę
ą
ą
Ŝ
ś
– rzeczownikowe
ę
– przymiotnikowe
ń
Szpakowicz, S.: Formalny opis składniowy zda polskich, UW, 1986
widzi ski, M.: Formalna gramatyka j zyka polskiego, UW, 1992
Przepiórkowski, A., A. Kup c, M. Marciniak, A. Mykowiecka,
Formalny opis j zyka polskiego w formalizmie HPSG, EXIT, 2000.
Ś
– przysłówkowe
ń
ę
– przyimkowe
ś
– czasownikowe
ę
pa dziernik, 2005
– liczebnikowe
13
ź
pa dziernik, 2005
Frazy rzeczownikowe, NP
14
ź
Frazy przyimkowe, PP
dom
najstarszy dom w okolicy
dom, którego dach pomalowany był na niebiesko
najwi ksza ulewa od czasu, kiedy jego dziadek, zmuszony
przez rodzin ony, przeprowadził si do tego miasteczka
w domu
z szybkim napastnikiem nale cym do dru yny przeciwnej
do punktu, z którego ju nie mógł si wycofa
Ŝ
ą
Ŝ
Ŝ
ę
ć
ę
ę
Ŝ
ę
koordynacja (frazy przyimkowe współrz dnie zło one):
– do smutku i alu lub do czarnej rozpaczy
– w góry lub nad morze
Ŝ
ę
koordynacja (frazy rzeczownikowe współrz dnie zło one):
kobieta, dziecko i pies
ani wznoszenie błagalnych okrzyków ani bicie głow w mur
Ŝ
Ŝ
ę
ą
pa dziernik, 2005
15
ź
pa dziernik, 2005
Frazy liczebnikowe, NumP
trzyna cie
dwadzie cia tysi cy czterysta trzy i pół godziny
pierwsi dwaj chłopcy
albo pi ciu albo tylko dwóch
Frazy przymiotnikowe, AdjP
biały
najbardziej zm czony z całej dru yny
wi kszy i bielszy ni przed rokiem
ś
ś
16
ź
ę
Ŝ
ę
ę
Ŝ
ę
koordynacja (frazy przymiotnikowe współrz dnie zło one):
Ŝ
ę
liczebniki porz dkowe (pierwszy, trzysta trzeci ) s zwykle
traktowane jako przymiotniki
ą
ą
zarówno pewny i gł boko prze wiadczony o swej racji i w
istocie najbardziej zaci ty z nas wszystkich, jak te zaciekle
walcz cy o swoje prawa
ę
ś
ę
Ŝ
ą
pa dziernik, 2005
ź
17
pa dziernik, 2005
ź
18
3
Frazy przysł
przysłówkowe, AdvP
szybko
szybciej ni ktokolwiek mógł przypuszcza
Frazy czasownikowe, VP
kupił obraz
wierz , e o tym nie zapomnisz
wczoraj bez adnego namawiania przewiózł fotel
samochodem z mieszkania ciotki do pracowni za 200 zł
Ŝ
ć
koordynacja (frazy przysłówkowee współrz dnie zło one):
ę
Ŝ
Ŝ
Ŝ
koordynacja (frazy czasownikowe współrz dnie zło one):
Ŝ
ę
ładniej, a tak e bardziej elegancko wczoraj lub jeszcze
dawniej
zarówno niewygodnie, jak te z cał pewno ci
ę
Ŝ
kupił u ywany samochód, naprawił go i sprzedał za
dwukrotnie wy sz cen
Ŝ
Ŝ
ą
ę
Ŝ
ą
ą
ś
pa dziernik, 2005
19
ź
pa dziernik, 2005
Podstawowe problemy
skł
składniowe
Podstawowe problemy
skł
składniowe
Uzgodnienia (~równość cech)
20
ź
Wymagania
czasownika: (typ frazy, przypadek frazy rzeczownikowej)
podmiot orzeczenie: (rodzaj, liczba, osoba)
– szukam miejsca (czego? fraza rzeczownikowa w dopełniaczu),
– Piotr idzie *id
ą
– chc spa (co? fraza czasownikowa bezokolicznikowa),
ę
ale:
– Piotr i Maria id . Idzie / id Piotr i Maria.
– Pi ciu chłopców przyszło. Dwaj chłopcy przyszli.
ą
ę
ę
Ŝ
– daj mu cukierki
ę
ę
ć
– mówi o pogodzie, mówi , e pada
ą
przyimka: (przypadek)
– w domu
rzeczownik przymiotnik: (przypadek, rodzaj, liczba)
– na dom /na domu
– białym krukiem (*kruka)
liczebnika:
– dwóch chłopców przyszło, dwaj chłopcy przyszli
– pi ciu chłopców, pi
ę
pa dziernik, 2005
21
ź
ę
ć
dziewczynek,
pa dziernik, 2005
22
ź
Kolejne problemy
Problemy skł
składniowe, cd.
cd.
Szyk (ew. „przesunięcia”)
– Do niego Jan szedł po raz drugi.
Negacja
Jan chciał kupić ksiąŜkę.
Jan nie chciał kupić ksiąŜki / *ksiąŜkę.
– I looked up his grade. I looked his grade up.
ZaleŜności odległe
– Kogo chciałabyś, aby Piotr zaprosił?
– to ten, którego musiałbyś poprosić o zgodę
Jan nikogo nie oszukał.
*Jan nikogo oszukał.
Nieciągłość fraz
– Smutny czekał go koniec.
Koordynacja (struktury współrzędne)
Elipsy (brak wymaganych słów bądź fraz)
frazy tego samego typu: koń i osioł; mały i zadziorny
– dialogi: Kogo widzisz? - Piotra [widzę].
frazy róŜnego typu:
– koordynacja róŜnego typu składników czy elipsa?
frazy „niepełne”:
pa dziernik, 2005
ź
ufnie i bez strachu
Pittsburgh prowadzi 4:0 ale Detroit [prowadzi] tylko 3:1.
złapał i ze złością odrzucił piłkę
– pro-drop (pominięcie zaimkowego podmiotu) (to dość proste do analizy)
23
[Ja] Zdałam egzamin.
pa dziernik, 2005
ź
24
4
Skł
Składnia
Analiza skł
składniowa
wiedza o sposobie łączenia słów we frazy, a fraz w zdania
rozpoznanie fraz i ich powiązań składniowych pozwala na ustalenie
wartości cech gramatycznych dla generowanego tekstu, a więc
rozstrzygnięcie wielu niejednoznaczności morfologicznych np.
Analiza składniowa: rozpoznanie fraz i ich powiązań
składniowych (zbudowanie rozbioru syntaktycznego)
mała dziewczynka dała bukiet fiołków mamie ->
[mała mod dziewczynka] podmiot
dał słonia mamie ->
[dać] 3os,cz. przeszły [słoń]dopełniacz lub biernik [mama]celownik
dać
[dać] 3os,cz. przeszły [słoń]biernik [mama]celownik
[bukiet fiołkówmod] dopełnienie
[mama] dopełnienie
pa dziernik, 2005
ź
25
pa dziernik, 2005
Reprezentacja struktury
syntaktycznej (skł
(składniowej)
Analiza skł
składniowa, problemy
26
ź
Dwa typy fraz: wymagania składniowe (mogą być opisane w
słownikach) i modyfikatory, które są praktycznie dowolne
Drzewo (w sensie teorii grafów) odzwierciedlających
zbudowane według jednej z dwóch strategii:
– Jan widzi kota.
– Mój starszy brat Jan, który od niedawna mieszka w Krakowie,
struktura frazowa (constituency structure)
idąc rano do pracy zwykle widzi czarnego kota siedzącego na
murku naprzeciwko okna kuchni sąsiada.
struktura zaleŜności funkcjonalnych (dependency structure)
– zasadnicza relacja: head (governor) - dependent
Niejednoznaczności składniowe, np.
– powiązania (krawędzie) oznaczone nazwami funkcji
pokazała siostrze Jana kwiaty
syntaktycznych (Sb, Obj, ...)
– struktura frazowa odzwierciedlona tylko pośrednio
– [pokazać] [siostra Jana]dopełnienie [kwiaty]dopełnienie
– [pokazać] [siostra]dopełnienie [Jana kwiaty]dopełnienie
pa dziernik, 2005
ź
27
pa dziernik, 2005
Drzewo struktury frazowej
Drzewo zale no ci
((DaimlerChrysler’s shares)NP (rose (three eights)NUMP (to 22)PP-NUM )VP )S
pa dziernik, 2005
ź
28
ź
29
Daimler Chrysler’s shares rose three eights to 22
pa dziernik, 2005
ź
30
5
Formalny opis j zyka
Formalny opis j zyka
1. Alfabet - dowolny zbiór symboli (T).
Słowo - skończony (takŜe pusty-εε) ciąg symboli z alfabetu
Słownik - zbiór wszystkich słów nad alfabetem T, (T*).
2. Gramatyka <V,T,S,P >
V- alfabet (skończony zbiór symboli),
T- podzbiór V (symbole terminalne), (V-T symbole nieterminalne)
S - element V-T (symbol początkowy wyróŜniony nieterminalny),
P - zbiór produkcji (reguł), czyli przyporządkowań z V* w V*
Język L to dowolny podzbiór zbioru słów T*.
Prosty przykład:
Alfabet - {Ala, ma, Asa, As, Amadeusza, kota}
Słowa: {Ala Asa ma, kota ma Asa, ma ma ma ....}
Język L1= { Ala ma kota, Ala ma Asa, Ala ma Amadeusza}
pa dziernik, 2005
31
ź
słowo w wynika bezpośrednio ze słowa v, jeŜeli istnieje reguła gramatyki R,
która zastosowana do słowa w przekształca go w v. (zapis: v -> w lub v ->R w)
słowo w wynika pośrednio ze słowa v, jeŜeli istnieje ciąg reguł gramatyki R1
... Rn, takich Ŝe v ->R1 v1 v1 ->R2 v2 ... vn-1 ->Rn vn, i vn=w ( v -> * w_
JeŜeli pierwsze słowo, od którego zaczniemy przekształcenia jest symbolem
początkowym gramatyki (v=S) to ciąg reguł R1, .. Rn nazywamy wywodem w
Λ ∪ T ∪ T×
× T ∪ T×
× T×
× T ∪ ...)
Język L to dowolny podzbiór zbioru słów T* (Λ
(Język to zbiór generowanych przez gramatykę słów zawierających
pa dziernik,
2005
32
wyłącznie
symbole
terminalne.)
ź
Analiza na skł
składniki
bezpo rednie, 1
Prosty przykł
przykład
2:
V ={Ala, ma, Asa, As, Amadeusza, kota, S, Nm, Nb, V}
T ={Ala, ma, Asa, As, Amadeusza, kota}
symbol początkowy - S
produkcje: S -> Nm V Nb
Nm -> Ala
V -> ma
Nb -> kota | Asa | Amadeusza
WyróŜnienie zdań.
Przyjmiemy dla uproszczenia kryterium ortograficzne zdanie to ciąg słów rozpoczynający się od wielkiej litery,
kończący kropką (.!?) i zawierający jako element centralny
formę czasownika lub składający się z kilku części,
posiadających czasownikowy element centralny, np.
– Jan idzie.
– Kto to zrobił?
– Podaj mi ksiąŜkę albo się przesuń.
– Gdybym chciał, to Piotr musiał by mnie wysłuchać.
pa dziernik, 2005
33
ź
pa dziernik, 2005
Analiza na skł
składniki
bezpo rednie, 2
34
ź
Analiza na skł
składniki
bezpo rednie, 3
WyróŜnienie frazy pomiotu i orzeczenia (to dla polskiego
nie zawsze daje podział na dwie rozłączne spójne frazy, ale przyjmiemy
to uproszczenie dla wygody)
Mały brat Zosi podrzuca kolorową piłkę na ścieŜce w parku
Mały brat Zosi podrzuca kolorową piłkę na ścieŜce w parku
[Mały brat Zosi]
fraza podmiotu
(rzeczownikowa)
[podrzuca kolorową piłkę na ścieŜce w parku]
fraza orzeczenia
(czasownikowa)
Podział fraz na frazy składowe
[Mały brat Zosi]
[Mały brat] [ Zosi ]
[Mały] [brat]
[podrzuca kolorową piłkę na ścieŜce w parku]
[podrzuca] [kolorową piłkę] [na ścieŜce w parku]
[kolorową] [piłkę] [na] [ ścieŜce w parku]
[ścieŜce] [w parku]
[w] [parku]
pa dziernik, 2005
ź
35
pa dziernik, 2005
ź
36
6
Elementy wymagane
(dopeł
(dopełnienia)
Typy konstrukcji skł
składniowych
Dla niektórych konstrukcji (fraz) moŜemy wyróŜnić element,
który moŜe (w sensie składniowym) zastąpić całą frazę
Mały brat Zosi -> brat
(bardzo) kolorową piłkę (w kropki) -> piłkę
bardzo kolorową -> kolorową
fraza rzeczownikowa
fraza rzeczownikowa
Niektóre słowa wymagają, by w skład tworzonej przez nie frazy
wchodziła fraza (słowo) o ściśle określonych cechach morfosyntaktycznych (morfologicznych lub syntaktycznych):
– przyimek wymaga, by następowała po nim fraza rzeczownikowa
w określonym przypadku (przypadkach), np. przyimek ‘na’
wymaga frazy rzeczownikowej w bierniku lub miejscowniku
*na
(brak frazy wymaganej)
* na morzem
(fraza rzeczownikowa w celowniku)
*na wysoko
(fraza przysłówkowa)
na głębokim morzu
(fraza rzeczownikowa w miejscowniku)
na spokojne morze
(fraza rzeczownikowa w miejscowniku)
fraza przymiotnikowa
są teŜ konstrukcje, których Ŝaden element nie moŜe być
uznany za ich reprezentanta, np.
na dłoni
Ŝe przyjdzie
Jaś i Małgosia
fraza przyimkowa
zdanie ze spójnikiem podrzędnym
fraza rzeczownikowa współrzędna
* oznacza wypowiedzenia niepoprawne
pa dziernik, 2005
37
ź
pa dziernik, 2005
38
ź
Elementy wymagane
(dopeł
(dopełnienia), 2
Elementy opcjonalne
(modyfikatory)
Czasowniki określają frazy, które są niezbędne do utworzenia
poprawnego wyraŜenia, przy czym ten sam czasownik moŜe
dopuszczać róŜne zestawy dopełnień),
np. czasownik powiedzieć moŜe łączyć się z frazą rzeczownikową w
bierniku, ze zdaniem podrzędnym rozpoczynającym się od Ŝe, lub z
dowolnym wypowiedzeniem stanowiącym cytat:
Frazy moŜna (teoretycznie) dowolnie rozszerzać o elementy
opcjonalne, przy czym typ tych elementów zaleŜy od typu frazy:
– frazy rzeczownikowe mogą być modyfikowane frazami
przymiotnikowymi:
mały biały pies
gładki szeroki skórzany pas
– frazy czasownikowe i przymiotnikowe mogą być modyfikowane
frazami przysłówkowymi:
spał niespokojnie
latał niebezpiecznie wysoko
przeraźliwie głośno
bardzo mało zabawny
*Ewa powiedziała
(brak frazy wymaganej)
*Ewa powiedziała na morzem
(fraza przyimkowa)
*Ewa powiedziała ładny
(fraza przyimkowa)
Ewa powiedziała wiersz
(fraza rzeczownikowa w bierniku)
Ewa powiedziała, Ŝe przyjdzie.
(zdanie „Ŝe”)
Ewa powiedziała „Dość!”
* oznacza wypowiedzenia niepoprawne
pa dziernik, 2005
39
ź
Elementy opcjonalne
(modyfikatory), 2
ź
bułka z masłem
czytał z uwagą
pojechał w piątek, po porannym spotkaniu, przed obiadem
sukienka ze sztruksu w niebieskie pasy z krótkimi
rękawkami z białymi mankietami
Gramatyka CFG to <V, T, S, P>:
P - zbiór produkcji A-> α , gdzie A ∈ NT= V-T, α ∈ V*
S -> NP VP
NP -> Det Nominal
Nominal -> Noun
VP -> V | V NP
Det -> a | my
Noun -> flight | friend | morning
V -> left | prefers
frazy rzeczownikowe mogą być modyfikowane zdaniami
względnymi:
człowiek, który wie wszystko
to, co zostało po wczorajszym przyjęciu
pa dziernik, 2005
ź
40
Gramatyki bezkontekstowe
(CFG - Context Free Grammars)
frazy rzeczownikowe i czasownikowe mogą być
modyfikowane frazami przyimkowymi:
(nie rozwaŜamy tu ograniczeń semantycznych)
pa dziernik, 2005
41
Zapis składników i ich kolejności
Brak informacji o zaleŜnościach funkcyjnych
Współczesne teorie opierają się o CFG, ale wykorzystują teŜ
dodatkowe elementy
pa dziernik, 2005
ź
42
7
Drzewo wywodu
CFG - wywó
wywód
S -> NP VP
NP -> Det Nominal
Nominal -> Noun Nominal | Noun
VP -> V NP
Det -> a | my
Noun -> flight | friend | morning
V -> prefers
S -> NP VP
NP -> Det Nominal
Nominal -> Noun Nominal | Noun
VP -> V NP
Det -> a | my
Noun -> flight | friend | morning
V -> prefers
S-> NP VP -> Det Nominal VP -> Det Noun VP-> Det Noun V NP->
-> Det Noun V Det Nominal -> Det Noun V Det Noun Nominal->
-> Det Noun V Det Noun Noun -> my Noun V Det Noun Noun
->* my friend prefers a morning flight
Nominal
Det Noun V
my
43
ź
Wielo
Jan kupił dom na wsi.
kupił
NP
PP
Jan
N
Prep NP
dom
na
N
V
kupił N
na
dom
N
wsi
44
•
wywodó
wywodów
RóŜne rozbiory syntaktyczne mogą mieć
róŜne znaczenia
[Jan] kupił [dom na wsi] (dom jest na wsi)
[Jan] kupił [dom] [na wsi] (kupowanie odbywało si na wsi)
ę
•
(prawie) takie samo znaczenie
[Jan] ma [starą [ksiąŜkę [do angielskiego]]]
[Jan] ma [[starą ksiąŜkę] [do angielskiego]]
lub niektóre z nich mogą nie mieć Ŝadnego sensownego
znaczenia:
Jan zobaczył [biuro] [w piątek.]
Jan zobaczył [biuro w piątek.] ??
45
ź
pa dziernik, 2005
46
ź
Problemy z CFG - uzgodnienia
Opis frazy przymiotnikowej
ź
a
Nominal
Nominal
Noun
morning flight
Noun
ź
Prep NP
pa dziernik, 2005
AdjP -> Adj
AdjP -> Adj AdjP
AdjP -> AdvP AdjP
AdvP -> Adv | Adv AdvP
AdjP -> Adj PP
PP -> Prep NP
AdjP1 -> Conj AdjP AdjPC | Conj AdjP
AdjP -> AdjP Coma AdjPC
Conj -> i | lub
Coma -> ,
prefers
Det
Wielo
NP
VP
pa dziernik, 2005
wsi
pa dziernik, 2005
friend
wywodó
wywodów
Niejednoznaczności składniowe powodują, Ŝe jedno zdanie (fraza) moŜe mieć wiele róŜnych
rozbiorów składniowych – wiele drzew wywodu (ich liczba zaleŜy od konkretnej
gramatyki), np.
S -> NP VP
S
S
NP -> N | NP PP
VP -> V | V NP | VP PP
NP
VP
NP
VP
PP -> Prep NP
Noun
V NP
Noun
VP PP
Jan
NP
NP
(wybór symbolu do zamiany dowolny, moŜe prowadzić do róŜnych
wywodów)
pa dziernik, 2005
S
Cechy języków naturalnych, których opis w gramatykach
bezkontekstowych jest trudny, a co najmniej uciąŜliwy, to
przykładowo uzgodnienia i wymagania.
biały
biały mały wesoły
bardzo biały
biały z połyskiem
biały i ciemno niebieski
biały, zielony i brązowy
Jaki problem powstaje w wyniku zastosowania
następujących reguł?
S -> NP VP
NP -> Det Nominal
Odpowiedź: nadmiarowość gramatyki generującej
przykładowo następujące zdania i frazy:
*They sleeps.
*this dogs
47
pa dziernik, 2005
ź
czy
*Oni śpi.
*ten psy.
48
8
Rozwi zanie I - podział
podział na wi cej
klas
Problemy z CFG - wymagania
Jaki problem powstaje w wyniku stosowania następujących
reguł?
VP -> V
VP -> V NP
*On spał kota.
pa dziernik, 2005
zdanie z orzeczeniem w l.poj.
zdanie z orzeczeniem w l. mnogiej
fraza rzecz. i fraza czas. w l. poj.
IntransVP -> IntransVerb
TransVP -> TransVerb NP
49
ź
Rozwi zanie II - atrybuty
fraza rzecz. i fraza czas w l. mnogiej
fraza z czas. nieprzechodnim
fraza z czas. przechodnim
pa dziernik, 2005
50
ź
CFG z atrybutami, zapis wymaga
(features,
features, attributes)
attributes)
Zakodowanie wartości cech bezpośrednio w nazwach
symboli nieterminalnych:
S -> SgS
S -> PlS
SgS -> SgNP SgVP
SgNP -> SgDet SgNom
Odpowiedź: nadmiarowość:
*He took.
*He slept the cat.
*She disappeared the elephant.
Alternatywną metodą jest potraktowanie terminali i
nieterminali jako symboli złoŜonych z przypisanymi
własnościami (cechami, atrybutami).
Przyimek z moŜe łączyć się z frazami rzeczownikowymi w dopełniaczu lub
narzędniku:
Pozwala to przykładowo na ograniczenie stosowania reguły:
PP(form, case) -> Prep(form, case) NP(case,gender, number,person)
Prep(z, gen) -> z
(gen czyli genetive czyli dopełniacz)
Prep(z, ins) -> z
(ins czyli instrumental czyli narz dnik)
S -> NP VP
tylko do sytuacji, gdy liczba frazy rzeczownikowej NP i
czasownikowej VP jest taka sama:
ę
z domu, z domem, z moim domem ...
S(number) -> NP(number) VP(number)
pełniejszy przykład:
S -> NP(case-nom,gender,nb,person) VP (gender,nb,person)
NP(case,gender,number) -> Noun(case,gender,number)
pa dziernik, 2005
ź
51
pa dziernik, 2005
ź
52
9