1 3. Formalny opis j zyka naturalnego Uzgodnienia

Transkrypt

1 3. Formalny opis j zyka naturalnego Uzgodnienia
Uzgodnienia
Cechy j zyków naturalnych, których opis w gramatykach
bezkontekstowych jest trudny, a co najmniej uci liwy, to
przykładowo uzgodnienia i wymagania.
ę
ą
3. Formalny opis j zyka
naturalnego
Ŝ
Jaki problem powstaje w wyniku zastosowania
nast puj cych reguł?
ę
ą
S -> NP VP
NP -> Det Nominal
Składnia. Gramatyki bezkontekstowe
Odpowied : nadmiarowo gramatyki generuj cej
przykładowo nast puj ce zdania i frazy:
ź
Zapis wymagań i modyfikatorów
*They sleeps.
*this dogs
pa dziernik, 2004
1
ź
ą
czy
*Oni pi.
*ten psy.
ś
2
ź
Uzgodnienia
rzeczownikrzeczownik-przymiotnik
(features,
features, attributes)
attributes)
Potraktowanie symboli nieterminalnych jako symboli
zło onych z przypisanymi własno ciami (cechami, atrybutami).
Ŝ
ć
ą
pa dziernik, 2004
Gramatyki CFG z atrybutami
ś
ę
ś
Rzeczownik i modyfikuj cy go przymiotnik musz mie tak
sam liczb , przypadek i rodzaj:
ą
ą
ą
ć
ą
ę
Pozwala to przykładowo na ograniczenie stosowania reguły:
S -> NP VP
tylko do sytuacji, gdy liczba, rodzaj i osoba frazy rzeczownikowej NP
i czasownikowej VP s takie same (czyli reprezentacj uzgodnie
podmiot-orzeczenie)
ą
ę
NP(case-nom,gender,nb,person) ->
AdjP(case, gender,nb) NP(case,gender,nb,person)
ń
NP(case,gender,number) -> Noun(case,gender,number)
S -> NP(case-nom,gender,nb,person) VP (gender,nb,person)
NP(case,gender,number) -> Noun(case,gender,number)
pa dziernik, 2004
małego psa, ostatni film Felliniego …
3
ź
pa dziernik, 2004
Podstawowe problemy
skł
składniowe - wymagania
Elementy wymagane
Wymagania (dopełnienia)
czasownika: (typ frazy, przypadek frazy rzeczownikowej)
– szukam miejsca (czego? fraza rzeczownikowa w
dopełniaczu),
– chc spa (co? fraza czasownikowa bezokolicznikowa),
– mówi o pogodzie; mówi , e pada
– daj mu cukierki
przyimka: (przypadek)
– w domu
– na dom /na domu
ę
4
ź
Czasowniki okre laj frazy, które s niezb dne do utworzenia
poprawnego wyra enia, przy czym ten sam czasownik mo e
dopuszcza ró ne zestawy wymaga (dopełnie ),
np. czasownik powiedzie mo e ł czy si z fraz rzeczownikow
w bierniku, ze zdaniem podrz dnym rozpoczynaj cym si od e,
lub z dowolnym wypowiedzeniem stanowi cym cytat:
ś
ą
ą
ć
Ŝ
Ŝ
ń
ć
Ŝ
ą
ń
ć
ę
ą
ę
ą
ą
ę
Ŝ
ą
ć
ę
ę
Ŝ
ę
*Ewa powiedziała
(brak frazy wymaganej)
*Ewa powiedziała na morzem (fraza przyimkowa)
*Ewa powiedziała ładny
(fraza przymiotnikowa)
Ewa powiedziała wiersz (fraza rzeczownikowa w bierniku)
Ewa powiedziała, e przyjdzie.
(zdanie „ e”)
Ewa powiedziała „Do !”
pa dziernik, 2004
* oznacza wypowiedzenia niepoprawne 6
Ŝ
Ŝ
ś
pa dziernik, 2004
ź
ę
Ŝ
5
ć
ź
1
Problemy z CFG - wymagania
CFG z atrybutami, zapis wymaga
Jaki problem powstaje w wyniku stosowania nast puj cych
reguł?
ę
ą
przyimki
– ł cz si tylko z frazami rzeczownikowymi (nie musimy wi c
traktowa typu frazy jak atrybutu),
– narzucaj c im przypadek (który powinien by zatem
atrybutem dla przyimka)
ą
VP -> V
VP -> V NP
PP -> Prep NP
ą
ę
ę
ć
ą
Odpowied – nadmiarowo , czyli tworzenie rozbiorów
konstrukcji niepopoprawnych:
ź
ś
*He took.
*He slept the cat.
*She disappeared the elephant.
*na stołem *w worka
frazy przyimkowe s wymagane przez czasowniki i wtedy
musimy zna zarówno przypadek jak i sam przyimek
(np. prosi o co , czyli przyimek ‘o’ i fraza w bierniku `o’+NPacc,
ale nie prosi o czym (‘o’ + NPloc) *prosi o bajce
ani nie prosi z co (‘z’+NPacc)
*prosi z bajk
czyli prep (form, case), np. prep(‘o’, acc) -> ‘o’
ć
ć
ą
ć
ć
*On spał kota.
ś
ć
ś
ć
ć
pa dziernik, 2004
7
ź
ć
ę
pa dziernik, 2004
8
ź
CFG z atrybutami, zapis wymaga
CFG z atrybutami, zapis wymaga , I
Wprowadzenie podziału na klasy, w zale no ci od typu i
liczby wymaga :
Ŝ
ś
ń
Przyimek z mo e ł czy si z frazami rzeczownikowymi w
dopełniaczu lub narz dniku:
Ŝ
ą
ć
ś
ć
ć
1) czasowniki bez wymaga (tylko podmiot), np. i , biec, sta
ę
ń
ę
PP (Form, Case) -> Prep (Form, Case) NP (Case,Gender, Number,Person)
VP(Gender,Num,Person,Tense) -> V1(Gender, Num,Person,Tense)
V1(masc, sg,3rd,past) -> szedł
2) czasowniki z wymaganiem frazy rzeczownikowej w
bierniku, np. widzie
ć
(gen czyli genetive czyli dopełniacz)
(ins czyli instrumental czyli narz dnik)
Prep (z, gen) -> z
Prep (z, ins) -> z
ę
VP(Gender,Num,Person,Tense) ->
V2(Gender, Num,Person,Tense) NP(acc,Gender,Numb,Person)
V2(fem, sg,3rd,past) -> widziała
z domu, z domem, z moim domem ...
itd.
* Warto ci argumentów pisane od wielkiej litery – zmienne, zaczynaj ce
pa dziernik, 2004
9
si od małej litery - stałe
ś
ą
pa dziernik, 2004
ź
10
ź
ę
Wa ne!
Ŝ
CFG z atrybutami, zapis wymaga II
Nie dzielimy czasowników na klasy, ale zapisujemy odpowiednie
informacje w słowniku (leksykalizacja gramatyki)
ustalamy maksymaln liczb wymaga (3-4), tu przyjmiemy 3
ustalamy symbol dla pustego wymagania (null)
ą
ę
ń
VP (Gend,Num,Pers,tense) ->
V (Gend, Num,Pers,Tense,W1,W2,W3)
Arg (W1) Arg (W2) Arg (W3)
ę
Arg(null) -> ε
V(masc, sg,3rd,past, null, null, null) -> szedł
Arg(np-acc) -> NP(acc,gend, numb,pers)
V(fem, sg,3rd,past, np-acc, null, null) -> widziała
ź
Aby wprowadzić nowy typ wymagań naleŜy:
1. wprowadzić nazwę wymagania (wx) i uŜyć jej w
definicji odpowiedniego czasownika
2. dopisać regule definiującą, co rozumiemy przez dane
wymaganie, czyli regułę Arg(wx) -> ….
Wymagnie b d ce fraz rzeczownikow w celowniku
1) Nazwa wymagania: np-dat
{Arg - argument - dopełnienie/wymaganie}
pa dziernik, 2004
zapis wymaga II, cd
ą
ą
ą
u ycie dla czasownika da (da kogo/co? komu/czemu?)
V(fem, pl, 3, past, np-acc, np-dat, null) -> dały
Ŝ
ć
ć
2) Arg(np-dat) -> NP(dat, Gend, Num,Pers,)
11
pa dziernik, 2004
ź
12
2
zapis wymaga II, cd
zapis wymaga II, cd.
cd.
Dla dopuszczenia podmiotu przeplecionego z dopełnieniami traktujemy podmiot
tak e jako wymaganie (argument), które zapisujemy na pierwszej pozycji (tu
jako np-nom3fsg, bo wtedy trzeba te pami ta o uzgodnieniu podmiotu i
orzeczenia)
Aby dopuścić swobodny szyk definiujemy dodatkowe reguły:
Ŝ
a) VP(Gend,Num,Pers,Tense) ->
Ŝ
ę
ć
V(gend, Num,Pers,Tense,W1,W2,W3) Arg(W2) Arg(W1)Arg(W3)
b) VP(gend,num,pers,tense) -> Arg(W1)
V(Gend, Num,Pers,Tense,W1,W2,W3)
Arg(W2) Arg(W3) ...
Je li
V(masc, sg,3rd,past, np-acc, np-instr, null) -> wbił
to reguła a) pozwala na analiz frazy: wbił młotkiem gwó d
a reguła b)
gwó d wbił młotkiem
ś
ź
ź
ę
ź
ź
pa dziernik, 2004
VP(gend,num,pers,tense) -> V(gend, num,pers,tense,w1,w2,w3)
Comp(w1) Comp(w2) Comp(w3)
Comp(null) -> ε
V(masc, sg,3rd,past, np-nom3msg, null, null) -> szedł
Comp(np-nom) -> NP(nom, Gend, Numb, Pers)
Comp(np-acc) -> NP(acc, Gend, Numb, Pers)
V(fem, sg,3rd,past, np-nom3fsg, np-acc, null) -> widziała
13
ź
pa dziernik, 2004
14
ź
Elementy opcjonalne (modyfikatory)
Opis frazy przymiotnikowej
Frazy moŜna (teoretycznie) dowolnie rozszerzać o elementy
opcjonalne, przy czym typ tych elementów zaleŜy od typu frazy:
AdjP -> Adj
AdjP -> Adj AdjP
AdjP -> AdvP AdjP
AdvP -> Adv | Adv AdvP
AdjP -> Adj PP
PP -> Prep NP
AdjP -> AdjP Conj AdjP
AdjP -> AdjP Coma AdjP
Conj -> i | lub
Coma -> ,
– frazy rzeczownikowe mogą być modyfikowane frazami
przymiotnikowymi:
mały biały pies
gładki szeroki skórzany pas
– frazy czasownikowe i przymiotnikowe mogą być
modyfikowane frazami przysłówkowymi:
spał niespokojnie
latał niebezpiecznie wysoko
przeraźliwie głośno
bardzo mało zabawny
pa dziernik, 2004
15
ź
biały
biały mały wesoły
bardzo biały
biały z połyskiem
biały i ciemno niebieski
biały, zielony i brązowy
pa dziernik, 2004
16
ź
(nie rozwaŜamy tu ograniczeń semantycznych)
Opis frazy przymiotnikowej
Zapis modyfikacji
AdjP (C, G, N) -> Adj (C, G, N)
biały
AdjP (C, G, N) -> Adj (C, G, N) AdjP (C, G, N)
AdjP (C, G, N) -> AdvP AdjP (C, G, N)
bardzo biały
AdvP -> Adv | Adv AdvP
AdjP (C, G, N) -> Adj (C, G, N) PP (F,C1)
biały z połyskiem
AdjP (C, G,N) -> AdjP (C, G, N) Conj AdjP (C, G, N)
AdjP(C,G,N) -> AdjP (C, G, N) Coma AdjP (C,G,N)
biały i ciemno niebieski,
biały, zielony i brązowy
Fraza rzeczownikowa modyfikowana frazą przymiotnikową
NP (C, G, N, P) -> AdjP (C,G, N) NP (C,G,N,P)
NP (C, G, N, P) -> NP (C,G,N,P) AdjP (C,G, N)
Problem: wiele rozbiorów
mały piec kaflowy: [mały piec] kaflowy
mały [piec kaflowy]
Conj -> i | lub
Coma -> ,
pa dziernik, 2004
ź
17
pa dziernik, 2004
ź
18
3
Elementy opcjonalne
(modyfikatory), 2
Konstrukcje wspó
współrz dne
frazy
rzeczownikowe i czasownikowe mogą być
modyfikowane frazami przyimkowymi:
bułka z masłem
czytał z uwagą
pojechał w piątek, po porannym spotkaniu, przed
obiadem
sukienka ze sztruksu w niebieskie pasy z krótkimi
rękawkami z białymi mankietami
Wszystkie typy konstrukcji moŜna łączyć spójnikami
tworząc konstrukcje współrzędne (czasem moŜna łączyć teŜ
konstrukcje róŜnych typów)
– idzie i śpiewa
– goło i wesoło
– do tańca i do róŜańca
– po południu i wieczorem
frazy rzeczownikowe mogą być modyfikowane zdaniami
względnymi:
człowiek, który wie wszystko
2004
to, co zostało po wczorajszym przyjęciu
pa dziernik,
19
pa dziernik, 2004
ź
Zapis modyfikacji
20
ź
Dlaczego CFG ?
Fraza rzeczownikowa modyfikowana frazą przyimkową
wyraŜenia regularne - zbyt słabe (ograniczenia: np. anb n),
zalety:
NP (C, G, N, P) -> NP (C,G,N,P) PP (Form, C1)
– Wzajemna odpowiedniość:
Fraza czasownikowa modyfikowana frazą przyimkową
– Efektywność parsowania:
gramatyki regularne ↔ wyraŜenia regularne ↔ FSA
VP ( G, N, P, W1, W2, W3) ->
VP ( G, N, P, W1, W2, W3) PP (Form, C1)
Pamięć- stała
Czas parsowania liniowy (~ długość ciągu wejściowego)
gramatyki kontekstowe, gramatyki klasy 0:
– łatwo wyraŜa się róŜne skomplikowane własności języka,
– nieefektywne obliczeniowo.
pa dziernik, 2004
ź
21
pa dziernik, 2004
Parsowanie,
Parsowanie, gramatyki
bezkontekstowe
Parsowanie gramatyk CFG,
podej cie toptop-down
S -> NP VP | Aux NP VP | VP
NP -> Det Nom | PropNoun
Nom -> Noun Nom | Noun
VP -> V | V NP
Det -> a | this | that
Noun -> flight | I | morning book
Aux -> does
V -> prefer | book
CFG często uŜywane do opisu struktury frazowej, a
zwłaszcza kolejności składników
Potrzebna pamięć: stos (czasami stos stosów) o wielkości
zaleŜnej od stopnia zagnieŜdŜenia rekurencji
Czas parsowania: w ogólnym przypadku O(n3)
Ograniczenia: np. anb ncn (gramatyka kontekstowa)
23
Adobe Acrobat
Document
nie moŜe być reguł z lewostronną rekurencją
pa dziernik, 2004
ź
Top-down.ps
ź
Book that flight.
rozpoczynamy od symbolu początkowego i „rozwijamy” reguły
analiza tylko tych reguł, które mają szansę być zastosowane
sugerowanie hipotez niezgodnych z analizowanym ciągiem słów
pa dziernik, 2004
22
ź
24
4
Parsowanie gramatyk CFG,
podej cie bottomottom-up
S -> NP VP | Aux NP VP | VP
NP -> Det Nom | PropNoun
Nom -> Noun Nom | Noun
VP -> V | V NP
a | this | that
Det ->
Noun -> flight | I | morning | book
Aux -> does
V ->
prefer | book
Problemy dla analizy toptop-down
Nie moŜna uŜywać gramatyk, w których pierwszy symbol
prawej strony jest taki sam jak symbol po lewej stronie
produkcji:
Book that flight.
bottom-up.ps
struktury rekurencyjne
NP -> NP PP (lot do ParyŜa)
Adobe Acrobat 7.0
Document
VP -> VP PP (wystartował w piątek po południu)
staramy się znaleźć analizy poszczególnych elementów ciągu wejściowego i
„sklejamy” je
formułowanie hipotez zgodnych z danymi (lokalnie)
sugerowanie hipotez bezsensownych w kontekście
problemy z rekurencją
pa dziernik, 2004
struktury współrzędne
S -> S Conj S
25
ź
pa dziernik, 2004
Problemy z opisem przy u yciu CFG
Niejednoznaczno ci - wielo rozbioró
rozbiorów.
Book
that flight
Noun/Verb Det Noun
ź
Najczęstsze przyczyny niejednoznaczności:
– frazy przyimkowe mogą być dołączane na róŜnym poziomie, np.
NP -> NP PP
ź
28
Wykorzystywanie gramatyk regularnych (implementowanych
jako automaty) do rozpoznawania niektórych elementów
tekstów, np.
rozpoznawanie granic fraz, przykład NG (noun group)
– zaimek, określenie czasu (np. yesterday), data
NG -> Pronoun | Time-NP | Date-NP
– ‘head noun’ poprzedzone opcjonalnie przedimkiem), frazy z formą -ing,
oraz ‘kompletne frazy przedimkowe’, np. only five, this
NG -> (DETP) (Adjs) HdNns | DETP Ving HdNns |
Próby zaradzenia problemom:
– droga teoretyczna- silniejsze formalizmy
– droga praktyczna - ograniczanie rekurencji, „ręczne”
sterowanie
ź
lot z [ ParyŜa do Warszawy]
[ lot z ParyŜa ] do Warszawy
pa dziernik,
2004
Parsowanie powierzchniowe
(shallow parsing)
parsing)
Tradycyjny podział na frazę podmiotu i orzeczenia dla
polskiego ma mały sens:
– Jana Piotr zobaczył od razu.
Nieciągłości:
– Jan się znowu bardzo duŜo spóźnił
– Starego nie lubię chleba
– Tyś tego nie wiedział!
pa dziernik, 2004
[ [ksiąŜka lub film] o impresjonistach ]
[ksiąŜka „Sztuka w zarysie”] lub [ film o impresjonistach]
– róŜny podział fraz rzeczownikowych (na ogól niepotrzebne):
Problemy z opisem CFG, cd
spytaj o [samolot z Krakowa do Warszawy w piątek ]
spytaj [ o samolot z Krakowa do Warszawy ] w piątek
– róŜne interpretacje koordynacji:
Nie rozpatrujemy reguł, dla których nie istnieje takie dalsze
rozwinięcie, które da w wyniku pierwszy symbol z
analizowanego wejścia
dla kaŜdej kategorii sporządzamy odpowiednia listę typów słów
S
Det, PropNoun, Aux,Verb
NP
Det, PropNoun
Nominal
Noun
Verb
dziernik,VP
2004
27
pa
26
ź
Parsowanie gramatyk CFG,
podej cie toptop-down with bottombottom-up filtering
S -> NP VP | Aux NP VP | VP
NP -> Det Nom | PropNoun
Nom -> Noun Nom | Noun
VP -> V | V NP
Det -> a | this | that
Noun -> flight | morning | book
Aux -> does PropNoun -> I
V -> prefer | book
(Piotr wyjechał do Krakowa, a Ania jest chora)
NP -> NP Conj NP (Ania i Piotr wyszli wcześniej)
DETP-CP (and HdNns)
( powierzchniowość analizy widać po tym, Ŝe nie sprawdzamy Ŝadnych uzgodnień,
nie wiąŜemy analiz poszczególnych fragmentów)
29
Rozpoznanie
pa dziernik, 2004 liczb pisanych słownie, dat, nazw własnych, ... 30
ź
5
J zyki regularne i metody ich
rozpoznawania/generowania
Hierarchia gramatyk/j zykó
zyków
(Chomsky,
Chomsky, 1959)
regularna
(Regular)
X → α Y gdzie X,Y są symbolami nieterminalnym, α ciągiem
bezkontekstowa
terminali; Y moŜe być pominięte
(Context-free)
X → γ, X -symbol nieterminalny, γ ciąg dowolnych symboli
kontekstowa
(Context-sensitive)
αXβ
β → αγβ, X - symbol nieterminany, α,β,γ ciągi symboli
terminalych i nieterminalnych, γ nie moŜe być pusty
rekurencyjnie przeliczalna
(Turing Equivalent, Type 0)
α → β ; α,β ciągi symboli terminalych i nieterminalnych
Język regularny to język generowany przez wyraŜenie regularne
(wykorzystanie: Perl, emacs, Word, sed, awk, grep, vi, netscape)
WyraŜenie regularne to:
a) wyraŜenie stałe φ (język pusty |φ
φ|)
b) wyraŜenie Λ (język składający się ze słowa pustego Λ)
c) wyraŜenie będące pojedynczą zmienną y1,..., yn
d) jeŜeli U i W są wyraŜeniami regularnymi opisującymi języki |U| i
|W|, to (U⋅⋅ W), (U∪
∪ W) i (U)* są wyraŜeniami regularnymi
∪ |W| i |U|*
opisującymi odpowiednio języki |U||W|, |U|∪
kaŜde wyraŜenie regularne moŜna uzyskać z wyraŜeń opisanych w a)c) za pomocą skończonej liczby operacji z d).
(* - oznacza 0 lub więcej razy)
pa dziernik, 2004
31
ź
pa dziernik, 2004
Wyra enia regularne
Jakie j zyki s regularne?
Przykłady języków regularnych:
JeŜeli L jest językiem regularnym, to istnieją ciągi symboli
teminalnych x,y,z, takie, Ŝe y ≠ ε i xynz ∈ L dla n≥
≥0
j zyk owcy: be! bee! beee! beeee! …
gramatyka:
S -> beE
E -> ! E -> eE
(zapis: E -> ! |eE )
wyraŜenie regularne: bee*!
(be+!)
ę
liczby całkowite
gramatyka:
np. anb n nie jest regularny
(nie moŜna „pompować” ani ak, ani b k ani (ab)k
(jest to język bezkontekstowy:
S -> 0S | 1S | … | 9S | 0 | 1 | 2 | … | 9
wyraŜenie regularne [0..9][0..9]*
ź
33
Chomsky (1956,1957), Partee (1990)
The cat likes tuna fish.
The cat the dog chases likes tuna fish.
The cat the dog the rat bit chases likes tuna fish.
The cat the dog the rat the elephant admired bit chases likes tuna fish.
(the + noun)n (transitive verb)n-1 likes tuna fish - L1, nie jest regularny
Idea dowodu: budujemy język regularny L2, którego przecięcie z
językiem angielskim da w wyniku L1. PoniewaŜ przecięcie dwóch
języków regularnych jest regularne, a L1 nie, oznacza to, Ŝe angielski
teŜ nie jest regularny.
pa dziernik, 2004
– A = { the cat, the dog, the elephant, the rat, ...}
– B = { chased, admires, bit, ate ...}
35
34
ź
Do jakiej klasy nale
naturalne?
j zyki
Długa dyskusja o tym, do której kategorii naleŜą poszczególne
języki naturalne. Wiele „dowodów” na to, Ŝe angielski jest
językiem kontekstowym.
Obecny stan wiedzy:
– składnia i morfologia angielskiego jest bezkontekstowa
– szwajcarski dialekt niemieckiego ma składnię kontekstową
– morfologia języka Bambara (Mali) kontekstowa
– L2 = zbiór wyraŜeń A* B* likes tuna fish, gdzie
ź
S-> ε )
Języki naturalne nie są regularne, w szczególności nie jest
regularny angielski.
Angielski nie jest j zykiem regularnym
pa dziernik, 2004
S-> a S b
([0..9]+)
pa dziernik, 2004
32
ź
Co nie znaczy, Ŝe j.naturalny daje się łatwo opisać za pomocą
gramatyki bezkontekstowej ,ani e jego podzbioru nie moŜna
opisywać za pomocą gramatyk regularnych
pa dziernik, 2004
ź
36
6
Automaty
Definicja automatu
Istnieje wzajemnie jednoznaczna odpowiedniość między
gramatykami regularnymi a automatami skończonymi
Automat skończony to piątka < Q, ∑, δ, qs, Qf >, gdzie
Automat skończony
Urządzenie sekwencyjne mogące znajdować się w skończonej
liczbie stanów, czytające symbol po symbolu. Przeczytanie
symbolu zmienia stan urządzenia na inny i przesuwa taśmę
wejściową o jedną klatkę na lewo.
Automat skończony zupełny (niekoniecznie deterministyczny) automat Rabina Scotta (kaŜdy automat skończony jest
równowaŜny deterministycznemu automatowi Rabina-Scotta).
pa dziernik, 2004
37
ź
Q - skończony zbiór stanów q0,q1, ... qn
Σ skończony zbiór symboli wejściowych (alfabet)
qs - stan początkowy∈
∈Q
Qf ⊆ Q zbiór stanów końcowych (akceptujących)
δ (q,i) tablica przejść Q × Σ -> Q ; dla danego symbolu
wejściowego i stanu wartością jest stan automatu
pa dziernik, 2004
Przykł
Przykład automatu
j zyk owcy: be! bee! beee! beeee! …
gramatyka: S -> beE
E -> ! E -> eE
wyraŜenie regularne: bee*!
(be+!)
automat: Q={q0,q1,q2,q3} ∑ ={a,b,c,...,z, !,?}
e
b
e
!
q0
q1
q2
Przykł
Przykład automatu, 2
ę
Formy słowa owca: owca, owcy, owcy, owcę, owcą, owcy
gramatyka: S -> owcE
E -> a | y | ę | ą
wyraŜenie regularne:
automat:
owc[ayęą]
q2
q3
a
ę
q4
owc
q3
pa dziernik, 2004
q1
q5
ą
(tu zakladamy, Ŝe mamy juŜ rozpoznany początek i koniec słowa)
39
ź
y
q0
(jeśli alfabet jest duŜy (tu wszystkie litery) dla zwiększenia czytelności
pomija się często przejścia dla symboli uniemoŜliwiających dojście do
stanów akceptujących)
pa dziernik, 2004
40
ź
Transducery
38
ź
Transducery
Transducery to automaty skończone, na łukach których
znajdują się pary symboli. Dla kaŜdego przejścia przez automat
otrzymujemy wiec parę powiązanych ze sobą słów. Transducer
wiąŜe ze sobą dwa języki regularne.
zamiana ci gów ‘ab’ na ‘x’
? oznacza dowolny, nie wymieniony na innych łukach symbol
pojedynczy symbol na łuku oznacza, e go kopiujemy,
np. a oznacza a:a
ą
Ŝ
Słowo:
Prosty przykład zamiana symboli 0 i 1 (tzn. 0110 -> 1001)
aabaaabb
Wej cie:
a a
b a a a
b b
Ci g stanów: 0 1 (1) 2 0 1 1 (1) 2 0 0
ś
1:0
ą
q0
Wyj cie:
a (a) x a a (a) x b
ś
0:1
axaaxb
(n) oznacza cie k , z której si trzeba
42
było wycofa
ę
ś
pa dziernik, 2004
ź
41
pa dziernik, 2004
ź
ę
Ŝ
ć
7
Automaty, rozszerzenia
J zyki formalne
Automat z wyjściem:
Automat Moore’a nad alfabetem wejściowym T i
wyjściowym Y nazyamy trójkę <S , M, G>, gdzie S skończony zbiór stanów, M - funkcja przejścia S x T -> S ,
G: S -> Y.
Automat ze stosem
automat z taśmą wejściową i taśmą (stosem) roboczym
Maszyna Turinga
automat z taśmą wejściową prawostronnie nieograniczoną i
obustronnie nieograniczoną taśmą roboczą, która moŜe być
przesuwana w obu kierunkach
pa dziernik, 2004
43
ź
j zyk (gramatyka)
ę
rozpoznawany przez
problem x ∈ L
regularny
automat Rabina-Scotta
rozstrzygalny
(FSA)
bezkontekstowy automat ze stosem
rozstrzygalny
(PSG)
kontekstowy dwutaśmowa maszyna Turinga rozstrzygalny
(TAG)
o ograniczonej długości taśmy
rekurencyjnie dwutaśmowa maszyna Turinga nierozstrzygalny
przeliczalny
(ATN, HPSG)
pa dziernik, 2004
ź
44
Dzi kuj za uwag .
ę
pa dziernik, 2004
ź
ę
ę
45
8