1 3. Formalny opis j zyka naturalnego Uzgodnienia

Transkrypt

1 3. Formalny opis j zyka naturalnego Uzgodnienia
Uzgodnienia
Cechy j zyków naturalnych, których opis w gramatykach
bezkontekstowych jest trudny, a co najmniej uci liwy, to
przykładowo uzgodnienia i wymagania.
ę
ą
3. Formalny opis j zyka
naturalnego
Ŝ
Jaki problem powstaje w wyniku zastosowania
nast puj cych reguł?
ę
ą
S -> NP VP
NP -> Det Nominal
Składnia. Gramatyki bezkontekstowe
Odpowied : nadmiarowo gramatyki generuj cej
przykładowo nast puj ce zdania i frazy:
ź
ś
ć
ą
ę
ą
Zapis wymagań i modyfikatorów.
*They sleeps.
*this dogs
(features,
features, attributes)
attributes)
Potraktowanie symboli nieterminalnych jako symboli
zło onych z przypisanymi własno ciami (cechami, atrybutami).
Ŝ
*Oni pi.
*ten psy.
ś
Uzgodnienia
rzeczownikrzeczownik-przymiotnik
Gramatyki CFG z atrybutami
czy
ś
Rzeczownik i modyfikuj cy go przymiotnik musz mie tak
sam liczb , przypadek i rodzaj:
ą
ą
ć
ą
ę
ą
Pozwala to przykładowo na ograniczenie stosowania reguły:
S -> NP VP
tylko do sytuacji, gdy liczba, rodzaj i osoba frazy rzeczownikowej NP
i czasownikowej VP s takie same (czyli reprezentacj uzgodnie
podmiot-orzeczenie)
ą
ę
NP(case-nom,gender,nb,person) ->
AdjP(case, gender,nb) NP(case,gender,nb,person)
ń
NP(case,gender,number) -> Noun(case,gender,number)
S -> NP(case-nom,gender,nb,person) VP (gender,nb,person)
NP(case,gender,number) -> Noun(case,gender,number)
małego psa, ostatni film Felliniego …
Podstawowe problemy
skł
składniowe - wymagania
Wymagania (dopełnienia)
czasownika: (typ frazy, przypadek frazy rzeczownikowej)
– szukam miejsca (czego? fraza rzeczownikowa w
dopełniaczu),
– chc spa (co? fraza czasownikowa bezokolicznikowa),
– mówi o pogodzie; mówi , e pada
– daj mu cukierki
przyimka: (przypadek)
– w domu
– na dom /na domu
ę
Elementy wymagane
Czasowniki okre laj frazy, które s niezb dne do utworzenia
poprawnego wyra enia, przy czym ten sam czasownik mo e
dopuszcza ró ne zestawy wymaga (dopełnie ),
np. czasownik powiedzie mo e ł czy si z fraz rzeczownikow
w bierniku, ze zdaniem podrz dnym rozpoczynaj cym si od e,
lub z dowolnym wypowiedzeniem stanowi cym cytat:
ś
ą
ą
ę
Ŝ
ć
Ŝ
Ŝ
ń
ć
Ŝ
ą
ń
ć
ę
ą
ę
ą
ą
ę
Ŝ
ą
ć
ę
ę
Ŝ
ę
*Ewa powiedziała
(brak frazy wymaganej)
*Ewa powiedziała na morzem (fraza przyimkowa)
*Ewa powiedziała ładny
(fraza przymiotnikowa)
Ewa powiedziała wiersz (fraza rzeczownikowa w bierniku)
Ewa powiedziała, e przyjdzie.
(zdanie „ e”)
Ewa powiedziała „Do !”
* oznacza wypowiedzenia niepoprawne
Ŝ
Ŝ
ś
ć
1
Problemy z CFG - wymagania
CFG z atrybutami, zapis wymaga
Jaki problem powstaje w wyniku stosowania nast puj cych
reguł?
ę
ą
przyimki
– ł cz si tylko z frazami rzeczownikowymi (nie musimy wi c
traktowa typu frazy jak atrybutu),
– narzucaj c im przypadek (który powinien by zatem
atrybutem dla przyimka)
ę
ą
VP -> V
VP -> V NP
PP -> Prep NP
ę
ą
ć
ą
Odpowied – nadmiarowo , czyli tworzenie rozbiorów
konstrukcji niepopoprawnych:
ź
ś
*He took.
*He slept the cat.
*She disappeared the elephant.
*na stołem *w worka
frazy przyimkowe s wymagane przez czasowniki i wtedy
musimy zna zarówno przypadek jak i sam przyimek
(np. prosi o co , czyli przyimek ‘o’ i fraza w bierniku `o’+NPacc,
ale nie prosi o czym (‘o’ + NPloc) *prosi o bajce
*prosi z bajk
ani nie prosi z co (‘z’+NPacc)
czyli prep (form, case), np. prep(‘o’, acc) -> ‘o’
ć
ć
ą
ć
ć
*On spał kota.
ś
ć
ś
ć
ę
ć
CFG z atrybutami, zapis wymaga
ć
CFG z atrybutami, zapis wymaga , I
Wprowadzenie podziału na klasy, w zale no ci od typu i
liczby wymaga :
Ŝ
ś
ń
Przyimek z mo e ł czy si z frazami rzeczownikowymi w
dopełniaczu lub narz dniku:
ę
Ŝ
ą
ć
ś
ć
1) czasowniki bez wymaga (tylko podmiot), np. i , biec, sta
ć
ń
ę
PP (Form, Case) -> Prep (Form, Case) NP (Case,Gender, Number,Person)
VP(Gender,Num,Person,Tense) -> V1(Gender, Num,Person,Tense)
V1(masc, sg,3rd,past) -> szedł
2) czasowniki z wymaganiem frazy rzeczownikowej w
bierniku, np. widzie
ć
Prep (z, gen) -> z
Prep (z, ins) -> z
(gen czyli genetive czyli dopełniacz)
(ins czyli instrumental czyli narz dnik)
ę
VP(Gender,Num,Person,Tense) ->
V2(Gender, Num,Person,Tense) NP(acc,Gender,Numb,Person)
V2(fem, sg,3rd,past) -> widziała
z domu, z domem, z moim domem ...
itd.
* Warto ci argumentów pisane od wielkiej litery – zmienne, zaczynaj ce
si od małej litery - stałe
ś
ą
ę
Wa ne!
Ŝ
CFG z atrybutami, zapis wymaga II
Nie dzielimy czasowników na klasy, ale zapisujemy odpowiednie
informacje w słowniku (leksykalizacja gramatyki)
ustalamy maksymaln liczb wymaga (3-4), tu przyjmiemy 3
ustalamy symbol dla pustego wymagania (null)
ą
ę
ń
zapis wymaga II, cd
Aby wprowadzi nowy typ wymaga nale y:
1. wprowadzi nazw wymagania (wx) i u y jej w
definicji odpowiedniego czasownika
2. dopisa regule definiuj c , co rozumiemy przez dane
wymaganie, czyli reguł Arg(wx) -> ….
ć
ń
ć
ę
Ŝ
ć
VP (Gend,Num,Pers,tense) ->
V (Gend, Num,Pers,Tense,W1,W2,W3)
Arg (W1) Arg (W2) Arg (W3)
{Arg - argument - dopełnienie/wymaganie}
Arg(null) -> ε
V(masc, sg,3rd,past, null, null, null) -> szedł
Arg(np-acc) -> NP(acc,gend, numb,pers)
V(fem, sg,3rd,past, np-acc, null, null) -> widziała
Ŝ
ą
ć
ą
ę
Wymagnie b d ce fraz rzeczownikow w celowniku
1) Nazwa wymagania: np-dat
ę
ą
ą
ą
Ŝ
u ycie dla czasownika da (da kogo/co? komu/czemu?)
V(fem, pl, 3, past, np-acc, np-dat, null) -> dały
ć
ć
2) Arg(np-dat) -> NP(dat, Gend, Num,Pers,)
2
zapis wymaga II, cd
zapis wymaga II, cd.
cd.
Dla dopuszczenia podmiotu przeplecionego z dopełnieniami traktujemy podmiot
tak e jako wymaganie (argument), które zapisujemy na pierwszej pozycji (tu
jako np-nom3fsg, bo wtedy trzeba te pami ta o uzgodnieniu podmiotu i
orzeczenia)
Aby dopu ci swobodny szyk definiujemy dodatkowe reguły:
ś
ć
Ŝ
a) VP(Gend,Num,Pers,Tense) ->
Ŝ
ę
ć
V(gend, Num,Pers,Tense,W1,W2,W3) Arg(W2) Arg(W1)Arg(W3)
b) VP(gend,num,pers,tense) -> Arg(W1)
V(Gend, Num,Pers,Tense,W1,W2,W3)
Arg(W2) Arg(W3) ...
Je li
V(masc, sg,3rd,past, np-acc, np-instr, null) -> wbił
to reguła a) pozwala na analiz frazy: wbił młotkiem gwó d
a reguła b)
gwó d wbił młotkiem
ś
ź
ź
ę
ź
ź
VP(gend,num,pers,tense) -> V(gend, num,pers,tense,w1,w2,w3)
Comp(w1) Comp(w2) Comp(w3)
Comp(null) -> ε
V(masc, sg,3rd,past, np-nom3msg, null, null) -> szedł
Comp(np-nom) -> NP(nom, Gend, Numb, Pers)
Comp(np-acc) -> NP(acc, Gend, Numb, Pers)
V(fem, sg,3rd,past, np-nom3fsg, np-acc, null) -> widziała
Elementy opcjonalne (modyfikatory)
Opis frazy przymiotnikowej
Frazy mo na (teoretycznie) dowolnie rozszerza o elementy
opcjonalne, przy czym typ tych elementów zale y od typu frazy:
Ŝ
ć
Ŝ
AdjP -> Adj
AdjP -> Adj AdjP
AdjP -> AdvP AdjP
AdvP -> Adv | Adv AdvP
AdjP -> Adj PP
PP -> Prep NP
AdjP -> AdjP Conj AdjP
AdjP -> AdjP Coma AdjP
Conj -> i | lub
Coma -> ,
– frazy rzeczownikowe mog by modyfikowane frazami
ą
ć
przymiotnikowymi:
mały biały pies
gładki szeroki skórzany pas
– frazy czasownikowe i przymiotnikowe mog by
modyfikowane frazami przysłówkowymi:
spał niespokojnie
latał niebezpiecznie wysoko
przera liwie gło no
bardzo mało zabawny
ą
ć
ś
biały
biały mały wesoły
bardzo biały
biały z połyskiem
biały i ciemno niebieski
biały, zielony i br zowy
ą
ź
(nie rozwa amy tu ogranicze semantycznych)
Ŝ
ń
Opis frazy przymiotnikowej
AdjP (C, G, N) -> Adj (C, G, N)
biały
AdjP (C, G, N) -> Adj (C, G, N) AdjP (C, G, N)
AdjP (C, G, N) -> AdvP AdjP (C, G, N)
bardzo biały
AdvP -> Adv | Adv AdvP
AdjP (C, G, N) -> Adj (C, G, N) PP (F,C1)
biały z połyskiem
AdjP (C, G,N) -> AdjP (C, G, N) Conj AdjP (C, G, N)
AdjP(C,G,N) -> AdjP (C, G, N) Coma AdjP (C,G,N)
biały i ciemno niebieski,
biały, zielony i br zowy
ą
Zapis modyfikacji
Fraza rzeczownikowa modyfikowana fraz przymiotnikow
ą
ą
NP (C, G, N, P) -> AdjP (C,G, N) NP (C,G,N,P)
NP (C, G, N, P) -> NP (C,G,N,P) AdjP (C,G, N)
Problem: wiele rozbiorów
mały piec kaflowy: [mały piec] kaflowy
mały [piec kaflowy]
Conj -> i | lub
Coma -> ,
3
Elementy opcjonalne
(modyfikatory), 2
Zapis modyfikacji
rzeczownikowe i czasownikowe mog by
modyfikowane frazami przyimkowymi:
bułka z masłem
czytał z uwag
pojechał w pi tek, po porannym spotkaniu, przed
obiadem
sukienka ze sztruksu w niebieskie pasy z krótkimi
r kawkami z białymi mankietami
frazy
ą
ć
Fraza rzeczownikowa modyfikowana fraz przyimkow
ą
ą
NP (C, G, N, P) -> NP (C,G,N,P) PP (Form, C1)
ą
ą
ą
ą
VP ( G, N, P, W1, W2, W3) ->
VP ( G, N, P, W1, W2, W3) PP (Form, C1)
ę
Fraza czasownikowa modyfikowana fraz przyimkow
frazy rzeczownikowe mog by modyfikowane zdaniami
wzgl dnymi:
człowiek, który wie wszystko
to, co zostało po wczorajszym przyj ciu
ą
ć
ę
ę
Parsowanie,
Parsowanie, gramatyki
bezkontekstowe
Konstrukcje wspó
współrz dne
Wszystkie typy konstrukcji mo na ł czy spójnikami
tworz c konstrukcje współrz dne (czasem mo na ł czy te
konstrukcje ró nych typów)
Ŝ
ą
ć
Ŝ
ą
ć
Ŝ
CFG cz sto u ywane do opisu struktury frazowej, a
zwłaszcza kolejno ci składników
Potrzebna pami : stos (czasami stos stosów) o wielko ci
zale nej od stopnia zagnie d enia rekurencji
ę
Ŝ
ś
ę
ą
Ŝ
ś
ę
ć
Ŝ
Ŝ
Ŝ
ś
– idzie i piewa
– goło i wesoło
– do ta ca i do ró a ca
ń
Ŝ
Czas parsowania: w ogólnym przypadku O(n3)
Ograniczenia: np. anbncn (gramatyka kontekstowa)
ń
– po południu i wieczorem
Parsowanie gramatyk CFG,
podej cie toptop-down
S -> NP VP | Aux NP VP | VP
NP -> Det Nom | PropNoun
Nom -> Noun Nom | Noun
VP -> V | V NP
Det -> a | this | that
Noun -> flight | I | morning book
Aux -> does
V -> prefer | book
Book that flight.
Top-down.ps
Adobe Acrobat
nie mo e by reguł z lewostronn rekurencj
S -> NP VP | Aux NP VP | VP
NP -> Det Nom | PropNoun
Nom -> Noun Nom | Noun
VP -> V | V NP
Det ->
a | this | that
Noun -> flight | I | morning | book
Aux -> does
V ->
prefer | book
ą
ę
ć
ą
ć
bottom-up.ps
Adobe Acrobat 7.0
Document
ą
Ŝ
Book that flight.
Document
rozpoczynamy od symbolu pocz tkowego i „rozwijamy” reguły
analiza tylko tych reguł, które maj szans by zastosowane
sugerowanie hipotez niezgodnych z analizowanym ci giem słów
Parsowanie gramatyk CFG,
podej cie bottomottom-up
ą
ą
staramy si znale analizy poszczególnych elementów ci gu wej ciowego i
„sklejamy” je
formułowanie hipotez zgodnych z danymi (lokalnie)
sugerowanie hipotez bezsensownych w kontek cie
problemy z rekurencj
ę
ź
ć
ą
ś
ś
ą
4
Parsowanie gramatyk CFG,
podej cie toptop-down with bottombottom-up filtering
Problemy dla analizy toptop-down
S -> NP VP | Aux NP VP | VP
NP -> Det Nom | PropNoun
Nom -> Noun Nom | Noun
VP -> V | V NP
Det -> a | this | that
Noun -> flight | morning | book
Aux -> does PropNoun -> I
V -> prefer | book
Nie mo na u ywa gramatyk, w których pierwszy symbol
prawej strony jest taki sam jak symbol po lewej stronie
produkcji:
Ŝ
Ŝ
ć
struktury rekurencyjne
NP -> NP PP (lot do Pary a)
Book
that flight
Noun/Verb Det Noun
Ŝ
VP -> VP PP (wystartował w pi tek po południu)
ą
Nie rozpatrujemy reguł, dla których nie istnieje takie dalsze
rozwini cie, które da w wyniku pierwszy symbol z
analizowanego wej cia
dla ka dej kategorii sporz dzamy odpowiednia list typów słów
S
Det, PropNoun, Aux,Verb
NP
Det, PropNoun
Nominal
Noun
VP
Verb
ę
ś
struktury współrzędne
S -> S Conj S (Piotr wyjechał do Krakowa, a Ania jest chora)
NP -> NP Conj NP (Ania i Piotr wyszli wcze niej)
ś
Problemy z opisem przy u yciu CFG
Niejednoznaczno ci - wielo rozbioró
rozbiorów.
Najcz stsze przyczyny niejednoznaczno ci:
– frazy przyimkowe mog by doł czane na ró nym poziomie, np.
ę
ś
ą
ć
ą
ą
ę
Problemy z opisem CFG, cd
Ŝ
spytaj o [samolot z Krakowa do Warszawy w pi tek ]
spytaj [ o samolot z Krakowa do Warszawy ] w pi tek
Tradycyjny podział na fraz podmiotu i orzeczenia dla
polskiego ma mały sens:
– Jana Piotr zobaczył od razu.
Nieci gło ci:
– Jan si znowu bardzo du o spó nił
– Starego nie lubi chleba
– Ty tego nie wiedział!
ę
ś
ą
Ŝ
ą
ą
ź
ę
– ró ne interpretacje koordynacji:
Ŝ
Ŝ
ę
ś
[ [ksi ka lub film] o impresjonistach ]
[ksi ka „Sztuka w zarysie”] lub [ film o impresjonistach]
ą
ą
Ŝ
Ŝ
– ró ny podział fraz rzeczownikowych (na ogól niepotrzebne):
Ŝ
lot z [ Pary a do Warszawy]
[ lot z Pary a ] do Warszawy
Ŝ
NP -> NP PP
Próby zaradzenia problemom:
– droga teoretyczna- silniejsze formalizmy
– droga praktyczna - ograniczanie rekurencji, „r czne”
sterowanie
ę
Ŝ
Parsowanie powierzchniowe
(shallow parsing)
parsing)
Hierarchia gramatyk/j zykó
zyków
(Chomsky,
,
1959)
Chomsky
Wykorzystywanie gramatyk regularnych (implementowanych
jako automaty) do rozpoznawania niektórych elementów
tekstów, np.
regularna
(Regular)
X → α Y gdzie X,Y s symbolami nieterminalnym, α ci giem
ą
ą
terminali; Y mo e by pomini te
Ŝ
rozpoznawanie granic fraz, przykład NG (noun group)
– zaimek, okre lenie czasu (np. yesterday), data
ć
ę
bezkontekstowa
(Context-free)
X → γ, X -symbol nieterminalny, γ ci g dowolnych symboli
kontekstowa
(Context-sensitive)
αXβ
β → αγβ, X - symbol nieterminany, α,β,γ ci gi symboli
ś
NG -> Pronoun | Time-NP | Date-NP
ą
– ‘head noun’ poprzedzone opcjonalnie przedimkiem), frazy z form -ing,
ą
oraz ‘kompletne frazy przedimkowe’, np. only five, this
ą
terminalych i nieterminalnych, γ nie mo e by pusty
Ŝ
NG -> (DETP) (Adjs) HdNns | DETP Ving HdNns |
DETP-CP (and HdNns)
( powierzchniowo analizy wida po tym, e nie sprawdzamy adnych uzgodnie ,
nie wi emy analiz poszczególnych fragmentów)
ś
ą
ć
ć
Ŝ
Ŝ
ć
rekurencyjnie przeliczalna
(Turing Equivalent, Type 0)
α → β ; α,β ci gi symboli terminalych i nieterminalnych
ą
ń
Ŝ
Rozpoznanie liczb pisanych słownie, dat, nazw własnych, ...
5
J zyki regularne i metody ich
rozpoznawania/generowania
Wyra enia regularne
J zyk regularny to j zyk generowany przez wyra enie regularne
(wykorzystanie: Perl, emacs, Word, sed, awk, grep, vi, netscape)
Wyra enie regularne to:
ę
ę
Ŝ
Przykłady j zyków regularnych:
ę
Ŝ
a) wyra enie stałe φ (j zyk pusty |φ
φ|)
b) wyra enie Λ (j zyk składaj cy si ze słowa pustego Λ)
c) wyra enie b d ce pojedyncz zmienn y1,..., yn
d) je eli U i W s wyra eniami regularnymi opisuj cymi j zyki |U| i
|W|, to (U⋅⋅W), (U∪
∪ W) i (U)* s wyra eniami regularnymi
opisuj cymi odpowiednio j zyki |U||W|, |U|∪
∪ |W| i |U|*
ka de wyra enie regularne mo na uzyska z wyra e opisanych w a)c) za pomoc sko czonej liczby operacji z d).
ę
Ŝ
ę
ę
Ŝ
ą
ę
Ŝ
ą
ą
j zyk owcy: be! bee! beee! beeee! …
gramatyka:
S -> beE
E -> ! E -> eE
(zapis: E -> ! |eE )
wyra enie regularne: bee*!
(be+!)
ę
Ŝ
ą
ę
Ŝ
ą
Ŝ
ą
ą
Ŝ
ę
ą
liczby całkowite
gramatyka:
S -> 0S | 1S | … | 9S | 0 | 1 | 2 | … | 9
ń
Ŝ
Ŝ
Ŝ
ć
Ŝ
([0..9]+)
wyra enie regularne [0..9][0..9]*
ń
Ŝ
ą
(* - oznacza 0 lub wi cej razy)
ę
Jakie j zyki s regularne?
Angielski nie jest j zykiem regularnym
Chomsky (1956,1957), Partee (1990)
The cat likes tuna fish.
The cat the dog chases likes tuna fish.
The cat the dog the rat bit chases likes tuna fish.
The cat the dog the rat the elephant admired bit chases likes tuna fish.
Je eli L jest j zykiem regularnym, to istniej ci gi symboli
≥0
teminalnych x,y,z, takie, e y ≠ ε i xynz ∈ L dla n≥
Ŝ
ę
ą
ą
Ŝ
np. anbn nie jest regularny
(nie mo na „pompowa ” ani ak, ani bk ani (ab)k
Ŝ
ć
(jest to j zyk bezkontekstowy:
ę
S-> a S b
S-> ε )
(the + noun)n (transitive verb)n-1 likes tuna fish - L1, nie jest regularny
J zyki naturalne nie s regularne, w szczególno ci nie jest
regularny angielski.
ę
ą
ś
Idea dowodu: budujemy j zyk regularny L2, którego przeci cie z
j zykiem angielskim da w wyniku L1. Poniewa przeci cie dwóch
j zyków regularnych jest regularne, a L1 nie, oznacza to, e angielski
te nie jest regularny.
ę
ę
ę
Ŝ
ę
ę
Ŝ
Ŝ
– L2 = zbiór wyra e A* B* likes tuna fish, gdzie
Ŝ
ń
– A = { the cat, the dog, the elephant, the rat, ...}
– B = { chased, admires, bit, ate ...}
Do jakiej klasy nale
naturalne?
j zyki
Dlaczego CFG ?
Długa dyskusja o tym, do której kategorii nale poszczególne
j zyki naturalne. Wiele „dowodów” na to, e angielski jest
j zykiem kontekstowym.
Ŝ
ę
ą
wyra enia regularne - zbyt słabe (ograniczenia: np. anbn),
zalety:
Ŝ
Ŝ
– Wzajemna odpowiednio :
ś
ć
ę
gramatyki regularne ↔ wyra enia regularne ↔ FSA
Ŝ
Obecny stan wiedzy:
– składnia i morfologia angielskiego jest bezkontekstowa
– szwajcarski dialekt niemieckiego ma składni kontekstow
– morfologia j zyka Bambara (Mali) kontekstowa
ę
ś
ą
ę
Co nie znaczy, e j.naturalny daje si łatwo opisa za pomoc
gramatyki bezkontekstowej ,ani e jego podzbioru nie mo na
opisywa za pomoc gramatyk regularnych
Ŝ
ę
ć
ę
ć
ć
ś
ć
ci gu wej ciowego)
ą
ś
gramatyki kontekstowe, gramatyki klasy 0:
– łatwo wyra a si ró ne skomplikowane własno ci j zyka,
Ŝ
ę
Ŝ
ś
ę
ą
Ŝ
ć
parsowania:
Pami - stała
Czas parsowania liniowy (~ długo
– Efektywno
– nieefektywne obliczeniowo.
ą
6
Dlaczego jednak cz sto
wyra enia regularne?
Automaty
Istnieje wzajemnie jednoznaczna odpowiednio mi dzy
gramatykami regularnymi a automatami sko czonymi
ć
ś
ę
ń
Istniej efektywne metody sprawdzenia czy słowo nale y do
j zyka regularnego – automaty sko czone.
ą
Ŝ
ń
ę
Automat sko czony
Urz dzenie sekwencyjne mog ce znajdowa si w sko czonej
liczbie stanów, czytaj ce symbol po symbolu. Przeczytanie
symbolu zmienia stan urz dzenia na inny i przesuwa ta m
wej ciow o jedn klatk na lewo.
ń
ą
ć
ą
ń
ę
ą
ą
ś
ą
ą
ś
ę
ę
Automat sko czony zupełny (niekoniecznie deterministyczny) automat Rabina Scotta (ka dy automat sko czony jest
równowa ny deterministycznemu automatowi Rabina-Scotta).
ń
ń
Ŝ
Ŝ
Definicja automatu
Przykł
Przykład automatu
Automat sko czony to pi tka < Q, ∑, δ, qs, Qf >, gdzie
ń
j zyk owcy: be! bee! beee! beeee! …
gramatyka: S -> beE
E -> ! E -> eE
wyra enie regularne: bee*!
(be+!)
automat: Q={q0,q1,q2,q3} ∑ ={a,b,c,...,z, !,?}
e
b
e
!
q0
q1
q2
q3
ą
ę
Q - sko czony zbiór stanów q0,q1, ... qn
Σ sko czony zbiór symboli wej ciowych (alfabet)
∈Q
qs - stan pocz tkowy∈
Qf ⊆ Q zbiór stanów ko cowych (akceptuj cych)
δ(q,i) tablica przej Q × Σ -> Q ; dla danego symbolu
wej ciowego i stanu warto ci jest stan automatu
ń
ń
Ŝ
ś
ą
ń
ś
ą
ć
ś
ś
ą
(je li alfabet jest du y (tu wszystkie litery) dla zwi kszenia czytelno ci
pomija si cz sto przej cia dla symboli uniemo liwiaj cych doj cie do
stanów akceptuj cych)
ś
Ŝ
ę
ę
ę
ś
ś
Ŝ
ą
ś
ą
Przykł
Przykład automatu, 2
Transducery
Formy słowa owca: owca, owcy, owcy, owc , owc , owcy
gramatyka: S -> owcE
ę
ą
E -> a | y | ę | ą
wyra enie regularne:
automat:
ę
ń
ą
ę
Ŝ
ą
Ŝ
ą
ą
ś
ą
ę
ą
q2
q3
a
ę
owc
q0
Transducery to automaty sko czone, na łukach których
znajduj si pary symboli. Dla ka dego przej cia przez automat
otrzymujemy wiec par powi zanych ze sob słów. Transducer
wi e ze sob dwa j zyki regularne.
ę
owc[ay ]
Ŝ
q4
Prosty przykład zamiana symboli 0 i 1 (tzn. 0110 -> 1001)
y
q1
1:0
q5
q0
ą
0:1
(tu zakladamy, e mamy ju rozpoznany pocz tek i koniec słowa)
Ŝ
Ŝ
ą
7
Transducery
Automaty, rozszerzenia
zamiana ci gów ‘ab’ na ‘x’
? oznacza dowolny, nie wymieniony na innych łukach symbol
pojedynczy symbol na łuku oznacza, e go kopiujemy,
ą
Ŝ
np. a oznacza a:a
Automat z wyj ciem:
Automat Moore’a nad alfabetem wej ciowym T i
wyj ciowym Y nazyamy trójk <S , M, G>, gdzie S sko czony zbiór stanów, M - funkcja przej cia S x T -> S ,
G: S -> Y.
ś
ś
ś
ę
ń
Słowo:
aabaaabb
Wej cie:
a a
b a a a
b b
Ci g stanów: 0 1 (1) 2 0 1 1 (1) 2 0 0
ś
ś
Automat ze stosem
automat z ta m wej ciow i ta m (stosem) roboczym
ś
ą
ś
ą
ś
ą
ą
Wyj cie:
a (a) x a a (a) x b
ś
Maszyna Turinga
automat z ta m wej ciow prawostronnie nieograniczon i
obustronnie nieograniczon ta m robocz , która mo e by
przesuwana w obu kierunkach
ś
axaaxb
ą
ś
ą
ą
ą
ś
ą
ą
Ŝ
ć
(n) oznacza cie k , z której si trzeba
było wycofa
ę
ś
ę
Ŝ
ć
J zyki formalne
j zyk (gramatyka)
ę
problem x ∈ L
rozpoznawany przez
Dzi kuj za uwag .
ę
regularny
automat Rabina-Scotta
rozstrzygalny
(FSA)
bezkontekstowy automat ze stosem
rozstrzygalny
(PSG)
kontekstowy dwuta mowa maszyna Turinga rozstrzygalny
(TAG)
o ograniczonej długo ci ta my
ę
ę
ś
ś
ś
rekurencyjnie dwuta mowa maszyna Turinga nierozstrzygalny
przeliczalny
(ATN, HPSG)
ś
8