1 In ynieria lingwistyczna 2. Formalny opis j zyków
Transkrypt
1 In ynieria lingwistyczna 2. Formalny opis j zyków
In ynieria lingwistyczna 2. Formalny opis j zykó zyków naturalnych. Agnieszka Mykowiecka Instytut Podstaw Informatyki, PAN [email protected] Gramatyki formalne. Składnia. Morfologia. materiały z wykładów na stronie: http:\\www.ipipan.waw.pl\~agn\inl.htm ź pa dziernik, 2005 1 pa dziernik, 2005 2 ź Tokenizacja Tokenizacja Najcz ciej wyró niane typy elementów tekstu, czyli klasy tokenowe to: ci g małych liter poprzedzonych wielk liter , np. Kraków, ci g składaj cy si tylko z wielkich liter, np. PZU, ci g małych liter, np. dom ci g liter małych i wielkich, np. PeKaO ci g cyfr, ci g cyfr z wewn trzn kropk lub przecinkiem, data, znak interpunkcyjny, tokeny charakterystyczne dla okre lonych zastosowa , np. tag j zyka HTML, adress e-mail, adres strony www. Ŝ pierwszym zadaniem jest stwierdzenie z jakimi słowami (i innymi elementami tekstu) mamy do czynienia. ę ś ą 20.10.2001 Jerzy K. wrócił do Jeleniej Góry. Mógłby po prostu zadzwoni . ą ą ś ć ą ą ę ą ą Zadanie tokenizatora: – identyfikacja podstawowych elementów tekstu – ew. podział na zdania ą ą ę ą ą ś ń ę pa dziernik, 2005 3 ź pa dziernik, 2005 4 ź Słowotwó owotwórstwo Morfologia - opis sł słów Wiele słów pochodzi od innych, mo na by zatem nie umieszcza ich w słownikach, ale reguły słowotwórcze nie s wcale takie regularne: Ŝ Morfologia - nauka o budowie słów z morfemów: ć – temat (stem) - no nik znaczenia ś – przed- i przyrostki (affixes) - no niki cech gramatycznych lub ą ś zmiany znaczenia fleksja (inflectional morphology) uzyskiwanie form o znaczeniu tematu mog cych pełni okre lone funkcje gramatyczne słowotwórstwo (derivational morphology) np. zebra -> zebranie ą ć A writer is someone that writes, and a stinger is something that stings. But finger don’t fing and ... haberdashers don’t haberdash. Richard Lederer, Crazy English Pisarz to kto kto pisze, k liwa uwaga k sa, ale palec nie palcuje, ... ś ą ś ą ś pali - palacz , czyta - czytacz ć ć ć chodzi - chodzenie - chód, biega - bieganie czeka - czekanie - czek (?!) ć ć - bieg ć pa dziernik, 2005 ź 5 pa dziernik, 2005 nie b dziemy si zajmowa Słowotwórstwem ź ę ę ć 6 1 Skł Składniki wyra e j zyka naturalnego - słowa Analiza morfologiczna Analiza morfologiczna to przypisywanie formie słowa jego formy podstawowej oraz zestawu warto ci cech gramatycznych typy słów – słowa funkcyjne: i, e ... – słowa „leksykalne”: ko , szuka ... – idiomy: ciemno cho oko wykol, drze koty ś Ŝ ń ć ć (form podstawowa dla rzeczowników i przymiotników jest forma mianownika liczby pojedynczej, dla czasowników bezokolicznik) ć frazy o znaczeniu nie b d cym funkcj znacze składników: ą ą ę ń ą Rozpoznawanie morfemów, np.koty -> kot +N +PL+nom metoda: kaskada FST - wyj cie z jednego jest wej ciem do kolejnego ś biały kruk, skrzynia biegów powi zania z innymi słowami ą szukać czego? ś ksiąŜka o czym? z czego? słownik: zbiór informacji o słowach i charakterystycznych dla nich zwi zkach z innymi słowami ą Do tematu analizy morfologicznej jeszcze wrócimy pa dziernik, 2005 7 ź pa dziernik, 2005 8 ź Cechy sł słów - kategoria skł składniowa Cechy gramatyczne sł słów Słowa mog mie wiele form ró ni cych si warto ciami cech gramatycznych: Ŝ Słowa nale ce do danego j zyka naturalnego dziel si na wiele (ok. Ŝ ą ę ą ę kilkunastu) kategorii składniowych. Słowa z tej samej kategorii mog wyst powa w zdaniach w tym samym miejscu (pomijamy tu sensowno ). ą ę ć ś ą ć ą ę ś – czasowniki (liczba, osoba, czas) [number, person, time] – rzeczowniki (przypadek, liczba) [case, number] – przymiotniki (przypadek, rodzaj, liczba, stopie ) ć Najwa niejsze kategorie składniowe to: Ŝ ń ś – czasowniki ( pi, daje, ...) – rzeczowniki (przypadek, dom, szcz cie, ...) Verbs Nouns – przymiotniki (wesoły, ...) Adjectives – przysłówki (wesoło, ...) Adverbs – przyimki (na, pod, ...) Prepositions Numerals ś ę [case, gender, num deg] [deg] – przysłówki (stopie ) ń – liczebniki (dwa, sto pi ę ć , ...) Słowa mog te mie własne (niezmienne) warto ci cech: Ŝ ą ć ś – rzeczowniki: rodzaj – czasowniki: tryb, aspekt – spójniki podrz dne (który, poniewa , ...) ę Ŝ – spójniki współrz dne (i, lub, oraz, ...) ... Conjunctions ę pa dziernik, 2005 9 ź Cechy gramatyczne sł słów pa dziernik, 2005 10 ź Cechy gramatyczne sł słów - rodzaj number [liczba] singular (pojedyncza), plural (mnoga); gender [rodzaj] case [przypadek] nominative (mianownik), genetive (dopełniacz), dative (celownik), accusative (biernik), instrumental (narz dnik), locative (miejscownik), vocative (wołacz); ń masc (m ski), fem ( e ski), neut (nijaki), hum-masc (m skoosobowy) - faceci nonhum-masc (niem skoosobowy) – psy, kobiety, stoły Ŝ ę ę ę person [osoba ] 1st (os. 1), 2nd (os. 2), 3rd (os.3) ę Dodatkowo warto wprowadzi podział rodzaju m skiego na: hum-masc m1 (facet, lekarz) anim-masc m2 (kot, robak) inanim-masc m3 (stół, ołówek) ć degree [stopie ] positive ń (równy), comparative (wy szy), Ŝ superlative (najwy szy) Ŝ aspect [aspekt ] imperfect (niedokonany), perfect (dokonany) ę negation [negacja] affirmative (twierdzenie), negative (zaprzeczenie) time [czas] pa dziernik, 2005 ź present (tera niejszy), past (przeszły), future (przyszły) ź ... 11 pa dziernik, 2005 ź 12 2 Skł Składniki wyra e j zyka naturalnego - frazy Skł Składnia wiedza o sposobie łączenia słów we frazy, a fraz w zdania • Frazy (phrases) to spójne składniowo i semantycznie ci gi słów/fraz (zdania, składaj ce si z fraz, tak e s frazami). ą Potrzeba informacji składniowych: ą – analiza i korekta gramatyczna, ń – analiza pyta do baz danych, – generowanie wypowiedzi, tłumaczenie. Istniej ce opisy formalne j zyka polskiego: ą Ŝ ą Frazy zbudowane s na ogół wokół jednego słowa – elementu głównego, okre laj cego cechy frazy widoczne na zewn trz, (te cechy to na przykład rodzaj i przypadek) podział fraz w zale no ci od typu elementu głównego: ą ś – wyszukiwanie informacji, ę ą ą Ŝ ś – rzeczownikowe ę – przymiotnikowe ń Szpakowicz, S.: Formalny opis składniowy zda polskich, UW, 1986 widzi ski, M.: Formalna gramatyka j zyka polskiego, UW, 1992 Przepiórkowski, A., A. Kup c, M. Marciniak, A. Mykowiecka, Formalny opis j zyka polskiego w formalizmie HPSG, EXIT, 2000. Ś – przysłówkowe ń ę – przyimkowe ś – czasownikowe ę pa dziernik, 2005 – liczebnikowe 13 ź pa dziernik, 2005 Frazy rzeczownikowe, NP 14 ź Frazy przyimkowe, PP dom najstarszy dom w okolicy dom, którego dach pomalowany był na niebiesko najwi ksza ulewa od czasu, kiedy jego dziadek, zmuszony przez rodzin ony, przeprowadził si do tego miasteczka w domu z szybkim napastnikiem nale cym do dru yny przeciwnej do punktu, z którego ju nie mógł si wycofa Ŝ ą Ŝ Ŝ ę ć ę ę Ŝ ę koordynacja (frazy przyimkowe współrz dnie zło one): – do smutku i alu lub do czarnej rozpaczy – w góry lub nad morze Ŝ ę koordynacja (frazy rzeczownikowe współrz dnie zło one): kobieta, dziecko i pies ani wznoszenie błagalnych okrzyków ani bicie głow w mur Ŝ Ŝ ę ą pa dziernik, 2005 15 ź pa dziernik, 2005 Frazy liczebnikowe, NumP trzyna cie dwadzie cia tysi cy czterysta trzy i pół godziny pierwsi dwaj chłopcy albo pi ciu albo tylko dwóch Frazy przymiotnikowe, AdjP biały najbardziej zm czony z całej dru yny wi kszy i bielszy ni przed rokiem ś ś 16 ź ę Ŝ ę ę Ŝ ę koordynacja (frazy przymiotnikowe współrz dnie zło one): Ŝ ę liczebniki porz dkowe (pierwszy, trzysta trzeci ) s zwykle traktowane jako przymiotniki ą ą zarówno pewny i gł boko prze wiadczony o swej racji i w istocie najbardziej zaci ty z nas wszystkich, jak te zaciekle walcz cy o swoje prawa ę ś ę Ŝ ą pa dziernik, 2005 ź 17 pa dziernik, 2005 ź 18 3 Frazy przysł przysłówkowe, AdvP szybko szybciej ni ktokolwiek mógł przypuszcza Frazy czasownikowe, VP kupił obraz wierz , e o tym nie zapomnisz wczoraj bez adnego namawiania przewiózł fotel samochodem z mieszkania ciotki do pracowni za 200 zł Ŝ ć koordynacja (frazy przysłówkowee współrz dnie zło one): ę Ŝ Ŝ Ŝ koordynacja (frazy czasownikowe współrz dnie zło one): Ŝ ę ładniej, a tak e bardziej elegancko wczoraj lub jeszcze dawniej zarówno niewygodnie, jak te z cał pewno ci ę Ŝ kupił u ywany samochód, naprawił go i sprzedał za dwukrotnie wy sz cen Ŝ Ŝ ą ę Ŝ ą ą ś pa dziernik, 2005 19 ź pa dziernik, 2005 Podstawowe problemy skł składniowe Podstawowe problemy skł składniowe Uzgodnienia (~równość cech) 20 ź Wymagania czasownika: (typ frazy, przypadek frazy rzeczownikowej) podmiot orzeczenie: (rodzaj, liczba, osoba) – szukam miejsca (czego? fraza rzeczownikowa w dopełniaczu), – Piotr idzie *id ą – chc spa (co? fraza czasownikowa bezokolicznikowa), ę ale: – Piotr i Maria id . Idzie / id Piotr i Maria. – Pi ciu chłopców przyszło. Dwaj chłopcy przyszli. ą ę ę Ŝ – daj mu cukierki ę ę ć – mówi o pogodzie, mówi , e pada ą przyimka: (przypadek) – w domu rzeczownik przymiotnik: (przypadek, rodzaj, liczba) – na dom /na domu – białym krukiem (*kruka) liczebnika: – dwóch chłopców przyszło, dwaj chłopcy przyszli – pi ciu chłopców, pi ę pa dziernik, 2005 21 ź ę ć dziewczynek, pa dziernik, 2005 22 ź Kolejne problemy Problemy skł składniowe, cd. cd. Szyk (ew. „przesunięcia”) – Do niego Jan szedł po raz drugi. Negacja Jan chciał kupić ksiąŜkę. Jan nie chciał kupić ksiąŜki / *ksiąŜkę. – I looked up his grade. I looked his grade up. ZaleŜności odległe – Kogo chciałabyś, aby Piotr zaprosił? – to ten, którego musiałbyś poprosić o zgodę Jan nikogo nie oszukał. *Jan nikogo oszukał. Nieciągłość fraz – Smutny czekał go koniec. Koordynacja (struktury współrzędne) Elipsy (brak wymaganych słów bądź fraz) frazy tego samego typu: koń i osioł; mały i zadziorny – dialogi: Kogo widzisz? - Piotra [widzę]. frazy róŜnego typu: – koordynacja róŜnego typu składników czy elipsa? frazy „niepełne”: pa dziernik, 2005 ź ufnie i bez strachu Pittsburgh prowadzi 4:0 ale Detroit [prowadzi] tylko 3:1. złapał i ze złością odrzucił piłkę – pro-drop (pominięcie zaimkowego podmiotu) (to dość proste do analizy) 23 [Ja] Zdałam egzamin. pa dziernik, 2005 ź 24 4 Skł Składnia Analiza skł składniowa wiedza o sposobie łączenia słów we frazy, a fraz w zdania rozpoznanie fraz i ich powiązań składniowych pozwala na ustalenie wartości cech gramatycznych dla generowanego tekstu, a więc rozstrzygnięcie wielu niejednoznaczności morfologicznych np. Analiza składniowa: rozpoznanie fraz i ich powiązań składniowych (zbudowanie rozbioru syntaktycznego) mała dziewczynka dała bukiet fiołków mamie -> [mała mod dziewczynka] podmiot dał słonia mamie -> [dać] 3os,cz. przeszły [słoń]dopełniacz lub biernik [mama]celownik dać [dać] 3os,cz. przeszły [słoń]biernik [mama]celownik [bukiet fiołkówmod] dopełnienie [mama] dopełnienie pa dziernik, 2005 ź 25 pa dziernik, 2005 Reprezentacja struktury syntaktycznej (skł (składniowej) Analiza skł składniowa, problemy 26 ź Dwa typy fraz: wymagania składniowe (mogą być opisane w słownikach) i modyfikatory, które są praktycznie dowolne Drzewo (w sensie teorii grafów) odzwierciedlających zbudowane według jednej z dwóch strategii: – Jan widzi kota. – Mój starszy brat Jan, który od niedawna mieszka w Krakowie, struktura frazowa (constituency structure) idąc rano do pracy zwykle widzi czarnego kota siedzącego na murku naprzeciwko okna kuchni sąsiada. struktura zaleŜności funkcjonalnych (dependency structure) – zasadnicza relacja: head (governor) - dependent Niejednoznaczności składniowe, np. – powiązania (krawędzie) oznaczone nazwami funkcji pokazała siostrze Jana kwiaty syntaktycznych (Sb, Obj, ...) – struktura frazowa odzwierciedlona tylko pośrednio – [pokazać] [siostra Jana]dopełnienie [kwiaty]dopełnienie – [pokazać] [siostra]dopełnienie [Jana kwiaty]dopełnienie pa dziernik, 2005 ź 27 pa dziernik, 2005 Drzewo struktury frazowej Drzewo zale no ci ((DaimlerChrysler’s shares)NP (rose (three eights)NUMP (to 22)PP-NUM )VP )S pa dziernik, 2005 ź 28 ź 29 Daimler Chrysler’s shares rose three eights to 22 pa dziernik, 2005 ź 30 5 Formalny opis j zyka Formalny opis j zyka 1. Alfabet - dowolny zbiór symboli (T). Słowo - skończony (takŜe pusty-εε) ciąg symboli z alfabetu Słownik - zbiór wszystkich słów nad alfabetem T, (T*). 2. Gramatyka <V,T,S,P > V- alfabet (skończony zbiór symboli), T- podzbiór V (symbole terminalne), (V-T symbole nieterminalne) S - element V-T (symbol początkowy wyróŜniony nieterminalny), P - zbiór produkcji (reguł), czyli przyporządkowań z V* w V* Język L to dowolny podzbiór zbioru słów T*. Prosty przykład: Alfabet - {Ala, ma, Asa, As, Amadeusza, kota} Słowa: {Ala Asa ma, kota ma Asa, ma ma ma ....} Język L1= { Ala ma kota, Ala ma Asa, Ala ma Amadeusza} pa dziernik, 2005 31 ź słowo w wynika bezpośrednio ze słowa v, jeŜeli istnieje reguła gramatyki R, która zastosowana do słowa w przekształca go w v. (zapis: v -> w lub v ->R w) słowo w wynika pośrednio ze słowa v, jeŜeli istnieje ciąg reguł gramatyki R1 ... Rn, takich Ŝe v ->R1 v1 v1 ->R2 v2 ... vn-1 ->Rn vn, i vn=w ( v -> * w_ JeŜeli pierwsze słowo, od którego zaczniemy przekształcenia jest symbolem początkowym gramatyki (v=S) to ciąg reguł R1, .. Rn nazywamy wywodem w Λ ∪ T ∪ T× × T ∪ T× × T× × T ∪ ...) Język L to dowolny podzbiór zbioru słów T* (Λ (Język to zbiór generowanych przez gramatykę słów zawierających pa dziernik, 2005 32 wyłącznie symbole terminalne.) ź Analiza na skł składniki bezpo rednie, 1 Prosty przykł przykład 2: V ={Ala, ma, Asa, As, Amadeusza, kota, S, Nm, Nb, V} T ={Ala, ma, Asa, As, Amadeusza, kota} symbol początkowy - S produkcje: S -> Nm V Nb Nm -> Ala V -> ma Nb -> kota | Asa | Amadeusza WyróŜnienie zdań. Przyjmiemy dla uproszczenia kryterium ortograficzne zdanie to ciąg słów rozpoczynający się od wielkiej litery, kończący kropką (.!?) i zawierający jako element centralny formę czasownika lub składający się z kilku części, posiadających czasownikowy element centralny, np. – Jan idzie. – Kto to zrobił? – Podaj mi ksiąŜkę albo się przesuń. – Gdybym chciał, to Piotr musiał by mnie wysłuchać. pa dziernik, 2005 33 ź pa dziernik, 2005 Analiza na skł składniki bezpo rednie, 2 34 ź Analiza na skł składniki bezpo rednie, 3 WyróŜnienie frazy pomiotu i orzeczenia (to dla polskiego nie zawsze daje podział na dwie rozłączne spójne frazy, ale przyjmiemy to uproszczenie dla wygody) Mały brat Zosi podrzuca kolorową piłkę na ścieŜce w parku Mały brat Zosi podrzuca kolorową piłkę na ścieŜce w parku [Mały brat Zosi] fraza podmiotu (rzeczownikowa) [podrzuca kolorową piłkę na ścieŜce w parku] fraza orzeczenia (czasownikowa) Podział fraz na frazy składowe [Mały brat Zosi] [Mały brat] [ Zosi ] [Mały] [brat] [podrzuca kolorową piłkę na ścieŜce w parku] [podrzuca] [kolorową piłkę] [na ścieŜce w parku] [kolorową] [piłkę] [na] [ ścieŜce w parku] [ścieŜce] [w parku] [w] [parku] pa dziernik, 2005 ź 35 pa dziernik, 2005 ź 36 6 Elementy wymagane (dopeł (dopełnienia) Typy konstrukcji skł składniowych Dla niektórych konstrukcji (fraz) moŜemy wyróŜnić element, który moŜe (w sensie składniowym) zastąpić całą frazę Mały brat Zosi -> brat (bardzo) kolorową piłkę (w kropki) -> piłkę bardzo kolorową -> kolorową fraza rzeczownikowa fraza rzeczownikowa Niektóre słowa wymagają, by w skład tworzonej przez nie frazy wchodziła fraza (słowo) o ściśle określonych cechach morfosyntaktycznych (morfologicznych lub syntaktycznych): – przyimek wymaga, by następowała po nim fraza rzeczownikowa w określonym przypadku (przypadkach), np. przyimek ‘na’ wymaga frazy rzeczownikowej w bierniku lub miejscowniku *na (brak frazy wymaganej) * na morzem (fraza rzeczownikowa w celowniku) *na wysoko (fraza przysłówkowa) na głębokim morzu (fraza rzeczownikowa w miejscowniku) na spokojne morze (fraza rzeczownikowa w miejscowniku) fraza przymiotnikowa są teŜ konstrukcje, których Ŝaden element nie moŜe być uznany za ich reprezentanta, np. na dłoni Ŝe przyjdzie Jaś i Małgosia fraza przyimkowa zdanie ze spójnikiem podrzędnym fraza rzeczownikowa współrzędna * oznacza wypowiedzenia niepoprawne pa dziernik, 2005 37 ź pa dziernik, 2005 38 ź Elementy wymagane (dopeł (dopełnienia), 2 Elementy opcjonalne (modyfikatory) Czasowniki określają frazy, które są niezbędne do utworzenia poprawnego wyraŜenia, przy czym ten sam czasownik moŜe dopuszczać róŜne zestawy dopełnień), np. czasownik powiedzieć moŜe łączyć się z frazą rzeczownikową w bierniku, ze zdaniem podrzędnym rozpoczynającym się od Ŝe, lub z dowolnym wypowiedzeniem stanowiącym cytat: Frazy moŜna (teoretycznie) dowolnie rozszerzać o elementy opcjonalne, przy czym typ tych elementów zaleŜy od typu frazy: – frazy rzeczownikowe mogą być modyfikowane frazami przymiotnikowymi: mały biały pies gładki szeroki skórzany pas – frazy czasownikowe i przymiotnikowe mogą być modyfikowane frazami przysłówkowymi: spał niespokojnie latał niebezpiecznie wysoko przeraźliwie głośno bardzo mało zabawny *Ewa powiedziała (brak frazy wymaganej) *Ewa powiedziała na morzem (fraza przyimkowa) *Ewa powiedziała ładny (fraza przyimkowa) Ewa powiedziała wiersz (fraza rzeczownikowa w bierniku) Ewa powiedziała, Ŝe przyjdzie. (zdanie „Ŝe”) Ewa powiedziała „Dość!” * oznacza wypowiedzenia niepoprawne pa dziernik, 2005 39 ź Elementy opcjonalne (modyfikatory), 2 ź bułka z masłem czytał z uwagą pojechał w piątek, po porannym spotkaniu, przed obiadem sukienka ze sztruksu w niebieskie pasy z krótkimi rękawkami z białymi mankietami Gramatyka CFG to <V, T, S, P>: P - zbiór produkcji A-> α , gdzie A ∈ NT= V-T, α ∈ V* S -> NP VP NP -> Det Nominal Nominal -> Noun VP -> V | V NP Det -> a | my Noun -> flight | friend | morning V -> left | prefers frazy rzeczownikowe mogą być modyfikowane zdaniami względnymi: człowiek, który wie wszystko to, co zostało po wczorajszym przyjęciu pa dziernik, 2005 ź 40 Gramatyki bezkontekstowe (CFG - Context Free Grammars) frazy rzeczownikowe i czasownikowe mogą być modyfikowane frazami przyimkowymi: (nie rozwaŜamy tu ograniczeń semantycznych) pa dziernik, 2005 41 Zapis składników i ich kolejności Brak informacji o zaleŜnościach funkcyjnych Współczesne teorie opierają się o CFG, ale wykorzystują teŜ dodatkowe elementy pa dziernik, 2005 ź 42 7 Drzewo wywodu CFG - wywó wywód S -> NP VP NP -> Det Nominal Nominal -> Noun Nominal | Noun VP -> V NP Det -> a | my Noun -> flight | friend | morning V -> prefers S -> NP VP NP -> Det Nominal Nominal -> Noun Nominal | Noun VP -> V NP Det -> a | my Noun -> flight | friend | morning V -> prefers S-> NP VP -> Det Nominal VP -> Det Noun VP-> Det Noun V NP-> -> Det Noun V Det Nominal -> Det Noun V Det Noun Nominal-> -> Det Noun V Det Noun Noun -> my Noun V Det Noun Noun ->* my friend prefers a morning flight Nominal Det Noun V my 43 ź Wielo Jan kupił dom na wsi. kupił NP PP Jan N Prep NP dom na N V kupił N na dom N wsi 44 • wywodó wywodów RóŜne rozbiory syntaktyczne mogą mieć róŜne znaczenia [Jan] kupił [dom na wsi] (dom jest na wsi) [Jan] kupił [dom] [na wsi] (kupowanie odbywało si na wsi) ę • (prawie) takie samo znaczenie [Jan] ma [starą [ksiąŜkę [do angielskiego]]] [Jan] ma [[starą ksiąŜkę] [do angielskiego]] lub niektóre z nich mogą nie mieć Ŝadnego sensownego znaczenia: Jan zobaczył [biuro] [w piątek.] Jan zobaczył [biuro w piątek.] ?? 45 ź pa dziernik, 2005 46 ź Problemy z CFG - uzgodnienia Opis frazy przymiotnikowej ź a Nominal Nominal Noun morning flight Noun ź Prep NP pa dziernik, 2005 AdjP -> Adj AdjP -> Adj AdjP AdjP -> AdvP AdjP AdvP -> Adv | Adv AdvP AdjP -> Adj PP PP -> Prep NP AdjP1 -> Conj AdjP AdjPC | Conj AdjP AdjP -> AdjP Coma AdjPC Conj -> i | lub Coma -> , prefers Det Wielo NP VP pa dziernik, 2005 wsi pa dziernik, 2005 friend wywodó wywodów Niejednoznaczności składniowe powodują, Ŝe jedno zdanie (fraza) moŜe mieć wiele róŜnych rozbiorów składniowych – wiele drzew wywodu (ich liczba zaleŜy od konkretnej gramatyki), np. S -> NP VP S S NP -> N | NP PP VP -> V | V NP | VP PP NP VP NP VP PP -> Prep NP Noun V NP Noun VP PP Jan NP NP (wybór symbolu do zamiany dowolny, moŜe prowadzić do róŜnych wywodów) pa dziernik, 2005 S Cechy języków naturalnych, których opis w gramatykach bezkontekstowych jest trudny, a co najmniej uciąŜliwy, to przykładowo uzgodnienia i wymagania. biały biały mały wesoły bardzo biały biały z połyskiem biały i ciemno niebieski biały, zielony i brązowy Jaki problem powstaje w wyniku zastosowania następujących reguł? S -> NP VP NP -> Det Nominal Odpowiedź: nadmiarowość gramatyki generującej przykładowo następujące zdania i frazy: *They sleeps. *this dogs 47 pa dziernik, 2005 ź czy *Oni śpi. *ten psy. 48 8 Rozwi zanie I - podział podział na wi cej klas Problemy z CFG - wymagania Jaki problem powstaje w wyniku stosowania następujących reguł? VP -> V VP -> V NP *On spał kota. pa dziernik, 2005 zdanie z orzeczeniem w l.poj. zdanie z orzeczeniem w l. mnogiej fraza rzecz. i fraza czas. w l. poj. IntransVP -> IntransVerb TransVP -> TransVerb NP 49 ź Rozwi zanie II - atrybuty fraza rzecz. i fraza czas w l. mnogiej fraza z czas. nieprzechodnim fraza z czas. przechodnim pa dziernik, 2005 50 ź CFG z atrybutami, zapis wymaga (features, features, attributes) attributes) Zakodowanie wartości cech bezpośrednio w nazwach symboli nieterminalnych: S -> SgS S -> PlS SgS -> SgNP SgVP SgNP -> SgDet SgNom Odpowiedź: nadmiarowość: *He took. *He slept the cat. *She disappeared the elephant. Alternatywną metodą jest potraktowanie terminali i nieterminali jako symboli złoŜonych z przypisanymi własnościami (cechami, atrybutami). Przyimek z moŜe łączyć się z frazami rzeczownikowymi w dopełniaczu lub narzędniku: Pozwala to przykładowo na ograniczenie stosowania reguły: PP(form, case) -> Prep(form, case) NP(case,gender, number,person) Prep(z, gen) -> z (gen czyli genetive czyli dopełniacz) Prep(z, ins) -> z (ins czyli instrumental czyli narz dnik) S -> NP VP tylko do sytuacji, gdy liczba frazy rzeczownikowej NP i czasownikowej VP jest taka sama: ę z domu, z domem, z moim domem ... S(number) -> NP(number) VP(number) pełniejszy przykład: S -> NP(case-nom,gender,nb,person) VP (gender,nb,person) NP(case,gender,number) -> Noun(case,gender,number) pa dziernik, 2005 ź 51 pa dziernik, 2005 ź 52 9