pobierz plik referatu
Transkrypt
pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Rozdział 28 w Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego w 1 Wstęp da .b w Streszczenie. W rozdziale przedstawiono model formalny obrazowej reprezentacji semantyki zdań języka naturalnego, który został opracowany w oparciu o wiedzę z zakresu psychologii poznawczej opisującej proces rozumowania człowieka jako przetwarzanie obrazów pojęć i ich znaczenia w oderwaniu od języka komunikacji. W rozdziale przedstawiono uzasadnienie poznawcze i filozoficzne opisywanego podejścia, opisano proces tworzenia obrazów semantycznych oraz uzasadniono poprawność przedstawionej reprezentacji. pl s. W niniejszym rozdziale zaprezentowany zostanie model formalny obrazowej reprezentacji semantyki zdań języka naturalnego, będący podstawą rozważań dotyczących realizacji procesu wnioskowania na elementach bazy wiedzy. Elementami tymi są, reprezentowane przy użyciu wyrażeń symbolicznych, zdania składające się na przekaz. Zdania te mogą być zbiorem faktów, czyli stanowić wiedzę faktograficzną z danej dziedziny (geografia, historia, astronomia), jak również opisywać pewne zdarzenia rozgrywające się w czasie i dotyczące pewnej dziedziny, czyli przedstawiać sobą wiedzę epizodyczną. Proces wnioskowania inicjowany jest pytaniem, a efektem jest, jeśli istnieje, odpowiedź oparta na zgromadzonej wiedzy, sformułowana w postaci zdania języka naturalnego. W kolejnych podrozdziałach przedstawione zostaną przykłady zdań opisujących fakty i zdarzenia oraz szczegółowo opisana zostanie analiza syntaktyczna i semantyczna zdań oraz tworzenie obrazów semantycznych. Poniżej zaprezentowano strukturę modelu obrazowej reprezentacji semantyki zdań języka naturalnego. Przedstawiony przegląd istniejących już modeli reprezentacji semantyki zdań oraz psychologiczne i filozoficzne podstawy proponowanego modelu. Następnie omówiono sposób reprezentacji struktury składniowej zdań gromadzonych w bazie wiedzy, Tomasz Kapłon Politechnika Wrocławska, Instytut Informatyki, Automatyki i Robotyki, ul. Janiszewskiego 11/17, 50-372 Wrocław, Polska email:[email protected] (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon model reprezentacji semantyki oraz jego ograniczenia. Na koniec przedstawiono problem określania komponentów semantycznych1 zdań. 2 Reprezentacja semantyki w Reprezentacja wiedzy zależy od dziedziny, której wiedza ta dotyczy. Różne problemy występują w przypadku formalnego opisu różnego rodzaju języków, którymi wiedza opisywana jest naturalnie. Języki techniczne (np.: matematyka, logika, chemia, języki programowania) posiadają jednoznaczne, ścisłe i niezmienne reguły składniowe oraz jednoznaczny sposób odczytu. Języki naturalne (np.: polski, angielski) są językami wieloznacznymi, o indywidualnym i bogatym charakterze (np.: dialekty). Przede wszystkim są językami starszymi od języków technicznych, ewoluowały w sposób niekontrolowany, przez co sposób interpretacji świata i konstruowania zdań w oparciu o tę interpretację oparty jest ściśle na skojarzeniach z obrazami. Języki naturalne posiadają jednak reguły gramatyczne i stylistyczne, które zbliżają języki naturalne do języków technicznych. Istnieje możliwość wykorzystania istniejących w danym języku reguł do stworzenia w oparciu o nie modelu formalnego reprezentacji i modelu przetwarzania (np.: wnioskowania) zdań języka naturalnego. Implementacja takiego modelu pozwoliłaby na kontakt człowiek–maszyna za pomocą języka naturalnego. Początki badań nad zagadnieniami rozumienia treści przekazów słownych i w ogóle sposobem gromadzenia i przetwarzania informacji przez człowieka prowadzone były na gruncie lingwistyki [1], [2], psychologii poznawczej [3], [4] oraz filozofii [5]. Powstałe na tym gruncie koncepcje doprowadziły do powstania tzw. metafory komputerowej [3], zakładającej, że: − informacja przetwarzana jest „od dołu do góry’2 oraz − przetwarzanie to, jest sekwencyjne. O ile prawdziwość tej metafory została, w wyniku eksperymentów psychologii poznawczej, zakwestionowana – procesy przetwarzania informacji przez człowieka mogą być wykonywane równolegle – o tyle, z punktu widzenia sekwencyjnego działania współczesnych komputerów oraz nie uwzględniania w istniejących modelach badania kontekstu, jest nadal prawdziwa. Niemniej jednak, badania i eksperymenty nie dają nadal jednoznacznego zestawu reguł, który umożliwiłby formalny opis semantyki. Dają natomiast podstawy do tworzenia aparatów formalnych, które przyczyniają się do powstania systemów komputerowych mających na celu umożliwienie kontaktu człowiek–maszyna w języku naturalnym [6]. Z punktu widzenia zadania jakim jest model formalny reprezentacji i jego wykorzystanie do wnioskowania, istotne są koncepcje dotyczące operacji na reprezentacji semantyki zdań lub pojęć (gromadzenie i przetwarzanie). Najwcześniejsze z nich to opracowany przez Collinsa i Quilliana [7] model pamięci semantycznej, zrealizowany w postaci sieci semantycznej. Sieć semantyczna jest reprezentacją zależności pomiędzy pojęciami ujętymi w hierarchiczną strukturę zawierania się. Jest to szeroko stosowany, nie tylko w odniesieniu do zależności semantycznych, mechanizm klasyfikowania pojęć, z których te na niższych po- da .b w w pl s. 1 komponenty semantyczne – podstawowe elementy grafów semantycznych przetwarzanie „od dołu do góry” (ang. bottom-up) wywodzi się z koncepcji, która mówi, że treść informacji (wiedzy) przetwarzanej przez jednostkę (człowieka) wyznaczona jest przez bodźce docierające ze środowiska i oczekiwania, co do wyniku przetwarzania, nie mają wpływu na przetwarzanie, [3 – str.13]. 2 352 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego w ziomach dziedziczą cechy pojęć na poziomach wyższych z jednoczesną możliwością posiadania cech własnych, dziedziczonych następnie przez kolejne pojęcia z poziomów niższych. Rozszerzeniem tej koncepcji był model sieci poznawczej Normana i Rumelharta (1975). Model ten poza możliwością przechowywania wiedzy usystematyzowanej pozwalał na gromadzenie wiedzy deklaratywnej i wiedzy proceduralnej. Podstawową zaletą tego modelu była możliwość opisywania zdarzeń poprzez takie elementy jak predykat – jednoznacznie kojarzony z wykonywaną akcją (grupa czasownikowa w zdaniu) – oraz sprawcą, przedmiot i adresat akcji. Jednocześnie jako argumenty mogą występować współrzędne przestrzenne i czasowe. Pierwszym modelem, w którym wprowadzone zostało rozróżnienie warstwy syntaktycznej (powierzchniowej) i semantycznej (głębokiej) był opracowany przez Fillmora formalizm gramatyki przypadków (ang. case grammar) [8]. W modelu Fillmora głównym elementem zdania jest fraza czasownikowa. Pozostałe frazy pozostają z nią w określonych związkach. Semantykę zdania określa zestaw ról semantycznych (przypadków) przypisanych frazom zdania (AGENT, OBJECT, LOCATION, itd.). Formalizm ten określa również sposób reprezentacji semantyki zdań w postaci ram przypadków. Na gruncie modelu Normana i Rumelharta oraz gramatyki przypadków Fillmora powstała koncepcja reprezentacji semantyki za pomocą tzw. grafów konceptualnych, której autorem był Sowa (1975) [9]. Przewagą modelu Sowy nad modelem Fillmora była zaczerpnięta z modelu Normana i Rumelharta [10], możliwość obrazowania zależności czasowych i zdań zagnieżdżonych. Krok dalej w głąb znaczenia zawartego w zdaniu poszedł Schank w teorii zależności pojęciowych (ang. conceptual dependences theory) [11]. Formalizm zaproponowany przez Schanka jako centralny element zdania traktował, podobnie jak Fillmore i Sowa, frazę czasownikową. Teoria Schanka stała jednak w pewnej opozycji do teorii Fillmora. Teoria zależności pojęciowych traktuje rozumienie semantyki jako zestawy prymitywów (ang. language-free primitives) służących do konstruowania struktur zależności reprezentujących semantykę zdania. Podstawę tej teorii stanowią dwa założenia wynikające z obserwacji zdań i ich znaczenia: − słowa w zdaniach nie zawierają pełnej informacji koniecznej do zrozumienia znaczenia prezentowanego w zdaniu – więcej jest pomyślane niż powiedziane, − każda akcja i zdarzenie może być dekomponowane na struktury złożone z prymitywów. Teoria zależności pojęciowych, po prostu, wyprowadza w formie jawnej to, co w teorii Fillmora było przyjmowane za wiadome i niewymagające wyjaśnienia. Jeżeli człowiek idzie, to oznacza to, że porusza nogami, jeżeli porusza nogami, to porusza lewą i prawą nogą, jeżeli porusza nogą, to również wykonuje ruch tułowiem. Taką wyliczankę można konstruować dochodząc do ruchów atomów i być może na tym etapie nie kończąc, chociaż z punktu widzenia sensu zdania informacje te nie są istotne. Teoria Schanka zakłada, że cała wiedza jest już dostępna, skoro da się dekomponować każdą akcję i w dodatku określać elementy konieczne do wykonania takiej akcji. Z tego powodu, traktując system wnioskujący jako system uczący się, teoria ta nie ma zastosowania w dalszych rozważaniach, ponieważ, gdyby cała wiedza byłaby już dostępna nie byłoby celowe tworzenie systemu wnioskującego, a jedynie odtwarzającego wiedzę. Oprócz wspomnianych pojawiają się również koncepcje słuszne, lecz albo słabo określone – procesy rozumowania w ujęciu ewolucyjnym [12] albo posługujące się, jak w przypadku koncepcji ekologicznej – teoria Gibsona [3], zależnością postrzegania świata z uwzględnieniem nie tylko odbieranych bodźców, lecz również akcji motorycznych, co w przypadku przetwarzania zdań języka nie ma zastosowania. da .b w w pl s. 353 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon w Proponowana reprezentacja nie jest reprezentacją rewolucyjną. Wszelkie wcześniejsze doświadczenia, rozważania i koncepcje są w nią wpisane. Ujęcie reprezentacji semantyki jako reprezentacji obrazowej jest bezpośrednim odwołaniem do naturalnego sposobu reprezentacji świata. Bezpośrednie przeniesienie obrazów do pamięci komputera nie jest oczywiście możliwe ze względu na nieadekwatność struktur gromadzenia i przetwarzania informacji w mózgu człowieka i pamięci komputera. Użycie pojęcia „obrazowy” ma tutaj uzasadnienie w postaci odwzorowania „obrazu” znaczenia zdania w pewien ciąg symboli je reprezentujących. Podejście takie nie jest jedynie prywatną koncepcją autora. Posiada ono uzasadnienie we wspomnianych pracach z zakresu przetwarzania semantyki, jak również – stanowiących przesłankę do określania sposobu reprezentacji semantyki w postaci obrazów jako sposobu naturalnego – ma swoje uzasadnienie w pracach filozoficznych i oparcie w badaniach z zakresu psychologii poznawczej, co zostanie zaprezentowane w kolejnych punktach rozdziału. w 2.1 Teoretyczne podstawy reprezentowania semantyki w da .b Około 80 procent informacji o otaczającym świecie rejestrowana jest przez człowieka poprzez percepcję wizualną. Gromadzona wiedza jest następnie przekazywana w postaci werbalnej. Zgodnie z [3] proces pozyskiwania wiedzy o środowisku przebiega w następujący sposób. Obserwowane zjawisko przechowywane jest przez bardzo krótki czas (kilkadziesiąt milisekund do kilku sekund) w pamięci ultrakrótkiej. Charakterystyczne jest w tym przypadku to, że pamiętane są wszystkie szczegóły zjawiska. Następnie informacja przetwarzana jest na postać obrazu symbolicznego. W procesie przetwarzania następuje usunięcie szczegółów i pozostawienie jedynie elementów istotnych dla odbiorcy. Elementy te oraz ich wzajemny układ i skojarzenia (połączenia) stanowią o znaczeniu, semantyce postrzeganego zjawiska – zdarzenia lub faktu – i umieszczane są w pamięci trwałej. Każde kolejne postrzegane zjawisko powoduje generowanie kolejnego obrazu a poszczególne obrazy symboliczne składają się na całościowy obraz środowiska [13], [14]. Akt komunikacji polega na przekazywaniu obrazów z pamięci trwałej nadawcy w postaci zdań do odbiorcy. Na tym etapie pojawia się problem niejednoznaczności przekazywanej treści. Jednoznaczny przekaz zachodziłby wtedy, gdyby konstrukcja i słowa użyte w przekazie powodowały u odbiorcy wykreowanie obrazu identycznego jak u nadawcy. Przypadek taki właściwie nie ma szans zaistnienia, a powodem tego jest między innymi bogactwo form językowych, unikalny sposób działania mózgu ludzkiego i tworzenie specyficznych obrazów czy istnienie dotychczasowych doświadczeń – różnych u nadawcy i odbiorcy – podczas których obrazy pojęć, ich klasyfikacja i skojarzenia z formami językowymi były tworzone. Podobny, co do powstawania obrazów semantycznych, pogląd można znaleźć w pracach filozoficznych. Najistotniejsze przesłanki, jak się wydaje z punktu widzenia przeprowadzonych tutaj rozważań, znajdują się w dziele Wittgensteina Tractatus logico-philosophicus: − „tworzymy sobie obrazy faktów” (teza 2.1), − „obraz jest modelem rzeczywistości” (teza 2.11), − „obraz jest faktem”, (teza 2.14), − „to, co obraz przedstawia, stanowi jego sens” (teza 2.221). Powyższe tezy określają sposób w jaki postrzegamy otaczający nas świat. Przetwarzamy, a właściwie mózg przetwarza stany rzeczy na szeregi uporządkowanych obrazów tworzących w umyśle mentalny model rzeczywistości. Teza 3, „logicznym obrazem faktów jest myśl” oraz 3.01, „ogół myśli prawdziwych jest obrazem świata” określa sposób tworzenia całościowego obrazu świata [5]. Ograniczenia w opisie świata zawarte są jedynie w sile pl s. 354 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego w wyrazu języka oraz, co istotne dla rozważań nad modelem formalnym obrazowania semantyki, w tym, iż opis świata składa się jedynie ze zdań sensownych. Tworzenie i działanie na obrazach semantycznych niemożliwe jest bez znajomości struktury syntaktycznej przekazu. Sytuacja analogiczna powstaje w przypadku wyprowadzenia wyniku procesu rozumowania jako przekazu w formie zdań języka. Konieczna jest wtedy znajomość asocjacji elementów obrazu i słów je opisujących. Wymaga to gromadzenia w pamięci komputera informacji o strukturze syntaktycznej i semantycznej przekazu oraz o ich wzajemnych związkach. Taki sposób przechowywania wiedzy zaproponowany został przez Paivia [13] i znany jest jako koncepcja podwójnego kodowania. Postuluje on istnienie dwóch niezależnych systemów reprezentacji: werbalnego i obrazowego. Koncepcja podwójnego kodowania pokazana została na rys. 1. Zgodnie z [13] wiedza pozyskiwana jest poprzez analizę sensoryczną. Wiedza ta gromadzona jest w dwóch niezależnych jednak wzajemnie powiązanych systemach reprezentacji, (werbalnym i obrazowym). W systemie werbalnym spostrzeżenia gromadzone są w postaci logogenów, które stanowią nazwy obiektów, natomiast w systemie obrazowym przechowywane są imageny reprezentujące spostrzeżenia i wyobrażenia. Oba systemy połączone są ze sobą za pomocą relacji odnośności, które to wskazują na odpowiedniki istniejące w obu systemach. Ponieważ oba systemy są niezależne od siebie możliwe jest istnienie zarówno logogenów jak i imagenów nieposiadających swoich odpowiedników w drugim systemie. Są to logogeny abstrakcyjne odpowiedzialne za tworzenie pojęć abstrakcyjnych, pozwalające na wprowadzenie operacji klasyfikacji i łączenie obiektów w grupy – nie zawsze dostępne percepcyjnie [3] – oraz imageny bez nazwy reprezentujące wyobrażenia, którym nie odpowiada żaden rzeczywisty obiekt. Zarówno logogeny jak i imageny łączone są w ramach swoich systemów za pomocą relacji asocjacyjnych. Biorąc pod uwagę powyższe koncepcje należy spojrzeć teraz na sposób działania komputera. Gromadzenie wiedzy w postaci graficznej, czyli obrazów sensu stricte, tworzonych na podstawie zdań składających się na przekaz jest nieefektywne z punktu widzenia organizacji i sposobu działania komputera. Obrazy semantyczne muszą być gromadzone w oparciu o konstrukcje, które pozwolą na efektywne ich przetwarzanie komputerowe. Odpowiednią reprezentacją są grafy semantyczne z komponentami semantycznymi reprezentowanymi przez wierzchołki oraz związkami i zależnościami komponentów w postaci krawędzi. Każde zdanie przekazu transformowane jest na postać grafu semantycznego reprezentującego fragment rzeczywistości. Grafy poszczególnych zdań nakładane są na siebie tworząc w ten sposób graf zbiorczy stanowiący obraz semantyczny przekazu, który jest odzwierciedleniem pewnego fragmentu świata rzeczywistego. Nakładanie to realizowane jest poprzez identyczne komponenty semantyczne występujące w zdaniach przekazu. da .b w w pl s. 355 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon bodźce werbalne bodźce niewerbalne systemy sensoryczne w r e l a c j e O B R A Z O W Y a s o c j a c y j n e imagen koń relacja logogen koń referencyjna koń i pies (zwierzę) imagen pies w w S Y S T E M relacja logogen pies referencyjna logogeny pojęć abstrakcyjnych da .b imageny bez nazw logogen zwierzę wyjście systemu niewerbalnego r e l a c j e S Y S T E M a s o c j a c y j n e W E R B A L N Y wyjście systemu werbalnego Rys. 1. Koncepcja podwójnego kodowania wg Paivia. 2.2 Analiza syntaktyczna zdań pl s. Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego przedstawiony zostanie w podrozdziale 2.4. Podstawą tworzenia obrazów semantycznych jest analiza semantyczna zdań oparta o analizę i reprezentację struktury składniowej zdań. Obie analizy omówione zostaną poniżej. Wytworzenie obrazu semantycznego zdania przekazu możliwe jest po dokonaniu analizy składni zdania (analiza syntaktyczna). Analiza syntaktyczna ma na celu podział zdań przekazu na grupy słów, które stanowią funkcjonalny odpowiednik, na poziomie powierzchniowym, ról semantycznych poziomu głębokiego zdania. Stąd, grupy te nazywane będą funkcjonalnymi grupami słów. Podstawą podziału jest informacja leksykalna dotycząca słów zawartych w zdaniu. W procesie wprowadzania zdań do bazy wiedzy każdemu wyrazowi nadawana jest kategoria leksykalna. Podział wykonywany jest przez pewien automat, parser syntaktyczny [15], [16]. Każda grupa składa się z jednego lub kilku wyrazów i może być reprezentowana przez graf skierowany. Wierzchołki grafu odpowiadają słowom, krawędzie określają następstwo słów w grupie. Podobnie, jako ciąg funkcjonalnych grup słów, 356 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego stanowiących wierzchołki grafu połączone krawędziami następstw, reprezentowane jest zdanie. Założenia dotyczące struktury gromadzenia wiedzy w postaci wyrażeń symbolicznych [15] określają hierarchiczną, trójpoziomową strukturę grafową reprezentacji zdań w bazie wiedzy, gdzie każde zdanie pojedyncze reprezentowane jest jako izolowany wierzchołek. Sposób tworzenia powyższej struktury przedstawiono na poniższym przykładzie. Do bazy wiedzy wprowadzane jest zdanie. w A man lives in town. (S1) w w Jest ono dzielone na grupy słów w następujący sposób: a man ↔ d1 d2 ↔ a1 lives ↔ d3 ↔ a2 in town ↔ d4 d5 ↔ a3 gdzie: symbole dj reprezentują wyrazy, aj grupy słów. Każde zdanie oznaczane jest symbolem sl i opisane jest na poziomie grup słów ciągiem: s1 = a1 a2 a3 ↔ c1 (2.1) da .b W ten sposób określone zostają struktury poszczególnych poziomów reprezentowane poprzez grafy pokazane, wraz z ilustracją struktury hierarchicznej, na rys. 2. Zgodnie z przyjętym sposobem reprezentacji struktury grafowe gromadzone są w bazie wiedzy w postaci równoważnych im wyrażeń symbolicznych. Dla poziomu I wyglądają one następująco: D+(a1) = 0( d1 1( z1a1d2 2( z3a1d1 )2 )1 )0 D+(a2) = 0( d3 1( z3a2d3 )1 )0 D+(a3) = 0( d4 1( z1a3d5 2( z3a3d4 )2 )1 )0 gdzie: z1 oznacza połączenie pomiędzy kolejnymi słowami w grupie, z3 oznacza koniec ciągu słów w grupie. s1 z1s1 z1s1 a2 pl s. a1 poziom III a3 poziom II z3s1 z1a1 z1a3 d1 d2 z3a1 d3 z3a2 d4 d5 z3a3 poziom I Rys. 2. Graf struktury syntaktycznej zdania S1 357 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon Zbiór grup słów reprezentowany jest w bazie wiedzy w postaci zbiorczego wyrażenia symbolicznego D’+ będącego kompozycją wyrażeń symbolicznych typu D+(ar). D’+ = 0( d1 1( z1a1d2 2( z3a1d1 )2 )1, d3 1( z3a2d3 )1, d4 1( z1a3d5 2( z3a3d4 )2 )1)0 (2.2) w Poziom II, reprezentujący strukturę zdania, zapisywany jest w postaci wyrażenia A+(sj), a struktura wszystkich zdań wprowadzonych do bazy wiedzy zapisywana jest w wyrażeniu A’+. W przypadku powyższego przykładu wyrażenie A’+ jest równoważne wyrażeniu A+(sj), co wynika z faktu istnienia tylko zdania S1 w bazie wiedzy i ma następującą postać: A’+ = 0( a1 1( z1s1a2 2( z1s1a3 4( z3s1a1 )4 )3 )2 )1 )0 (2.3) w w W przypadku występowania zdań złożonych współrzędnie oraz części zdań złożonych podrzędnie, zdania takie reprezentowane są jako ciągi zdań pojedynczych łączonych spójnikami. Powyższy model reprezentacji warstwy syntaktycznej zdań przedstawiony jest w pracy [17]. Podział zdania na grupy słów stanowi podstawę do wykonania analizy semantycznej zdania, co z kolei prowadzi do wytworzenia obrazu semantycznego zdania. 2.3 Analiza semantyczna da .b W wyniku analizy syntaktycznej wyodrębnione zostają funkcjonalne grupy słów będące odpowiednikami, na poziomie powierzchniowym, ról semantycznych poziomu głębokiego zdania. Stąd też, każda z grup pełni pewną rolę semantyczną. W przypadku języka angielskiego, rola semantyczna zależna jest od pozycji grupy w zdaniu. Pozycja w zdaniu decyduje o tzw. typie grupy. Typ grupy natomiast determinuje rodzaj rdzenia semantycznego grupy – zależność rdzenia od typu grupy pokazany został w tabeli 1. Rdzeń semantyczny jest nazwą pojęcia, do którego odnosi się grupa. Rdzenie semantyczne podlegają kategoryzacji określając w ten sposób rolę (kategorię) semantyczną grupy. Same jednak reprezentują pojęcia określane jako cechy semantyczne. Cechy i kategorie semantyczne określane są mianem komponentów semantycznych. Ciągi komponentów semantycznych określają semantykę zdania, przy czym podstawowymi komponentami są cechy semantyczne, natomiast komponentami dodatkowymi, kategorie semantyczne. Wynikiem analizy semantycznej jest nadanie cech i kategorii semantycznych grupom słów, czyli określenie znaczenia zdania. typ grupy rzeczownikowa przyimkowa czasownikowa przymiotnikowa przysłówkowa pl s. Tabela 1. Typy grup słów rdzeń semantyczny rzeczownik rzeczownik czasownik przymiotnik przysłówek Zbiór ról semantycznych pełnionych przez grupy słów jest oczywiście ograniczony możliwościami ekspresywnymi języka, natomiast nie jest jednoznacznie określony [8]. W tabeli 2 przedstawiono zbiór kategorii semantycznych wykorzystany w pracy. Jednym z celów prezentowanego modelu jest osiągnięcie maksymalnego zakresu ogólności zastosowania – maksymalnie dużo wiedzy w postaci minimalnej liczby obrazów semantycznych oraz maksymalnie dużo możliwości wnioskowania na wiedzy z różnych dzie358 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego dzin, przy minimalnej liczbie reguł – możliwie niezależnych od dziedziny wiedzy, na której odbywa się wnioskowanie. Tabela 2. Kategorie semantyczne grup słów kategoria semantyczna w AGENT ACTION OBJECT LOCATION CO-AGENT INSTRUMENT TIME FEATURE w w MANIER GOAL typ grupy o określonej roli rzeczownikowa czasownikowa rzeczownikowa Przyimkowa rzeczownikowa Przyimkowa rzeczownikowa przymiotnikowa przysłówkowa przysłówkowa rzeczownikowa funkcja w zdaniu podmiot akcji akcja przedmiot akcji miejsce akcji odbiorca akcji narzędzie akcji czas wykonania akcji cecha podmiotu lub akcji sposób wykonania akcji cel akcji da .b Wynikiem takiego założenia jest konieczność przechowywania wiedzy i reguł wnioskowania w postaci spełniającej powyższe wymagania. Stąd, zastosowanie kategorii semantycznych w tym celu. Kategorie semantyczne stanowią pomost pomiędzy najgłębszą, intencjonalną, warstwą języka, a warstwą zewnętrzną, werbalną. Łączą ze sobą myśli i słowa. Stąd też dają najbardziej ogólny sposób reprezentacji wiedzy możliwy do formalnego ujęcia. Dając możliwość wykorzystania formalizmu zgodnie w powyższymi założenia odnośnie maksymalnego zakresu ogólności przechowywanej wiedzy i minimalnego zakresu obciążenia pamięci. Ciągi kategorii semantycznych stanowią swoiste szablony zdań, które uzupełniane są wyrazami odpowiednimi do charakteru konstruowanej wypowiedzi. W przypadku realizacji procesu wnioskowania komputer wykonywał będzie czynność identyczną do tej, którą człowiek wykonuje w procesie werbalizacji myśli, tzn. będzie wypełniał pola ról semantycznych o określonych kategoriach semantycznych odpowiednimi wyrazami tak, aby przedstawić wynik procesu wnioskowania w postaci czytelnej dla człowieka (użytkownika), czyli w postaci zdań języka. Kategorie semantyczne opisują role semantyczne grupy, nie konkretyzują jednak znaczenia grupy i nie określają przez to jej własności semantycznej. Rolę tę spełniają cechy semantyczne nadawane wyekstrahowanym rdzeniom grup słów. W języku angielskim wyrazy dzieli się na wyrazy z treścią semantyczną (rzeczowniki, czasowniki, przymiotniki oraz niektóre przysłówki) oraz wyrazy strukturalne (zaimki, określniki, przyimki i spójniki). Cecha semantyczna nadana może zostać tylko wyrazom posiadającym treść semantyczną. pl s. Definicja 1 Cecha semantyczna opisuje własności wyrazu i jest nadawana tylko wyrazom posiadającym treść semantyczną. Interpretacja cechy semantycznej zależna jest natomiast od kategorii leksykalnej słowa będącego rdzeniem grupy. Różna informacja reprezentowana przez rzeczowniki i czasowniki wynika z odmiennych funkcji pełnionych w zdaniu. W przypadku rzeczowników cechy semantyczne odpowiadają typom obiektów, które opisują. Podział tych obiektów na grupy może być mniej lub bardziej szczegółowy i zależny również od dziedziny zastosowania. Powoduje to problem zdefiniowania uniwersalnego zbioru cech semantycznych. Podobnie w przypadku czasowników, w zależności od sposobu klasyfikacji (Schank, Levin), 359 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon liczność grup, jak i przyporządkowanie wewnątrz nich mogą być różne. Dlatego też przyjęto zestaw cech semantycznych rzeczowników, tabela 4, i czasowników, tabela 3. Oba zestawy powstały w oparciu o słownik WORDNET [18]. Tabela 3. Zbiór cech semantycznych czasowników. kategoria czasownika przykład BODY FUNCTIONS sleep, ache, tire, snore bv2 CHANGE convert, increase, correct bv3 COMMUNICATION order, thank, teach bv4 COMPETITION fight, race, arm, team bv5 CONSUMPTION drink, eat, smoke, use bv6 CONTACT rub, mpe, grip, slice, point by7 COGNITION deduce, induce, infer w symbol cechy bv1 bv9 bv10 bvl2 bvl3 bvl4 bvl5 CREATION create, make, write MOTION run, go, swim, fly EMOTION love, hate, hope, fear STATIVE be, live, exist, occur, hate PERCEPTION see, hear, smile, taste POSSESSION have, give, receive, robb SOCIAL INTERACTION impeach, educate, vote, try WEATHER rain, snow, thunder, hail da .b bv11 w w bv8 Tabela 4. Zbiór cech semantycznych rzeczowników. cecha semantyczna przykład bnl ACT, ACTION, ACTIVITY walk, run, work, play, dance bn2 ANIMAL, FAUNA mammal, fish, bird, dog, cat bn3 ARTEFACT table, chair, car, train, house bn4 ATTRIBUTE, PROPERTY age, size, colour, consistency, taste bn5 BODY, CORPUS head, arm, leg, eye, hand, finger bn6 COGNITION, KNOWLEDGE mind, perception, history, chemistry bn7 COMMUNICATION language, voice, talk, letter, massage bn8 EVENT, HAPPENING accident, party, scandal, start bn9 FEELING, EMOTION love, hate, hope, happiness, apathy bnl0 FOOD meat, egg, milk.juice, apple, lunch bnll GROUP, COLLECTION ciass, family, herd, shoal, array bnl2 LOCATION, PLACE room, garden, London, district bnl3 MOTIVE impulse, occasion, passion, reason pl s. symbol cechy 360 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego NATURAL OBJECT sun, moon, sky, river, lake, mountain bnl5 NATURAL PHENOMENON rain, snow, wind, fermentation bnl6 PERSON, HUMAN BEINGS man, woman, child, adult, doctor bnl7 PLANT, FLORA tree, flower, grass, com, oak bnl8 POSSESSION present, donation, inheritance, salary bnl9 PROCESS synthesis, reaction, evolution, erosion bn20 QUANTITY, AMOUNT unit, number, byte, millimetre, degree bn21 RELATION identity, parity, part, chronology bn22 SHAPE point, line, circie, column, solid bn23 STATE, CONDITION life, death, health, employ, freedom bn24 SUBSTANCJE atom, mixture, water, wood, oxygen bn25 TIME hour, day, week, year, Monday w bnl4 w w W oparciu o tabele 3 i 4 grupom słów zdania S1 nadawane są kategorie, a wyodrębnionym z grup rdzeniom, cechy semantyczne stanowiące podstawę tworzenia obrazu semantycznego zdania. da .b Kategorie semantyczne przypisane grupom to: a man ↔ a1 → AGENT live ↔ a2 → ACTION in town ↔ a3 → LOCATION Cechy semantyczne nadane rdzeniom (zaznaczone pogrubioną czcionką) to: a man ↔ a1 → HUMAN ↔ bn16 live ↔ a2 → STATIVE ↔ bv11 in town ↔ a3 → PLACE ↔ bn12 gdzie: symbol bi oznacza cechę semantyczną. AGENT u1 ACTION a1 u3 LOCATION a2 a3 pl s. Strukturę semantyczną zdania S1 na poziomie kategorii semantycznych można przedstawić w postaci ciągów kategorii połączonych symbolami uj. ↔ c1* (2.4) Struktura zdania S1 na poziomie cech semantycznych obrazowana jest podobnie z wykorzystaniem cech semantycznych. HUMAN bn16 u1 STATIVE bv11 u3 PLACE u0 ↔ c1+ (2. 4a) bn12 Symbol c1* jest oznaczeniem semantyki zdania S1 na poziomie kategorii semantycznych, symbol c1+ jest oznaczeniem semantyki na poziomie cech semantycznych Symbol uj reprezentuje parę kategorii semantycznych kolejnych grup słów. u1 – AGENT → ACTION, u2 – AGENT → CO-AGENT, u3 – ACTION → LOCATION, 361 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon u0 – sprzężenie zwrotne gdzie: symbol u0 oznacza koniec ciągu komponentów semantycznych. w Ponieważ wprowadzone zostały, jako łączniki, symbole uj zapis w postaci ciągów cech semantycznych jest zapisem bogatszym w informację w stosunku do zapisu za pomocą ciągów kategorii semantycznych, dlatego też do konstruowania obrazów semantycznych wykorzystywany będzie zapis za pomocą cech semantycznych. Wprowadzimy teraz definicję grafu semantycznego. da .b w w Definicja 2 Graf semantyczny tworzony jest na podstawie ciągu cech semantycznych w następujący sposób: − wierzchołki grafu reprezentowane są przez cechy semantyczne i oznaczane symbolami bi, − krawędzie grafu skierowane są zgodnie z następstwem kategorii semantycznych i reprezentowane (opisane) są symbolami uj, gdzie j = 1, 2, 3, …, n, w przypadku łączenia następujących po sobie cech semantycznych grup słów i stanowiących o strukturze grup w zdaniu, gdzie j = 0, w przypadku łączenia wierzchołka końcowego i początkowego − każda krawędź oznaczona jest symbolem cl, identyfikującym unikalną strukturę semantyczną wszystkich zdań o semantyce cl. Na podstawie ciągów cech semantycznych, takich jak (2.4), tworzone są grafy semantyczne zdań. W pamięci grafy będą reprezentowane przez równoważne im wyrażenia symboliczne. Zgodnie w powyższym, ciąg (2.4) można przedstawić w postaci grafu (rys. 3). u1c1+ bn16 u3c1+ bv11 bn12 pl s. u0c1+ Rys. 3. Graf semantyczny zdania S1 Podobnie jak strukturę syntaktyczną grup słów i zdań (por. wyrażenia symboliczne D’+ i A’+), można przedstawić w postaci równoważnego jej wyrażenia symbolicznego B+(c1+). B+(c1+) = 0( bn16 1( u1c1+bv11 2( u3c1+bn12 3( u0c1+bn16 )3 )2 )1 )0 (2.5) Aby określić zależność pomiędzy strukturą syntaktyczną, A+(c1) i semantyczną B+(c1+) porównywane są ciągi a1a2a3 ↔ c1 i bn16u1, bv12u2, bn12u3 → c1+. Rezultatem porównania jest złożenie: u1a1, u2a2, u3a3 → c1. które transformowane jest do postaci wyrażenia symbolicznego U’+(c1): 362 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego U+(c1) = 0( u1 1( a1c1u2 2( a2c1u3 3( a3c1u1 )3 )2 )1 )0 = U’+ (2.6) w Symbol semantyki (c1) dołączany jest do wyrażenia zbiorczego U’+ określającego związki pomiędzy reprezentacją składni i obrazem semantycznym wszystkich zdań wprowadzonych do bazy wiedzy. Koncepcja określenia zależności pomiędzy strukturą syntaktyczną i semantyczną zaczerpnięta została z pracy [19]. Znajomość powyższej zależności jest niezbędna do realizacji procesu wnioskowania. Należy zwrócić uwagę na trzy istotne sprawy związane z tworzeniem obrazów semantycznych: − określanie oraz dobór kategorii i cech semantycznych – punkt 2.5, jednoznaczność reprezentacji obrazowej – 2.4, − równoważność semantyczną zdań, czyli nadawanie unikalnych symboli semantyk. Pierwsze dwa problemy omówione zostaną w kolejnych punktach, natomiast kwestię równoważności semantycznej przedstawiono w pracy [20]. W rozdziale przyjmuje się, że rozpoznawanie semantyk i ocena ich unikalności jest rozwiązana w oparciu o pracę [20]. w w 2.4 Jednoznaczność reprezentacji obrazowej da .b Pomimo, iż grafowa reprezentacja semantyki pozwala na tworzenie szablonów zdań określonego typu, co pozwala na zmniejszenie ilości miejsca potrzebnego do gromadzenia wiedzy na temat znaczenia treści przekazu, nie jest ona jednak pozbawiona wad. W przyjętym modelu założone zostało, że grafy semantyczne są grafami cyklicznymi, co determinuje rozróżnialność wierzchołków grafu. Nie wynika to jedynie z założenia, co do modelu, ale jest koniecznością z punktu widzenia zachowania poprawności gromadzonej wiedzy. Poniższy przykład zilustruje powyższe uwagi. Do bazy wiedzy wprowadzane jest zdanie: (S2) A man met another man. HUMAN bn16 u1 INTERACTION bv3 u4 pl s. Zdanie S2 podlega analizie syntaktycznej i semantycznej, czego efektem jest podział na grupy słów oraz nadanie cech semantycznych grupom. a man ↔ a1 → HUMAN ↔ bn16 met ↔ a4 → INTERACTION ↔ bv3 another man ↔ a5 → HUMAN ↔ bn16 Semantykę zdania reprezentuje następujący ciąg: HUMAN u0 ↔ c2 (2.7) bn16 Graf utworzony na podstawie powyższego ciągu ma postać, jak na rys. 4. 363 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon u1c2 u0c2 bn16 bv3 w u4c2 Rys. 4. Niejednoznaczny graf semantyczny HUMAN1 u1 da .b w w Graf taki nie jest jednoznaczny z punktu widzenia reprezentowanego przez niego ciągu kategorii semantycznych. Można, bowiem na jego podstawie wyznaczyć przynajmniej trzy ciągi kategorii: b1u0, b1u1b4u4b1u0 i b1u1b4u4b1u4b1u0, a w skrajnym przypadku nieskończoną liczbę takich ciągów, gdy powtarzane będą symbole u4b1. Poprawnym ciągiem jest ciąg b1u1b4u4b1u0, ciąg b1u0 można uznać za poprawny, chociaż zdanie utworzone na podstawie takiego ciągu zawiera jeden wyraz – a man – stanowiąc szczególne zdanie. Ciąg, b1u1b4u4b1u4b1u0 oraz wszystkie ciągi z powtarzającymi się symbolami u4b1 opisują strukturę zdania z dwoma i więcej orzeczeniami, nie są jednak poprawnymi zdaniami złożonymi, z powodu braku spójników. Stąd też graf semantyczny (rys. 4) nie określa jednoznacznie zdania. Wynika to z faktu nie rozróżnienia w procesie analizy semantycznej grup słów o jednakowych cechach semantycznych pełniących jednak różne role semantyczne. Dla tworzenia jednoznacznych grafów semantycznych niezbędne jest rozróżnianie w obrazie semantycznym powtarzających się cech semantycznych. Rozwiązaniem jest indeksowanie powtarzających się cech semantycznych. Zatem, dla zdania S2, po uwzględnieniu uwagi o konieczności indeksowania ciąg cech semantycznych wygląda następująco INTERACTION u4 bv3 bn16 HUMAN2 u0 ↔ c2 (2.8) bn16 Na podstawie takiego ciągu tworzony jest jednoznaczny graf semantyczny obrazujący semantykę zdania S2. bn16 u4c2 bv3 bn16 u0c2 Rys. 5. Poprawny graf semantyczny zdania S1 pl s. u1c2 Powyższy przykład pokazuje problem, jakim może być wystąpienie niejednoznaczności reprezentacji obrazowej. Pokazany został również sposób na wyeliminowanie tejże niejednoznaczności, poprzez wprowadzenie indeksowania jednakowych cech semantycznych występujących w jednym zdaniu. Istnieją przykłady zdań pojedynczych, poprawnych syntaktycznie i semantycznie, w których można wskazywać grupy słów o jednakowych cechach semantycznych. Pojawianie się 364 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego w zdaniach grup o jednakowych cechach semantycznych ograniczy się do przypadków takich, jak w podanym przykładzie. Zbiór możliwości ograniczony będzie przez liczbę typów grup mogących pełnić określone role semantyczne (zob. tabela 2). Dodatkowo przypadki wystąpienia grup o jednakowych cechach semantycznych ograniczony jest przez tzw. właściwości konotacyjne czasowników [10], [21], [22], które to określają liczbę i typ grup słów w zdaniu. Niemniej jednak, aby uniknąć niejednoznaczności w obrazowaniu semantyki komputer indeksuje grupy, którym nadaje jednakowe kategorie i cechy semantyczne. w 2.5 Bezkontekstowy dobór cech semantycznych da .b w w Wyodrębnionym, w czasie analizy syntaktycznej, grupom słów nadane zostały kategorie i cechy semantyczne. Określony został zbiór kategorii semantycznych oraz typy grup, które w zdaniu pełnią odpowiednie role semantyczne (tabela 2), jak również rdzenie semantyczne charakterystyczne dla określonych typów grup. Określony zbiór kategorii semantycznych nie jest zbiorem skończonym, a jedynie zbiorem wystarczającym z punktu widzenia prezentowanej pracy. Szersze przedstawienie problemu doboru kategorii i cech semantycznych zaprezentowane zostało w pracach [20], [23]. Każdy przekaz słowny w postaci zdań języka naturalnego stanowi odniesienie do świata rzeczywistego w aspekcie fizycznym lub psychicznym, w którym funkcjonuje osoba werbalizująca pewną myśl. Odniesienie to jest opisem pewnej relacji pomiędzy obiektami świata, zarówno obiektami rzeczywistymi jak i formami abstrakcyjnymi. W prezentowanym modelu założone zostało, że każdy obiekt świata ma swój odpowiednik w postaci komponentu semantycznego w zdaniu. W przeciwnym wypadku pojęcie takie nie może być wyartykułowane w postaci wyrazu. Każda funkcjonalna grupa słów posiada rdzeń semantyczny, który stanowi nazwę pojęcia należącego do wspomnianej grupy [2]. Obiekty i wyrazy w zdaniu mają ze sobą związek znaczeniowy. Poza tym, charakteryzują również relację znaczeniową pomiędzy obiektami. Związek taki nosi miano predykatu [24] i określa własność lub relację semantyczną. Każdy wyróżniony poznawczo przedmiot jest przejawem pewnego aspektu świata i jako taki charakteryzuje się odróżniającą go od innych cechą (znakiem unikalnym). Zakres unikalności określany jest przez poziom szczegółowości pojęcia. Pojęcia organizowane są w klasy pojęć o strukturze drzewiastej (rys. 6). Poszczególne poziomy powiązane są ze sobą za pomocą relacji semantycznych. Struktury takie określane są jako sieci semantyczne [7]. Zasadą zawartą w organizacji sieci semantycznej jest definiowanie własności poziomu niższego przez poziom wyższy. Obiekt KOT posiada wszelkie cechy obiektu ZWIERZĘ. Może jednocześnie posiadać cechy charakterystyczne tylko i wyłącznie dla siebie. W sposób przedstawiony na rys. 6 klasyfikowane są rzeczowniki (hierarchię określa relacja hiponimii [2]) i czasowniki (hierarchia określona jest przez relację troponimii [22]). Hierarchię przymiotników i przysłówków określają relacje synonimii i antynomii [2], [18]. pl s. 365 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon poziom nadrzędny ZWIERZĘTA KOŃ w ARAB poziom podstawowy PIES PERSZERON JAMNIK DOG poziom podrzędny w Rys. 6. Hierarchiczny model pojęć da .b w Pojęcia tworzące sieci semantyczne zorganizowane są na trzech poziomach. Podział taki zaproponowała E. Rosch [25]. Jest on elementem jednego z trzech poglądów dotyczących reprezentacji pojęć nazywany poglądem probabilistycznym [3]. Pojęcia, tworzące sieć semantyczną, charakteryzują się dwoma cechami: informatywnością i ekonomicznością. Informatywność polega na ścisłym określaniu unikalności pojęcia – im większa specyfika pojęcia, tym informatywność wzrasta. Ekonomiczność natomiast polega na zmniejszaniu unikalności pojęcia, czyli wtedy, gdy obejmuje ono sobą szerszy zakres znaczeniowy. Trzy poziomy rozróżnione przez Rosch charakteryzowane są przez obie cechy [4]: 1) poziom nadrzędny – pojęcia o dużym zakresie znaczeniowym (niska unikalność cech specyficznych); charakteryzujące się niską informatywnością, 2) poziom podstawowy – pojęcia najłatwiejsze do rozróżnienia, najwcześniej przyswajane, najczęściej używane; charakteryzuje je równowaga pomiędzy informatywnością i ekonomicznością, 3) poziom podrzędny – pojęcia specyficzne (duża unikalność cech specyficznych); charakterystyczna jest duża informatywność. W obrazowym modelu reprezentacji semantyki zdań, w celu określania cech semantycznych wykorzystano leksykalną bazę wiedzy WordNet, opracowaną w Princeton University, [18], [22], [26] i obejmującą sieci semantyczne: rzeczowników, czasowników i przymiotników. Przykładowy zestaw cech semantycznych przymiotników i rzeczowników przedstawiono odpowiednio w tabeli 3 i 4. Ze względu na niewielką liczbę przykładów zdań wykorzystanych, jak również, iż są to zdania proste, powyższy, bezkontekstowy sposób można uznać za wystarczający. Niemniej jednak określanie cech bez rozpatrywania kontekstu w jakim znajduje się grupa jest znacznym uproszczeniem i nie daje, zwłaszcza przy wykorzystaniu jakiegokolwiek modelu pomijającego kontekst w procesie wnioskowania, zadawalających rozwiązań – to, czy „coś” uznamy za pojazd zależy od kontekstu, w jakim to „coś” występuje [3]. Próby rozwiązania problemu nadawania cech semantycznych z uwzględnieniem kontekstu w jakim grupy słów występują w zdaniu zaprezentowane zostały w pracy [23]. Proponowane rozwiązanie oparte zostało na modelu obrazowania semantyki może stanowić, w przypadku rozwinięcia, pewien krok w rozwoju systemu wnioskującego. Umiejętność uwzględniania kontekstu, czyli zdarzeń przeszłych, daje możliwość nie tylko na prawidłową ocenę stanu teraźniejszego, ale daje szansę na przewidywanie przyszłości w sensie udzielania prawidłowych i sensownych odpowiedzi w ramach dziedziny, w której następuje wnioskowanie. Takie zachowanie systemu wnioskującego dałoby, w pewnym sensie, prawo do nazywania go inteligentnym. pl s. 366 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego 3 Podsumowanie w Przedstawiony został formalizm reprezentacji semantyki zdań języka naturalnego wykorzystujący reprezentację wiedzy w postaci wyrażeń symbolicznych. Opracowany model jest rozwinięciem prac nad systemem analizy tekstów formułowanych w języku naturalnym (początkowo angielskim, docelowo w języku polskim), których podstawę stanowił parser syntaktyczny – w obecnej postaci wykorzystujący zmodyfikowaną gramatykę łączeń. Opierając się na teorii podwójnego kodowania uzupełniono bazę wiedzy o podzielone na grupy słów zdania, którym przypisano odpowiednie role semantyczne, tworząc w ten sposób tzw. obrazy semantyczne zdań tekstu. Korelacja pomiędzy poziomem powierzchniowym (słowa) i głębokim (role semantyczne) pozwoliła na opracowanie algorytmów wnioskowania na znaczeniu treści przekazu i możliwości konstruowania uniwersalnych reguł wnioskowania – możliwość stosowania niezależnie od dziedziny wiedzy, na której wykonywane jest wnioskowanie. Przedstawiono sposób tworzenia obrazów semantycznych oraz sposób asocjacji warstw powierzchniowej i głębokiej zdań. Uzasadniono poprawność takiego rozwiązania. Model spełnia warunki poprawnej reprezentacji wiedzy: spójność, zdolność do odtworzenia wiedzy oraz możliwość realizacji wnioskowania, co zostało pokazane w innym rozdziale ten monografii. Nową jakością modelu jest uniwersalność reguł wnioskowania tworzonych w oparciu o ten model, czyli niezależność od dziedziny i języka przekazu. 1. 2. 3. 4. 5. 6. 7. 9. 10. 11. 12. 13. 14. 15. 16. Lyons J., Introduction to theoretical linguistic, Cambridge University Press, 1968. Lyons J., Semantyka, vol. 1. PWN, Warszawa, 1984. Maruszewski T., Psychologia poznawcza, Polskie Towarzystwo Semiotyczne, Warszawa, 1996. Chlewiński Z., Umysł: dynamiczna organizacja pojęć, PWN, Warszawa, 1997. Wittgenstein L., Tractatus logico-philosoficus, Wydawnictwo Naukowe PWN, Warszawa, 2000. Manaris B. Z., Natural Language Proceessing: A Human – Computer Interaction Perspective, Reprint of charter in Advances in Computers, Vol 47, Academic Press Inc., 1998. Collins A. M., Quillian M. R., Retrival time from semantics memory, Journal of Verbal Learning and Verbal Behaviour, vol. 8, strony 240 – 247, 1969. Fillmore C., The case for case, W: E. Bach i R. Harms, (red.), Universals in Linguistic Theory, strony 1- 90, Holt, Rinehart and Winston, New York, 1968. Sowa J. F., Conceptual Structures: Information Processing in Mind and Machine, Addison – Wesley, Reading, Massachusets, 1984. Norman D. A., Rumelhart D. E., Exploration in Cognition, Freeman, San Francisco, 1975. Schank R. C., Conceptual Inforamtion Processing, North-Holland Publishing Company, Amsterdam, 1975. Calvin W. H., Jak myśli mózg, CIS, Warszawa, 1997. Paivio A., The relationship between verbal and perceptual codes, W: E. C. Carterette, M. P. Friedman, (red.), Handbook of Perceptation, vol. VIII: Perceptual coding, Academic Press, New York, 1978. Paivio A., Mental Representation: A dual coding approach, Oxford University Press, New York, 1984. Kazimierczak J., Splitting natural language sentences into groups of words for purposes of automatic programming, Raport PRE No 37/92, Instytut Cybernetyki Technicznej Politechniki Wrocławskiej, Wrocław, 1992. Mierzwa J., Podział zdań pojedynczych języka naturalnego na grupy słów z wykorzystaniem gramatyki łączeń dla celów nabywania wiedzy, W: Z. Bubnicki i A. Grzech, (red.) Materiały 4 Konferencji Inżynieria Wiedzy i Systemy Ekspertowe, vol. 1, strony 252 – 257, Wrocław, 2000. Oficyna Wydawnicza Politechniki Wrocławskiej. pl s. 8. da .b w w Literatura 367 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 T. Kapłon w 17. Kazimierczak J., Knowledge representation on the level of natural language for purposes of automatic programming, W: Proceedings of the 7th International Conference „Software Engineering and Knowledge Engineering”, SEKE’95, Rockville USA, KSI Press, 1995. 18. Miller G. A., Nouns in WordNet, A lexical inheritance system, International Journal of Lexicography, 3(4): 245 – 264, 1990. Dostępna na cogsci.princeton.edu/pub/wordnet/5papers.ps. 19. Kazimierczak J., Computer reasoning with representation of the semantics of natural language sentences, Proceedings of the 10th International Conference on System-Modeling-Control, Zakopane, Poland, 2001. 20. Banasiak D., Rozpoznawanie semantyki zdań języka naturalnego na podstawie semantyki zdań zawartych w bazie wiedzy, praca doktorska, Raport PRE No 84/00 Instytut Cybernetyki Technicznej Politechniki Wrocławskiej, Wrocław, 2000. 21. Lyons J., Wstęp do językoznawstwa, PWN, Warszawa, 1975. 22. Fellbaum C., English verbs and semantics net, International Journal of Lexicography, 3(4): 281 – 301, 1990. dostępna na cogsci.princeton.edu/pub/wordnet/5papers.ps. 23. Sterna A., Określanie kategorii semantycznych grup słów i reprezentacja semantyczna zdań języka naturalnego, W: Z. Bubnicki i A. Grzech, (red.) Materiały 4 Konferencji Inżynieria Wiedzy i Systemy Ekspertowe, vol. 1, strony 252 – 257, Wrocław, 2000. Oficyna Wydawnicza Politechniki Wrocławskiej. 24. Marciszewski W., (red.), Mała encyklopedia logiki, Zakład Narodowy im. Ossolińskich – Wydawnictwo, Wrocław, Warszawa, Kraków, Gdańsk, Łódź, 1988. 25. Rosch E., Cognitive representation of semantic categories, Journal of Experimental Psychology, 104: 192 – 233, 1975. 26. Bruce B., Moser M. G., Case Grammar, W: S. C. Shapiro, (red.), Encyclopedia of Artificial Intelligence, vol. 1, strony 563 – 570. John Wiley and Sons, New York, 1992. da .b w w pl s. 368 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008