pobierz plik referatu

Transkrypt

pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Rozdział 28
w
Model formalny obrazowej reprezentacji semantyki
zdań języka naturalnego
w
1 Wstęp
da
.b
w
Streszczenie. W rozdziale przedstawiono model formalny obrazowej reprezentacji semantyki zdań języka naturalnego, który został opracowany
w oparciu o wiedzę z zakresu psychologii poznawczej opisującej proces rozumowania człowieka jako przetwarzanie obrazów pojęć i ich znaczenia w
oderwaniu od języka komunikacji. W rozdziale przedstawiono uzasadnienie
poznawcze i filozoficzne opisywanego podejścia, opisano proces tworzenia
obrazów semantycznych oraz uzasadniono poprawność przedstawionej reprezentacji.
pl
s.
W niniejszym rozdziale zaprezentowany zostanie model formalny obrazowej reprezentacji
semantyki zdań języka naturalnego, będący podstawą rozważań dotyczących realizacji
procesu wnioskowania na elementach bazy wiedzy. Elementami tymi są, reprezentowane
przy użyciu wyrażeń symbolicznych, zdania składające się na przekaz. Zdania te mogą być
zbiorem faktów, czyli stanowić wiedzę faktograficzną z danej dziedziny (geografia, historia, astronomia), jak również opisywać pewne zdarzenia rozgrywające się w czasie i dotyczące pewnej dziedziny, czyli przedstawiać sobą wiedzę epizodyczną. Proces wnioskowania inicjowany jest pytaniem, a efektem jest, jeśli istnieje, odpowiedź oparta na zgromadzonej wiedzy, sformułowana w postaci zdania języka naturalnego.
W kolejnych podrozdziałach przedstawione zostaną przykłady zdań opisujących fakty
i zdarzenia oraz szczegółowo opisana zostanie analiza syntaktyczna i semantyczna zdań
oraz tworzenie obrazów semantycznych.
Poniżej zaprezentowano strukturę modelu obrazowej reprezentacji semantyki zdań języka naturalnego. Przedstawiony przegląd istniejących już modeli reprezentacji semantyki
zdań oraz psychologiczne i filozoficzne podstawy proponowanego modelu. Następnie
omówiono sposób reprezentacji struktury składniowej zdań gromadzonych w bazie wiedzy,
Tomasz Kapłon
Politechnika Wrocławska, Instytut Informatyki, Automatyki i Robotyki, ul. Janiszewskiego 11/17,
50-372 Wrocław, Polska
email:[email protected]
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
model reprezentacji semantyki oraz jego ograniczenia. Na koniec przedstawiono problem
określania komponentów semantycznych1 zdań.
2 Reprezentacja semantyki
w
Reprezentacja wiedzy zależy od dziedziny, której wiedza ta dotyczy. Różne problemy występują w przypadku formalnego opisu różnego rodzaju języków, którymi wiedza opisywana jest naturalnie. Języki techniczne (np.: matematyka, logika, chemia, języki programowania) posiadają jednoznaczne, ścisłe i niezmienne reguły składniowe oraz jednoznaczny
sposób odczytu. Języki naturalne (np.: polski, angielski) są językami wieloznacznymi,
o indywidualnym i bogatym charakterze (np.: dialekty). Przede wszystkim są językami
starszymi od języków technicznych, ewoluowały w sposób niekontrolowany, przez co
sposób interpretacji świata i konstruowania zdań w oparciu o tę interpretację oparty jest
ściśle na skojarzeniach z obrazami. Języki naturalne posiadają jednak reguły gramatyczne
i stylistyczne, które zbliżają języki naturalne do języków technicznych. Istnieje możliwość
wykorzystania istniejących w danym języku reguł do stworzenia w oparciu o nie modelu
formalnego reprezentacji i modelu przetwarzania (np.: wnioskowania) zdań języka naturalnego. Implementacja takiego modelu pozwoliłaby na kontakt człowiek–maszyna za pomocą języka naturalnego.
Początki badań nad zagadnieniami rozumienia treści przekazów słownych i w ogóle sposobem gromadzenia i przetwarzania informacji przez człowieka prowadzone były na gruncie lingwistyki [1], [2], psychologii poznawczej [3], [4] oraz filozofii [5]. Powstałe na tym
gruncie koncepcje doprowadziły do powstania tzw. metafory komputerowej [3], zakładającej, że:
− informacja przetwarzana jest „od dołu do góry’2 oraz
− przetwarzanie to, jest sekwencyjne.
O ile prawdziwość tej metafory została, w wyniku eksperymentów psychologii poznawczej, zakwestionowana – procesy przetwarzania informacji przez człowieka mogą być wykonywane równolegle – o tyle, z punktu widzenia sekwencyjnego działania współczesnych
komputerów oraz nie uwzględniania w istniejących modelach badania kontekstu, jest nadal
prawdziwa.
Niemniej jednak, badania i eksperymenty nie dają nadal jednoznacznego zestawu reguł,
który umożliwiłby formalny opis semantyki. Dają natomiast podstawy do tworzenia aparatów formalnych, które przyczyniają się do powstania systemów komputerowych mających
na celu umożliwienie kontaktu człowiek–maszyna w języku naturalnym [6].
Z punktu widzenia zadania jakim jest model formalny reprezentacji i jego wykorzystanie
do wnioskowania, istotne są koncepcje dotyczące operacji na reprezentacji semantyki zdań
lub pojęć (gromadzenie i przetwarzanie). Najwcześniejsze z nich to opracowany przez
Collinsa i Quilliana [7] model pamięci semantycznej, zrealizowany w postaci sieci semantycznej. Sieć semantyczna jest reprezentacją zależności pomiędzy pojęciami ujętymi w hierarchiczną strukturę zawierania się. Jest to szeroko stosowany, nie tylko w odniesieniu do
zależności semantycznych, mechanizm klasyfikowania pojęć, z których te na niższych po-
da
.b
w
w
pl
s.
1
komponenty semantyczne – podstawowe elementy grafów semantycznych
przetwarzanie „od dołu do góry” (ang. bottom-up) wywodzi się z koncepcji, która mówi, że treść
informacji (wiedzy) przetwarzanej przez jednostkę (człowieka) wyznaczona jest przez bodźce docierające ze środowiska i oczekiwania, co do wyniku przetwarzania, nie mają wpływu na przetwarzanie,
[3 – str.13].
2
352
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
w
ziomach dziedziczą cechy pojęć na poziomach wyższych z jednoczesną możliwością posiadania cech własnych, dziedziczonych następnie przez kolejne pojęcia z poziomów niższych.
Rozszerzeniem tej koncepcji był model sieci poznawczej Normana i Rumelharta (1975).
Model ten poza możliwością przechowywania wiedzy usystematyzowanej pozwalał na
gromadzenie wiedzy deklaratywnej i wiedzy proceduralnej. Podstawową zaletą tego modelu była możliwość opisywania zdarzeń poprzez takie elementy jak predykat – jednoznacznie kojarzony z wykonywaną akcją (grupa czasownikowa w zdaniu) – oraz sprawcą, przedmiot i adresat akcji. Jednocześnie jako argumenty mogą występować współrzędne przestrzenne i czasowe.
Pierwszym modelem, w którym wprowadzone zostało rozróżnienie warstwy syntaktycznej (powierzchniowej) i semantycznej (głębokiej) był opracowany przez Fillmora formalizm gramatyki przypadków (ang. case grammar) [8]. W modelu Fillmora głównym elementem zdania jest fraza czasownikowa. Pozostałe frazy pozostają z nią w określonych
związkach. Semantykę zdania określa zestaw ról semantycznych (przypadków) przypisanych frazom zdania (AGENT, OBJECT, LOCATION, itd.). Formalizm ten określa również
sposób reprezentacji semantyki zdań w postaci ram przypadków.
Na gruncie modelu Normana i Rumelharta oraz gramatyki przypadków Fillmora powstała koncepcja reprezentacji semantyki za pomocą tzw. grafów konceptualnych, której autorem był Sowa (1975) [9]. Przewagą modelu Sowy nad modelem Fillmora była zaczerpnięta
z modelu Normana i Rumelharta [10], możliwość obrazowania zależności czasowych
i zdań zagnieżdżonych.
Krok dalej w głąb znaczenia zawartego w zdaniu poszedł Schank w teorii zależności pojęciowych (ang. conceptual dependences theory) [11]. Formalizm zaproponowany przez
Schanka jako centralny element zdania traktował, podobnie jak Fillmore i Sowa, frazę
czasownikową. Teoria Schanka stała jednak w pewnej opozycji do teorii Fillmora. Teoria
zależności pojęciowych traktuje rozumienie semantyki jako zestawy prymitywów (ang.
language-free primitives) służących do konstruowania struktur zależności reprezentujących
semantykę zdania. Podstawę tej teorii stanowią dwa założenia wynikające z obserwacji
zdań i ich znaczenia:
− słowa w zdaniach nie zawierają pełnej informacji koniecznej do zrozumienia znaczenia prezentowanego w zdaniu – więcej jest pomyślane niż powiedziane,
− każda akcja i zdarzenie może być dekomponowane na struktury złożone z prymitywów.
Teoria zależności pojęciowych, po prostu, wyprowadza w formie jawnej to, co w teorii
Fillmora było przyjmowane za wiadome i niewymagające wyjaśnienia. Jeżeli człowiek
idzie, to oznacza to, że porusza nogami, jeżeli porusza nogami, to porusza lewą i prawą
nogą, jeżeli porusza nogą, to również wykonuje ruch tułowiem. Taką wyliczankę można
konstruować dochodząc do ruchów atomów i być może na tym etapie nie kończąc, chociaż
z punktu widzenia sensu zdania informacje te nie są istotne. Teoria Schanka zakłada, że
cała wiedza jest już dostępna, skoro da się dekomponować każdą akcję i w dodatku określać elementy konieczne do wykonania takiej akcji. Z tego powodu, traktując system wnioskujący jako system uczący się, teoria ta nie ma zastosowania w dalszych rozważaniach,
ponieważ, gdyby cała wiedza byłaby już dostępna nie byłoby celowe tworzenie systemu
wnioskującego, a jedynie odtwarzającego wiedzę.
Oprócz wspomnianych pojawiają się również koncepcje słuszne, lecz albo słabo określone – procesy rozumowania w ujęciu ewolucyjnym [12] albo posługujące się, jak w przypadku koncepcji ekologicznej – teoria Gibsona [3], zależnością postrzegania świata
z uwzględnieniem nie tylko odbieranych bodźców, lecz również akcji motorycznych, co
w przypadku przetwarzania zdań języka nie ma zastosowania.
da
.b
w
w
pl
s.
353
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
w
Proponowana reprezentacja nie jest reprezentacją rewolucyjną. Wszelkie wcześniejsze
doświadczenia, rozważania i koncepcje są w nią wpisane. Ujęcie reprezentacji semantyki
jako reprezentacji obrazowej jest bezpośrednim odwołaniem do naturalnego sposobu reprezentacji świata. Bezpośrednie przeniesienie obrazów do pamięci komputera nie jest oczywiście możliwe ze względu na nieadekwatność struktur gromadzenia i przetwarzania informacji w mózgu człowieka i pamięci komputera.
Użycie pojęcia „obrazowy” ma tutaj uzasadnienie w postaci odwzorowania „obrazu”
znaczenia zdania w pewien ciąg symboli je reprezentujących. Podejście takie nie jest jedynie prywatną koncepcją autora. Posiada ono uzasadnienie we wspomnianych pracach z zakresu przetwarzania semantyki, jak również – stanowiących przesłankę do określania sposobu reprezentacji semantyki w postaci obrazów jako sposobu naturalnego – ma swoje
uzasadnienie w pracach filozoficznych i oparcie w badaniach z zakresu psychologii poznawczej, co zostanie zaprezentowane w kolejnych punktach rozdziału.
w
2.1 Teoretyczne podstawy reprezentowania semantyki
w
da
.b
Około 80 procent informacji o otaczającym świecie rejestrowana jest przez człowieka poprzez percepcję wizualną. Gromadzona wiedza jest następnie przekazywana w postaci
werbalnej. Zgodnie z [3] proces pozyskiwania wiedzy o środowisku przebiega w następujący sposób. Obserwowane zjawisko przechowywane jest przez bardzo krótki czas (kilkadziesiąt milisekund do kilku sekund) w pamięci ultrakrótkiej. Charakterystyczne jest w tym
przypadku to, że pamiętane są wszystkie szczegóły zjawiska. Następnie informacja przetwarzana jest na postać obrazu symbolicznego. W procesie przetwarzania następuje usunięcie szczegółów i pozostawienie jedynie elementów istotnych dla odbiorcy. Elementy te
oraz ich wzajemny układ i skojarzenia (połączenia) stanowią o znaczeniu, semantyce postrzeganego zjawiska – zdarzenia lub faktu – i umieszczane są w pamięci trwałej.
Każde kolejne postrzegane zjawisko powoduje generowanie kolejnego obrazu a poszczególne obrazy symboliczne składają się na całościowy obraz środowiska [13], [14].
Akt komunikacji polega na przekazywaniu obrazów z pamięci trwałej nadawcy w postaci zdań do odbiorcy. Na tym etapie pojawia się problem niejednoznaczności przekazywanej
treści. Jednoznaczny przekaz zachodziłby wtedy, gdyby konstrukcja i słowa użyte w przekazie powodowały u odbiorcy wykreowanie obrazu identycznego jak u nadawcy. Przypadek taki właściwie nie ma szans zaistnienia, a powodem tego jest między innymi bogactwo
form językowych, unikalny sposób działania mózgu ludzkiego i tworzenie specyficznych
obrazów czy istnienie dotychczasowych doświadczeń – różnych u nadawcy i odbiorcy –
podczas których obrazy pojęć, ich klasyfikacja i skojarzenia z formami językowymi były
tworzone.
Podobny, co do powstawania obrazów semantycznych, pogląd można znaleźć w pracach
filozoficznych. Najistotniejsze przesłanki, jak się wydaje z punktu widzenia przeprowadzonych tutaj rozważań, znajdują się w dziele Wittgensteina Tractatus logico-philosophicus:
− „tworzymy sobie obrazy faktów” (teza 2.1),
− „obraz jest modelem rzeczywistości” (teza 2.11),
− „obraz jest faktem”, (teza 2.14),
− „to, co obraz przedstawia, stanowi jego sens” (teza 2.221).
Powyższe tezy określają sposób w jaki postrzegamy otaczający nas świat. Przetwarzamy, a właściwie mózg przetwarza stany rzeczy na szeregi uporządkowanych obrazów tworzących w umyśle mentalny model rzeczywistości. Teza 3, „logicznym obrazem faktów jest
myśl” oraz 3.01, „ogół myśli prawdziwych jest obrazem świata” określa sposób tworzenia
całościowego obrazu świata [5]. Ograniczenia w opisie świata zawarte są jedynie w sile
pl
s.
354
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
w
wyrazu języka oraz, co istotne dla rozważań nad modelem formalnym obrazowania semantyki, w tym, iż opis świata składa się jedynie ze zdań sensownych.
Tworzenie i działanie na obrazach semantycznych niemożliwe jest bez znajomości struktury syntaktycznej przekazu. Sytuacja analogiczna powstaje w przypadku wyprowadzenia
wyniku procesu rozumowania jako przekazu w formie zdań języka. Konieczna jest wtedy
znajomość asocjacji elementów obrazu i słów je opisujących. Wymaga to gromadzenia
w pamięci komputera informacji o strukturze syntaktycznej i semantycznej przekazu oraz
o ich wzajemnych związkach. Taki sposób przechowywania wiedzy zaproponowany został
przez Paivia [13] i znany jest jako koncepcja podwójnego kodowania. Postuluje on istnienie
dwóch niezależnych systemów reprezentacji: werbalnego i obrazowego. Koncepcja podwójnego kodowania pokazana została na rys. 1.
Zgodnie z [13] wiedza pozyskiwana jest poprzez analizę sensoryczną. Wiedza ta gromadzona jest w dwóch niezależnych jednak wzajemnie powiązanych systemach reprezentacji,
(werbalnym i obrazowym). W systemie werbalnym spostrzeżenia gromadzone są w postaci
logogenów, które stanowią nazwy obiektów, natomiast w systemie obrazowym przechowywane są imageny reprezentujące spostrzeżenia i wyobrażenia. Oba systemy połączone są
ze sobą za pomocą relacji odnośności, które to wskazują na odpowiedniki istniejące w obu
systemach. Ponieważ oba systemy są niezależne od siebie możliwe jest istnienie zarówno
logogenów jak i imagenów nieposiadających swoich odpowiedników w drugim systemie.
Są to logogeny abstrakcyjne odpowiedzialne za tworzenie pojęć abstrakcyjnych, pozwalające na wprowadzenie operacji klasyfikacji i łączenie obiektów w grupy – nie zawsze dostępne percepcyjnie [3] – oraz imageny bez nazwy reprezentujące wyobrażenia, którym nie
odpowiada żaden rzeczywisty obiekt. Zarówno logogeny jak i imageny łączone są w ramach swoich systemów za pomocą relacji asocjacyjnych.
Biorąc pod uwagę powyższe koncepcje należy spojrzeć teraz na sposób działania komputera. Gromadzenie wiedzy w postaci graficznej, czyli obrazów sensu stricte, tworzonych
na podstawie zdań składających się na przekaz jest nieefektywne z punktu widzenia organizacji i sposobu działania komputera. Obrazy semantyczne muszą być gromadzone w oparciu o konstrukcje, które pozwolą na efektywne ich przetwarzanie komputerowe.
Odpowiednią reprezentacją są grafy semantyczne z komponentami semantycznymi reprezentowanymi przez wierzchołki oraz związkami i zależnościami komponentów w postaci
krawędzi. Każde zdanie przekazu transformowane jest na postać grafu semantycznego
reprezentującego fragment rzeczywistości. Grafy poszczególnych zdań nakładane są na
siebie tworząc w ten sposób graf zbiorczy stanowiący obraz semantyczny przekazu, który
jest odzwierciedleniem pewnego fragmentu świata rzeczywistego. Nakładanie to realizowane jest poprzez identyczne komponenty semantyczne występujące w zdaniach przekazu.
da
.b
w
w
pl
s.
355
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
bodźce
werbalne
bodźce
niewerbalne
systemy sensoryczne
w
r
e
l
a
c
j
e
O
B
R
A
Z
O
W
Y
a
s
o
c
j
a
c
y
j
n
e
imagen
koń
relacja
logogen
koń
referencyjna
koń i pies
(zwierzę)
imagen
pies
w
w
S
Y
S
T
E
M
relacja
logogen
pies
referencyjna
logogeny pojęć
abstrakcyjnych
da
.b
imageny
bez
nazw
logogen
zwierzę
wyjście
systemu
niewerbalnego
r
e
l
a
c
j
e
S
Y
S
T
E
M
a
s
o
c
j
a
c
y
j
n
e
W
E
R
B
A
L
N
Y
wyjście
systemu
werbalnego
Rys. 1. Koncepcja podwójnego kodowania wg Paivia.
2.2 Analiza syntaktyczna zdań
pl
s.
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego przedstawiony zostanie w podrozdziale 2.4. Podstawą tworzenia obrazów semantycznych jest analiza semantyczna zdań oparta o analizę i reprezentację struktury składniowej zdań. Obie analizy omówione zostaną poniżej.
Wytworzenie obrazu semantycznego zdania przekazu możliwe jest po dokonaniu analizy
składni zdania (analiza syntaktyczna). Analiza syntaktyczna ma na celu podział zdań przekazu na grupy słów, które stanowią funkcjonalny odpowiednik, na poziomie powierzchniowym, ról semantycznych poziomu głębokiego zdania. Stąd, grupy te nazywane będą
funkcjonalnymi grupami słów. Podstawą podziału jest informacja leksykalna dotycząca
słów zawartych w zdaniu. W procesie wprowadzania zdań do bazy wiedzy każdemu wyrazowi nadawana jest kategoria leksykalna. Podział wykonywany jest przez pewien automat,
parser syntaktyczny [15], [16]. Każda grupa składa się z jednego lub kilku wyrazów i może
być reprezentowana przez graf skierowany. Wierzchołki grafu odpowiadają słowom, krawędzie określają następstwo słów w grupie. Podobnie, jako ciąg funkcjonalnych grup słów,
356
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
stanowiących wierzchołki grafu połączone krawędziami następstw, reprezentowane jest
zdanie. Założenia dotyczące struktury gromadzenia wiedzy w postaci wyrażeń symbolicznych [15] określają hierarchiczną, trójpoziomową strukturę grafową reprezentacji zdań
w bazie wiedzy, gdzie każde zdanie pojedyncze reprezentowane jest jako izolowany wierzchołek. Sposób tworzenia powyższej struktury przedstawiono na poniższym przykładzie.
Do bazy wiedzy wprowadzane jest zdanie.
w
A man lives in town.
(S1)
w
w
Jest ono dzielone na grupy słów w następujący sposób:
a man ↔ d1 d2 ↔ a1
lives ↔ d3 ↔ a2
in town ↔ d4 d5 ↔ a3
gdzie: symbole dj reprezentują wyrazy, aj grupy słów. Każde zdanie oznaczane jest symbolem sl i opisane jest na poziomie grup słów ciągiem:
s1 = a1 a2 a3 ↔ c1
(2.1)
da
.b
W ten sposób określone zostają struktury poszczególnych poziomów reprezentowane poprzez grafy pokazane, wraz z ilustracją struktury hierarchicznej, na rys. 2.
Zgodnie z przyjętym sposobem reprezentacji struktury grafowe gromadzone są w bazie
wiedzy w postaci równoważnych im wyrażeń symbolicznych.
Dla poziomu I wyglądają one następująco:
D+(a1) = 0( d1 1( z1a1d2 2( z3a1d1 )2 )1 )0
D+(a2) = 0( d3 1( z3a2d3 )1 )0
D+(a3) = 0( d4 1( z1a3d5 2( z3a3d4 )2 )1 )0
gdzie: z1 oznacza połączenie pomiędzy kolejnymi słowami w grupie, z3 oznacza koniec
ciągu słów w grupie.
s1
z1s1
z1s1
a2
pl
s.
a1
poziom III
a3
poziom II
z3s1
z1a1
z1a3
d1
d2
z3a1
d3
z3a2
d4
d5
z3a3
poziom I
Rys. 2. Graf struktury syntaktycznej zdania S1
357
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
Zbiór grup słów reprezentowany jest w bazie wiedzy w postaci zbiorczego wyrażenia symbolicznego D’+ będącego kompozycją wyrażeń symbolicznych typu D+(ar).
D’+ = 0( d1 1( z1a1d2 2( z3a1d1 )2 )1, d3 1( z3a2d3 )1, d4 1( z1a3d5 2( z3a3d4 )2 )1)0
(2.2)
w
Poziom II, reprezentujący strukturę zdania, zapisywany jest w postaci wyrażenia A+(sj),
a struktura wszystkich zdań wprowadzonych do bazy wiedzy zapisywana jest w wyrażeniu
A’+. W przypadku powyższego przykładu wyrażenie A’+ jest równoważne wyrażeniu A+(sj),
co wynika z faktu istnienia tylko zdania S1 w bazie wiedzy i ma następującą postać:
A’+ = 0( a1 1( z1s1a2 2( z1s1a3 4( z3s1a1 )4 )3 )2 )1 )0
(2.3)
w
w
W przypadku występowania zdań złożonych współrzędnie oraz części zdań złożonych podrzędnie, zdania takie reprezentowane są jako ciągi zdań pojedynczych łączonych spójnikami. Powyższy model reprezentacji warstwy syntaktycznej zdań przedstawiony jest w pracy
[17]. Podział zdania na grupy słów stanowi podstawę do wykonania analizy semantycznej
zdania, co z kolei prowadzi do wytworzenia obrazu semantycznego zdania.
2.3 Analiza semantyczna
da
.b
W wyniku analizy syntaktycznej wyodrębnione zostają funkcjonalne grupy słów będące
odpowiednikami, na poziomie powierzchniowym, ról semantycznych poziomu głębokiego
zdania. Stąd też, każda z grup pełni pewną rolę semantyczną. W przypadku języka angielskiego, rola semantyczna zależna jest od pozycji grupy w zdaniu. Pozycja w zdaniu decyduje o tzw. typie grupy. Typ grupy natomiast determinuje rodzaj rdzenia semantycznego
grupy – zależność rdzenia od typu grupy pokazany został w tabeli 1. Rdzeń semantyczny
jest nazwą pojęcia, do którego odnosi się grupa. Rdzenie semantyczne podlegają kategoryzacji określając w ten sposób rolę (kategorię) semantyczną grupy. Same jednak reprezentują pojęcia określane jako cechy semantyczne. Cechy i kategorie semantyczne określane są
mianem komponentów semantycznych. Ciągi komponentów semantycznych określają semantykę zdania, przy czym podstawowymi komponentami są cechy semantyczne, natomiast komponentami dodatkowymi, kategorie semantyczne. Wynikiem analizy semantycznej jest nadanie cech i kategorii semantycznych grupom słów, czyli określenie znaczenia
zdania.
typ grupy
rzeczownikowa
przyimkowa
czasownikowa
przymiotnikowa
przysłówkowa
pl
s.
Tabela 1. Typy grup słów
rdzeń semantyczny
rzeczownik
rzeczownik
czasownik
przymiotnik
przysłówek
Zbiór ról semantycznych pełnionych przez grupy słów jest oczywiście ograniczony możliwościami ekspresywnymi języka, natomiast nie jest jednoznacznie określony [8]. W tabeli 2 przedstawiono zbiór kategorii semantycznych wykorzystany w pracy.
Jednym z celów prezentowanego modelu jest osiągnięcie maksymalnego zakresu ogólności zastosowania – maksymalnie dużo wiedzy w postaci minimalnej liczby obrazów semantycznych oraz maksymalnie dużo możliwości wnioskowania na wiedzy z różnych dzie358
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
dzin, przy minimalnej liczbie reguł – możliwie niezależnych od dziedziny wiedzy, na której
odbywa się wnioskowanie.
Tabela 2. Kategorie semantyczne grup słów
kategoria semantyczna
w
AGENT
ACTION
OBJECT
LOCATION
CO-AGENT
INSTRUMENT
TIME
FEATURE
w
w
MANIER
GOAL
typ grupy
o określonej roli
rzeczownikowa
czasownikowa
rzeczownikowa
Przyimkowa
rzeczownikowa
Przyimkowa
rzeczownikowa
przymiotnikowa
przysłówkowa
przysłówkowa
rzeczownikowa
funkcja w zdaniu
podmiot akcji
akcja
przedmiot akcji
miejsce akcji
odbiorca akcji
narzędzie akcji
czas wykonania akcji
cecha podmiotu lub akcji
sposób wykonania akcji
cel akcji
da
.b
Wynikiem takiego założenia jest konieczność przechowywania wiedzy i reguł wnioskowania w postaci spełniającej powyższe wymagania. Stąd, zastosowanie kategorii semantycznych w tym celu. Kategorie semantyczne stanowią pomost pomiędzy najgłębszą, intencjonalną, warstwą języka, a warstwą zewnętrzną, werbalną. Łączą ze sobą myśli i słowa.
Stąd też dają najbardziej ogólny sposób reprezentacji wiedzy możliwy do formalnego ujęcia. Dając możliwość wykorzystania formalizmu zgodnie w powyższymi założenia odnośnie maksymalnego zakresu ogólności przechowywanej wiedzy i minimalnego zakresu
obciążenia pamięci.
Ciągi kategorii semantycznych stanowią swoiste szablony zdań, które uzupełniane są
wyrazami odpowiednimi do charakteru konstruowanej wypowiedzi. W przypadku realizacji
procesu wnioskowania komputer wykonywał będzie czynność identyczną do tej, którą człowiek wykonuje w procesie werbalizacji myśli, tzn. będzie wypełniał pola ról semantycznych o określonych kategoriach semantycznych odpowiednimi wyrazami tak, aby przedstawić wynik procesu wnioskowania w postaci czytelnej dla człowieka (użytkownika), czyli
w postaci zdań języka.
Kategorie semantyczne opisują role semantyczne grupy, nie konkretyzują jednak znaczenia grupy i nie określają przez to jej własności semantycznej. Rolę tę spełniają cechy semantyczne nadawane wyekstrahowanym rdzeniom grup słów. W języku angielskim wyrazy
dzieli się na wyrazy z treścią semantyczną (rzeczowniki, czasowniki, przymiotniki oraz niektóre przysłówki) oraz wyrazy strukturalne (zaimki, określniki, przyimki i spójniki). Cecha
semantyczna nadana może zostać tylko wyrazom posiadającym treść semantyczną.
pl
s.
Definicja 1 Cecha semantyczna opisuje własności wyrazu i jest nadawana tylko wyrazom
posiadającym treść semantyczną.
Interpretacja cechy semantycznej zależna jest natomiast od kategorii leksykalnej słowa
będącego rdzeniem grupy. Różna informacja reprezentowana przez rzeczowniki i czasowniki wynika z odmiennych funkcji pełnionych w zdaniu. W przypadku rzeczowników cechy semantyczne odpowiadają typom obiektów, które opisują. Podział tych obiektów na
grupy może być mniej lub bardziej szczegółowy i zależny również od dziedziny zastosowania. Powoduje to problem zdefiniowania uniwersalnego zbioru cech semantycznych. Podobnie w przypadku czasowników, w zależności od sposobu klasyfikacji (Schank, Levin),
359
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
liczność grup, jak i przyporządkowanie wewnątrz nich mogą być różne. Dlatego też przyjęto zestaw cech semantycznych rzeczowników, tabela 4, i czasowników, tabela 3. Oba zestawy powstały w oparciu o słownik WORDNET [18].
Tabela 3. Zbiór cech semantycznych czasowników.
kategoria czasownika
przykład
BODY FUNCTIONS
sleep, ache, tire, snore
bv2
CHANGE
convert, increase, correct
bv3
COMMUNICATION
order, thank, teach
bv4
COMPETITION
fight, race, arm, team
bv5
CONSUMPTION
drink, eat, smoke, use
bv6
CONTACT
rub, mpe, grip, slice, point
by7
COGNITION
deduce, induce, infer
w
symbol cechy
bv1
bv9
bv10
bvl2
bvl3
bvl4
bvl5
CREATION
create, make, write
MOTION
run, go, swim, fly
EMOTION
love, hate, hope, fear
STATIVE
be, live, exist, occur, hate
PERCEPTION
see, hear, smile, taste
POSSESSION
have, give, receive, robb
SOCIAL INTERACTION
impeach, educate, vote, try
WEATHER
rain, snow, thunder, hail
da
.b
bv11
w
w
bv8
Tabela 4. Zbiór cech semantycznych rzeczowników.
cecha semantyczna
przykład
bnl
ACT, ACTION, ACTIVITY
walk, run, work, play, dance
bn2
ANIMAL, FAUNA
mammal, fish, bird, dog, cat
bn3
ARTEFACT
table, chair, car, train, house
bn4
ATTRIBUTE, PROPERTY
age, size, colour, consistency, taste
bn5
BODY, CORPUS
head, arm, leg, eye, hand, finger
bn6
COGNITION, KNOWLEDGE
mind, perception, history, chemistry
bn7
COMMUNICATION
language, voice, talk, letter, massage
bn8
EVENT, HAPPENING
accident, party, scandal, start
bn9
FEELING, EMOTION
love, hate, hope, happiness, apathy
bnl0
FOOD
meat, egg, milk.juice, apple, lunch
bnll
GROUP, COLLECTION
ciass, family, herd, shoal, array
bnl2
LOCATION, PLACE
room, garden, London, district
bnl3
MOTIVE
impulse, occasion, passion, reason
pl
s.
symbol
cechy
360
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
NATURAL OBJECT
sun, moon, sky, river, lake, mountain
bnl5
NATURAL PHENOMENON
rain, snow, wind, fermentation
bnl6
PERSON, HUMAN BEINGS
man, woman, child, adult, doctor
bnl7
PLANT, FLORA
tree, flower, grass, com, oak
bnl8
POSSESSION
present, donation, inheritance, salary
bnl9
PROCESS
synthesis, reaction, evolution, erosion
bn20
QUANTITY, AMOUNT
unit, number, byte, millimetre, degree
bn21
RELATION
identity, parity, part, chronology
bn22
SHAPE
point, line, circie, column, solid
bn23
STATE, CONDITION
life, death, health, employ, freedom
bn24
SUBSTANCJE
atom, mixture, water, wood, oxygen
bn25
TIME
hour, day, week, year, Monday
w
bnl4
w
w
W oparciu o tabele 3 i 4 grupom słów zdania S1 nadawane są kategorie, a wyodrębnionym
z grup rdzeniom, cechy semantyczne stanowiące podstawę tworzenia obrazu semantycznego zdania.
da
.b
Kategorie semantyczne przypisane grupom to:
a man ↔ a1 → AGENT
live ↔ a2 → ACTION
in town ↔ a3 → LOCATION
Cechy semantyczne nadane rdzeniom (zaznaczone pogrubioną czcionką) to:
a man ↔ a1 → HUMAN ↔ bn16
live ↔ a2 → STATIVE ↔ bv11
in town ↔ a3 → PLACE ↔ bn12
gdzie: symbol bi oznacza cechę semantyczną.
AGENT
u1
ACTION
a1
u3
LOCATION
a2
a3
pl
s.
Strukturę semantyczną zdania S1 na poziomie kategorii semantycznych można przedstawić
w postaci ciągów kategorii połączonych symbolami uj.
↔
c1*
(2.4)
Struktura zdania S1 na poziomie cech semantycznych obrazowana jest podobnie z wykorzystaniem cech semantycznych.
HUMAN
bn16
u1
STATIVE
bv11
u3
PLACE
u0
↔
c1+
(2. 4a)
bn12
Symbol c1* jest oznaczeniem semantyki zdania S1 na poziomie kategorii semantycznych,
symbol c1+ jest oznaczeniem semantyki na poziomie cech semantycznych Symbol uj reprezentuje parę kategorii semantycznych kolejnych grup słów.
u1 – AGENT → ACTION,
u2 – AGENT → CO-AGENT,
u3 – ACTION → LOCATION,
361
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
u0 – sprzężenie zwrotne
gdzie: symbol u0 oznacza koniec ciągu komponentów semantycznych.
w
Ponieważ wprowadzone zostały, jako łączniki, symbole uj zapis w postaci ciągów cech semantycznych jest zapisem bogatszym w informację w stosunku do zapisu za pomocą ciągów kategorii semantycznych, dlatego też do konstruowania obrazów semantycznych wykorzystywany będzie zapis za pomocą cech semantycznych.
Wprowadzimy teraz definicję grafu semantycznego.
da
.b
w
w
Definicja 2 Graf semantyczny tworzony jest na podstawie ciągu cech semantycznych
w następujący sposób:
− wierzchołki grafu reprezentowane są przez cechy semantyczne i oznaczane symbolami bi,
− krawędzie grafu skierowane są zgodnie z następstwem kategorii semantycznych
i reprezentowane (opisane) są symbolami uj, gdzie j = 1, 2, 3, …, n, w przypadku łączenia następujących po sobie cech semantycznych grup słów i stanowiących o strukturze grup w zdaniu, gdzie j = 0, w przypadku łączenia wierzchołka końcowego i początkowego
− każda krawędź oznaczona jest symbolem cl, identyfikującym unikalną strukturę semantyczną wszystkich zdań o semantyce cl.
Na podstawie ciągów cech semantycznych, takich jak (2.4), tworzone są grafy semantyczne
zdań. W pamięci grafy będą reprezentowane przez równoważne im wyrażenia symboliczne.
Zgodnie w powyższym, ciąg (2.4) można przedstawić w postaci grafu (rys. 3).
u1c1+
bn16
u3c1+
bv11
bn12
pl
s.
u0c1+
Rys. 3. Graf semantyczny zdania S1
Podobnie jak strukturę syntaktyczną grup słów i zdań (por. wyrażenia symboliczne D’+
i A’+), można przedstawić w postaci równoważnego jej wyrażenia symbolicznego B+(c1+).
B+(c1+) = 0( bn16 1( u1c1+bv11 2( u3c1+bn12 3( u0c1+bn16 )3 )2 )1 )0
(2.5)
Aby określić zależność pomiędzy strukturą syntaktyczną, A+(c1) i semantyczną B+(c1+)
porównywane są ciągi a1a2a3 ↔ c1 i bn16u1, bv12u2, bn12u3 → c1+. Rezultatem porównania
jest złożenie: u1a1, u2a2, u3a3 → c1. które transformowane jest do postaci wyrażenia symbolicznego U’+(c1):
362
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
U+(c1) = 0( u1 1( a1c1u2 2( a2c1u3 3( a3c1u1 )3 )2 )1 )0 = U’+
(2.6)
w
Symbol semantyki (c1) dołączany jest do wyrażenia zbiorczego U’+ określającego związki
pomiędzy reprezentacją składni i obrazem semantycznym wszystkich zdań wprowadzonych
do bazy wiedzy.
Koncepcja określenia zależności pomiędzy strukturą syntaktyczną i semantyczną zaczerpnięta została z pracy [19]. Znajomość powyższej zależności jest niezbędna do realizacji
procesu wnioskowania. Należy zwrócić uwagę na trzy istotne sprawy związane z tworzeniem obrazów semantycznych:
− określanie oraz dobór kategorii i cech semantycznych – punkt 2.5, jednoznaczność
reprezentacji obrazowej – 2.4,
− równoważność semantyczną zdań, czyli nadawanie unikalnych symboli semantyk.
Pierwsze dwa problemy omówione zostaną w kolejnych punktach, natomiast kwestię równoważności semantycznej przedstawiono w pracy [20]. W rozdziale przyjmuje się, że rozpoznawanie semantyk i ocena ich unikalności jest rozwiązana w oparciu o pracę [20].
w
w
2.4 Jednoznaczność reprezentacji obrazowej
da
.b
Pomimo, iż grafowa reprezentacja semantyki pozwala na tworzenie szablonów zdań określonego typu, co pozwala na zmniejszenie ilości miejsca potrzebnego do gromadzenia wiedzy na temat znaczenia treści przekazu, nie jest ona jednak pozbawiona wad. W przyjętym
modelu założone zostało, że grafy semantyczne są grafami cyklicznymi, co determinuje
rozróżnialność wierzchołków grafu. Nie wynika to jedynie z założenia, co do modelu, ale
jest koniecznością z punktu widzenia zachowania poprawności gromadzonej wiedzy. Poniższy przykład zilustruje powyższe uwagi. Do bazy wiedzy wprowadzane jest zdanie:
(S2)
A man met another man.
HUMAN
bn16
u1
INTERACTION
bv3
u4
pl
s.
Zdanie S2 podlega analizie syntaktycznej i semantycznej, czego efektem jest podział na grupy słów oraz nadanie cech semantycznych grupom.
a man ↔ a1 → HUMAN ↔ bn16
met ↔ a4 → INTERACTION ↔ bv3
another man ↔ a5 → HUMAN ↔ bn16
Semantykę zdania reprezentuje następujący ciąg:
HUMAN
u0
↔
c2
(2.7)
bn16
Graf utworzony na podstawie powyższego ciągu ma postać, jak na rys. 4.
363
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
u1c2
u0c2
bn16
bv3
w
u4c2
Rys. 4. Niejednoznaczny graf semantyczny
HUMAN1
u1
da
.b
w
w
Graf taki nie jest jednoznaczny z punktu widzenia reprezentowanego przez niego ciągu
kategorii semantycznych. Można, bowiem na jego podstawie wyznaczyć przynajmniej trzy
ciągi kategorii: b1u0, b1u1b4u4b1u0 i b1u1b4u4b1u4b1u0, a w skrajnym przypadku nieskończoną
liczbę takich ciągów, gdy powtarzane będą symbole u4b1. Poprawnym ciągiem jest ciąg
b1u1b4u4b1u0, ciąg b1u0 można uznać za poprawny, chociaż zdanie utworzone na podstawie
takiego ciągu zawiera jeden wyraz – a man – stanowiąc szczególne zdanie. Ciąg,
b1u1b4u4b1u4b1u0 oraz wszystkie ciągi z powtarzającymi się symbolami u4b1 opisują strukturę zdania z dwoma i więcej orzeczeniami, nie są jednak poprawnymi zdaniami złożonymi,
z powodu braku spójników. Stąd też graf semantyczny (rys. 4) nie określa jednoznacznie
zdania. Wynika to z faktu nie rozróżnienia w procesie analizy semantycznej grup słów
o jednakowych cechach semantycznych pełniących jednak różne role semantyczne.
Dla tworzenia jednoznacznych grafów semantycznych niezbędne jest rozróżnianie w obrazie semantycznym powtarzających się cech semantycznych. Rozwiązaniem jest indeksowanie powtarzających się cech semantycznych. Zatem, dla zdania S2, po uwzględnieniu
uwagi o konieczności indeksowania ciąg cech semantycznych wygląda następująco
INTERACTION
u4
bv3
bn16
HUMAN2
u0
↔
c2
(2.8)
bn16
Na podstawie takiego ciągu tworzony jest jednoznaczny graf semantyczny obrazujący semantykę zdania S2.
bn16
u4c2
bv3
bn16
u0c2
Rys. 5. Poprawny graf semantyczny zdania S1
pl
s.
u1c2
Powyższy przykład pokazuje problem, jakim może być wystąpienie niejednoznaczności
reprezentacji obrazowej. Pokazany został również sposób na wyeliminowanie tejże niejednoznaczności, poprzez wprowadzenie indeksowania jednakowych cech semantycznych
występujących w jednym zdaniu.
Istnieją przykłady zdań pojedynczych, poprawnych syntaktycznie i semantycznie, w których można wskazywać grupy słów o jednakowych cechach semantycznych. Pojawianie się
364
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
w zdaniach grup o jednakowych cechach semantycznych ograniczy się do przypadków takich, jak w podanym przykładzie. Zbiór możliwości ograniczony będzie przez liczbę typów
grup mogących pełnić określone role semantyczne (zob. tabela 2). Dodatkowo przypadki
wystąpienia grup o jednakowych cechach semantycznych ograniczony jest przez tzw. właściwości konotacyjne czasowników [10], [21], [22], które to określają liczbę i typ grup
słów w zdaniu. Niemniej jednak, aby uniknąć niejednoznaczności w obrazowaniu semantyki komputer indeksuje grupy, którym nadaje jednakowe kategorie i cechy semantyczne.
w
2.5 Bezkontekstowy dobór cech semantycznych
da
.b
w
w
Wyodrębnionym, w czasie analizy syntaktycznej, grupom słów nadane zostały kategorie
i cechy semantyczne. Określony został zbiór kategorii semantycznych oraz typy grup, które
w zdaniu pełnią odpowiednie role semantyczne (tabela 2), jak również rdzenie semantyczne
charakterystyczne dla określonych typów grup. Określony zbiór kategorii semantycznych
nie jest zbiorem skończonym, a jedynie zbiorem wystarczającym z punktu widzenia prezentowanej pracy. Szersze przedstawienie problemu doboru kategorii i cech semantycznych
zaprezentowane zostało w pracach [20], [23].
Każdy przekaz słowny w postaci zdań języka naturalnego stanowi odniesienie do świata
rzeczywistego w aspekcie fizycznym lub psychicznym, w którym funkcjonuje osoba werbalizująca pewną myśl. Odniesienie to jest opisem pewnej relacji pomiędzy obiektami
świata, zarówno obiektami rzeczywistymi jak i formami abstrakcyjnymi. W prezentowanym modelu założone zostało, że każdy obiekt świata ma swój odpowiednik w postaci
komponentu semantycznego w zdaniu. W przeciwnym wypadku pojęcie takie nie może być
wyartykułowane w postaci wyrazu. Każda funkcjonalna grupa słów posiada rdzeń semantyczny, który stanowi nazwę pojęcia należącego do wspomnianej grupy [2]. Obiekty i wyrazy w zdaniu mają ze sobą związek znaczeniowy. Poza tym, charakteryzują również relację znaczeniową pomiędzy obiektami. Związek taki nosi miano predykatu [24] i określa
własność lub relację semantyczną. Każdy wyróżniony poznawczo przedmiot jest przejawem pewnego aspektu świata i jako taki charakteryzuje się odróżniającą go od innych cechą (znakiem unikalnym). Zakres unikalności określany jest przez poziom szczegółowości
pojęcia. Pojęcia organizowane są w klasy pojęć o strukturze drzewiastej (rys. 6).
Poszczególne poziomy powiązane są ze sobą za pomocą relacji semantycznych. Struktury takie określane są jako sieci semantyczne [7]. Zasadą zawartą w organizacji sieci semantycznej jest definiowanie własności poziomu niższego przez poziom wyższy. Obiekt KOT
posiada wszelkie cechy obiektu ZWIERZĘ. Może jednocześnie posiadać cechy charakterystyczne tylko i wyłącznie dla siebie.
W sposób przedstawiony na rys. 6 klasyfikowane są rzeczowniki (hierarchię określa relacja hiponimii [2]) i czasowniki (hierarchia określona jest przez relację troponimii [22]).
Hierarchię przymiotników i przysłówków określają relacje synonimii i antynomii [2], [18].
pl
s.
365
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
poziom nadrzędny
ZWIERZĘTA
KOŃ
w
ARAB
poziom podstawowy
PIES
PERSZERON
JAMNIK
DOG
poziom podrzędny
w
Rys. 6. Hierarchiczny model pojęć
da
.b
w
Pojęcia tworzące sieci semantyczne zorganizowane są na trzech poziomach. Podział taki
zaproponowała E. Rosch [25]. Jest on elementem jednego z trzech poglądów dotyczących
reprezentacji pojęć nazywany poglądem probabilistycznym [3]. Pojęcia, tworzące sieć semantyczną, charakteryzują się dwoma cechami: informatywnością i ekonomicznością.
Informatywność polega na ścisłym określaniu unikalności pojęcia – im większa specyfika
pojęcia, tym informatywność wzrasta. Ekonomiczność natomiast polega na zmniejszaniu
unikalności pojęcia, czyli wtedy, gdy obejmuje ono sobą szerszy zakres znaczeniowy. Trzy
poziomy rozróżnione przez Rosch charakteryzowane są przez obie cechy [4]:
1) poziom nadrzędny – pojęcia o dużym zakresie znaczeniowym (niska unikalność cech
specyficznych); charakteryzujące się niską informatywnością,
2) poziom podstawowy – pojęcia najłatwiejsze do rozróżnienia, najwcześniej przyswajane, najczęściej używane; charakteryzuje je równowaga pomiędzy informatywnością i ekonomicznością,
3) poziom podrzędny – pojęcia specyficzne (duża unikalność cech specyficznych); charakterystyczna jest duża informatywność.
W obrazowym modelu reprezentacji semantyki zdań, w celu określania cech semantycznych wykorzystano leksykalną bazę wiedzy WordNet, opracowaną w Princeton University,
[18], [22], [26] i obejmującą sieci semantyczne: rzeczowników, czasowników i przymiotników. Przykładowy zestaw cech semantycznych przymiotników i rzeczowników przedstawiono odpowiednio w tabeli 3 i 4.
Ze względu na niewielką liczbę przykładów zdań wykorzystanych, jak również, iż są to
zdania proste, powyższy, bezkontekstowy sposób można uznać za wystarczający. Niemniej
jednak określanie cech bez rozpatrywania kontekstu w jakim znajduje się grupa jest znacznym uproszczeniem i nie daje, zwłaszcza przy wykorzystaniu jakiegokolwiek modelu pomijającego kontekst w procesie wnioskowania, zadawalających rozwiązań – to, czy „coś”
uznamy za pojazd zależy od kontekstu, w jakim to „coś” występuje [3].
Próby rozwiązania problemu nadawania cech semantycznych z uwzględnieniem kontekstu w jakim grupy słów występują w zdaniu zaprezentowane zostały w pracy [23]. Proponowane rozwiązanie oparte zostało na modelu obrazowania semantyki może stanowić,
w przypadku rozwinięcia, pewien krok w rozwoju systemu wnioskującego. Umiejętność
uwzględniania kontekstu, czyli zdarzeń przeszłych, daje możliwość nie tylko na prawidłową ocenę stanu teraźniejszego, ale daje szansę na przewidywanie przyszłości w sensie
udzielania prawidłowych i sensownych odpowiedzi w ramach dziedziny, w której następuje
wnioskowanie. Takie zachowanie systemu wnioskującego dałoby, w pewnym sensie, prawo do nazywania go inteligentnym.
pl
s.
366
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Model formalny obrazowej reprezentacji semantyki zdań języka naturalnego
3 Podsumowanie
w
Przedstawiony został formalizm reprezentacji semantyki zdań języka naturalnego wykorzystujący reprezentację wiedzy w postaci wyrażeń symbolicznych. Opracowany model jest
rozwinięciem prac nad systemem analizy tekstów formułowanych w języku naturalnym
(początkowo angielskim, docelowo w języku polskim), których podstawę stanowił parser
syntaktyczny – w obecnej postaci wykorzystujący zmodyfikowaną gramatykę łączeń. Opierając się na teorii podwójnego kodowania uzupełniono bazę wiedzy o podzielone na grupy
słów zdania, którym przypisano odpowiednie role semantyczne, tworząc w ten sposób tzw.
obrazy semantyczne zdań tekstu. Korelacja pomiędzy poziomem powierzchniowym (słowa) i głębokim (role semantyczne) pozwoliła na opracowanie algorytmów wnioskowania
na znaczeniu treści przekazu i możliwości konstruowania uniwersalnych reguł wnioskowania – możliwość stosowania niezależnie od dziedziny wiedzy, na której wykonywane jest
wnioskowanie. Przedstawiono sposób tworzenia obrazów semantycznych oraz sposób
asocjacji warstw powierzchniowej i głębokiej zdań. Uzasadniono poprawność takiego rozwiązania. Model spełnia warunki poprawnej reprezentacji wiedzy: spójność, zdolność do
odtworzenia wiedzy oraz możliwość realizacji wnioskowania, co zostało pokazane w innym rozdziale ten monografii. Nową jakością modelu jest uniwersalność reguł wnioskowania tworzonych w oparciu o ten model, czyli niezależność od dziedziny i języka przekazu.
1.
2.
3.
4.
5.
6.
7.
9.
10.
11.
12.
13.
14.
15.
16.
Lyons J., Introduction to theoretical linguistic, Cambridge University Press, 1968.
Lyons J., Semantyka, vol. 1. PWN, Warszawa, 1984.
Maruszewski T., Psychologia poznawcza, Polskie Towarzystwo Semiotyczne, Warszawa, 1996.
Chlewiński Z., Umysł: dynamiczna organizacja pojęć, PWN, Warszawa, 1997.
Wittgenstein L., Tractatus logico-philosoficus, Wydawnictwo Naukowe PWN, Warszawa, 2000.
Manaris B. Z., Natural Language Proceessing: A Human – Computer Interaction Perspective,
Reprint of charter in Advances in Computers, Vol 47, Academic Press Inc., 1998.
Collins A. M., Quillian M. R., Retrival time from semantics memory, Journal of Verbal Learning
and Verbal Behaviour, vol. 8, strony 240 – 247, 1969.
Fillmore C., The case for case, W: E. Bach i R. Harms, (red.), Universals in Linguistic Theory,
strony 1- 90, Holt, Rinehart and Winston, New York, 1968.
Sowa J. F., Conceptual Structures: Information Processing in Mind and Machine, Addison –
Wesley, Reading, Massachusets, 1984.
Norman D. A., Rumelhart D. E., Exploration in Cognition, Freeman, San Francisco, 1975.
Schank R. C., Conceptual Inforamtion Processing, North-Holland Publishing Company, Amsterdam, 1975.
Calvin W. H., Jak myśli mózg, CIS, Warszawa, 1997.
Paivio A., The relationship between verbal and perceptual codes, W: E. C. Carterette, M. P.
Friedman, (red.), Handbook of Perceptation, vol. VIII: Perceptual coding, Academic Press, New
York, 1978.
Paivio A., Mental Representation: A dual coding approach, Oxford University Press, New York,
1984.
Kazimierczak J., Splitting natural language sentences into groups of words for purposes of automatic programming, Raport PRE No 37/92, Instytut Cybernetyki Technicznej Politechniki Wrocławskiej, Wrocław, 1992.
Mierzwa J., Podział zdań pojedynczych języka naturalnego na grupy słów z wykorzystaniem
gramatyki łączeń dla celów nabywania wiedzy, W: Z. Bubnicki i A. Grzech, (red.) Materiały 4
Konferencji Inżynieria Wiedzy i Systemy Ekspertowe, vol. 1, strony 252 – 257, Wrocław, 2000.
Oficyna Wydawnicza Politechniki Wrocławskiej.
pl
s.
8.
da
.b
w
w
Literatura
367
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
T. Kapłon
w
17. Kazimierczak J., Knowledge representation on the level of natural language for purposes of
automatic programming, W: Proceedings of the 7th International Conference „Software Engineering and Knowledge Engineering”, SEKE’95, Rockville USA, KSI Press, 1995.
18. Miller G. A., Nouns in WordNet, A lexical inheritance system, International Journal of Lexicography, 3(4): 245 – 264, 1990. Dostępna na cogsci.princeton.edu/pub/wordnet/5papers.ps.
19. Kazimierczak J., Computer reasoning with representation of the semantics of natural language
sentences, Proceedings of the 10th International Conference on System-Modeling-Control, Zakopane, Poland, 2001.
20. Banasiak D., Rozpoznawanie semantyki zdań języka naturalnego na podstawie semantyki zdań
zawartych w bazie wiedzy, praca doktorska, Raport PRE No 84/00 Instytut Cybernetyki Technicznej Politechniki Wrocławskiej, Wrocław, 2000.
21. Lyons J., Wstęp do językoznawstwa, PWN, Warszawa, 1975.
22. Fellbaum C., English verbs and semantics net, International Journal of Lexicography, 3(4): 281 –
301, 1990. dostępna na cogsci.princeton.edu/pub/wordnet/5papers.ps.
23. Sterna A., Określanie kategorii semantycznych grup słów i reprezentacja semantyczna zdań
języka naturalnego, W: Z. Bubnicki i A. Grzech, (red.) Materiały 4 Konferencji Inżynieria Wiedzy i Systemy Ekspertowe, vol. 1, strony 252 – 257, Wrocław, 2000. Oficyna Wydawnicza Politechniki Wrocławskiej.
24. Marciszewski W., (red.), Mała encyklopedia logiki, Zakład Narodowy im. Ossolińskich – Wydawnictwo, Wrocław, Warszawa, Kraków, Gdańsk, Łódź, 1988.
25. Rosch E., Cognitive representation of semantic categories, Journal of Experimental Psychology,
104: 192 – 233, 1975.
26. Bruce B., Moser M. G., Case Grammar, W: S. C. Shapiro, (red.), Encyclopedia of Artificial
Intelligence, vol. 1, strony 563 – 570. John Wiley and Sons, New York, 1992.
da
.b
w
w
pl
s.
368
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008

Podobne dokumenty