Processing Queries Against Terminologies of Uncertain Description

Transkrypt

Processing Queries Against Terminologies of Uncertain Description
PRZETWARZANIE ZAPYTAŃ DO TERMINOLOGII ONTOLOGII
NIEPEWNYCH OPARTYCH NA LOGICE OPISOWEJ
Krzysztof GOCZYŁA*, Michał ZAWADZKI∗∗
Streszczenie. Systemy informatyczne oparte na bazach wiedzy stają się coraz bardziej
popularne. Znacząca ilość istniejących systemów do opisu wiedzy wykorzystuje ontologie.
Budując ontologie, bardzo często zakłada się, Ŝe informacje w nich przechowywane są
pewne. W niektórych jednak zastosowaniach takie załoŜenie moŜe nie być do końca
prawdziwe. Niniejszy Rozdział wprowadza w tematykę ontologii niepewnych oraz
prezentuje propozycje rozszerzenia kartograficznej reprezentacji wiedzy o aspekty zaufania
do terminologii. Przedstawione zostały równieŜ sposoby przetwarzania zapytań
terminologicznych dla ontologii niepewnych.
1.
Wstęp
W procesie budowania ontologii [10] zazwyczaj przyjmuje się załoŜenie, Ŝe wszystkie
informacje w nich zdefiniowane są pewne. Zakłada się, Ŝe terminologia właściwie
odwzorowuje interesującą dziedzinę wiedzy oraz Ŝe wszystkie asercje opisują rzeczywiste
sytuacje. Zwykle zapomina się lub świadomie nie bierze się pod uwagę problemu
niepewności przechowywanych danych, a zarazem wniosków wysnuwanych na ich
podstawie. W większości przypadków załoŜenie o poprawności danych, które definiuje
ontologia, jest jak najzupełniej uzasadnione, jednak istnieją takŜe takie zastosowania,
w których tego aspektu nie wolno pomijać. Przykładem systemu, w którym poprawność
i pewność wniosków jest krytyczna, moŜe być system medyczny.
RozwaŜania przedstawione w niniejszym rozdziale opierają się na kartograficznej
reprezentacji wiedzy (ang. knowledge cartography) [2], [4], [4] - nowym podejściu do
* Politechnika Gdańska, Katedra InŜynierii Oprogramowania,
Narutowicza 11/12, 80-952 Gdańsk, e-mail: [email protected]
∗∗ Politechnika Gdańska, Katedra InŜynierii Oprogramowania,
Narutowicza 11/12, 80-952 Gdańsk, e-mail: [email protected]
ul.
Gabriela
ul.
Gabriela
reprezentacji ontologii oraz algorytmie jej przetwarzania i wnioskowania opracowanym
w Katedrze InŜynierii oprogramowania Politechniki Gdańskiej. Podejście to, oparte na
logice opisowej (ang. description logics - DL), było i jest dalej rozwijane w ramach
projektu PIPS (Personalised Information Platform for Life and Health Services) [5], [5],
objętym 6. Programem Ramowym Unii Europejskiej. Głównym celem projektu PIPS jest
opracowanie infrastruktury informatycznej ukierunkowanej na indywidualnych obywateli,
wspomagającej ochronę ich zdrowia i utrzymywanie zdrowego stylu Ŝycia. Istotną częścią
tego projektu jest podsystem zarządzania wiedzą KaSeA [4], [7] z silnikiem wnioskującym
opartym na podejściu kartograficznym. Zastosowanie podejścia kartograficznego pozwala
na efektywne wykonywanie zapytań zarówno dotyczących terminologii jak i części
asercjonalnej ontologii.
Niniejszy rozdział koncentruje się aspektach pewności dotyczących części
terminologicznej ontologii. Aspekty pewności dotyczące części asercjonalnej przedstawione
zostały m.in. w [8]. Druga sekcja pokrótce prezentuje kartograficzną reprezentację wiedzy.
W sekcji trzeciej wprowadzone zostało pojęcie ontologii niepewnych oraz propozycja
rozszerzenia kartograficznej reprezentacji wiedzy o elementy dotyczące pewności
terminologii. Zaprezentowane zostały równieŜ sposoby przetwarzania zapytań do części
terminologicznej dla ontologii niepewnych. Ostatnia sekcja podsumowuje rozdział.
2.
Kartograficzna reprezentacja wiedzy
Sercem kaŜdego systemu wykorzystującego bazy wiedzy oparte na ontologiach jest
efektywny silnik wnioskujący umoŜliwiający przetwarzanie informacji o duŜej liczbie
osobników. Takie wymaganie spełnia kartograficzna reprezentacja wiedzy i zbudowany na
jej bazie system KaSeA. Efektywność tego systemu w przetwarzaniu zapytań zarówno
terminologicznych, jak i asercjonalnych została potwierdzona w projekcie PIPS [3], [4], [4].
Kartograficzna reprezentacja wiedzy opiera się na następujących załoŜeniach:
• Część terminologiczna bazy wiedzy jest uaktualniana bardzo rzadko, więc
moŜe być uznana za stałą.
• Wykonywanie zapytań jest duŜo częstsze niŜ uaktualnianie bazy wiedzy (czyli
dodawanie nowych asercji). W związku z tym wydajność przetwarzania
zapytań jest duŜo bardziej istotna niŜ wydajność aktualizacji.
W podejściu kartograficznym definiuje się opis zaleŜności między konceptami
w terminologii jako mapę konceptów (stąd teŜ nazwa podejścia). Mapa jest tworzona
w czasie tworzenia bazy wiedzy. Taką mapę moŜna graficznie przedstawić w formie
podobnej do diagramów Venna. KaŜdy obszar atomowy (taki, który nie zawiera Ŝadnych
innych obszarów) reprezentuje unikalne i poprawne (spełnialne w terminach ontologii)
przecięcie konceptów bazowych. Przecięcia konceptów, które nie są poprawne względem
aksjomatów znajdujących się w terminologii, są z mapy usuwane. Obszary atomowe będą
dalej nazywane regionami. Przykładową terminologię oraz odpowiadającą jej mapę
konceptów przedstawia rysunek 1. W ontologii zdefiniowane zostały cztery koncepty:
Planeta, Satelita, Gwiazda oraz CiałoNiebieskie. Dodatkowo wprowadzone zostały dwa
standardowe koncepty logiki opisowej: ⊤ oznaczający zbiór wszystkich osobników
z opisywanej dziedziny oraz ⊥, który jest konceptem pustym - nie naleŜą do niego Ŝadne
osobniki. Koncept Planeta zawiera się w koncepcie Satelita, więc kaŜda planeta jest
satelitą, ale niekoniecznie na odwrót. Część wspólna konceptów Gwiazda i Planeta jest
pusta, zatem Ŝadna gwiazda nie jest planetą i na odwrót. Ostatni aksjomat informuje, Ŝe
kaŜdy osobnik z dziedziny jest wystąpieniem konceptu CiałoNiebieskie.
Rys. 1. Przykładowa terminologia oraz odpowiadająca jej mapa konceptów
Poszczególnym regionom mapy przypisane są liczby całkowite z przedziału [1, n], gdzie
n jest liczbą poprawnych regionów. Jako Ŝe kaŜdy obszar na mapie składa się z pewnej
liczby regionów, moŜe być on reprezentowany przez ciąg binarny o długości n,
z wartościami „1” na pozycjach odpowiadających regionom składowym i wartościami „0”
na pozostałych pozycjach. W ten sposób moŜemy kaŜdemu konceptowi w terminologii
przypisać pewną sygnaturę - ciąg bitów reprezentujących obszar pokrywany na mapie przez
dany koncept. I tak na przykład Satelita na sygnaturę 01101, gdyŜ na obszar tego konceptu
składają się regiony nr 2, 3 i 5, natomiast Planeta ma sygnaturę 00001, poniewaŜ tylko
region nr 5 wchodzi w skład obszaru tego konceptu.
3.
Wprowadzenie do ontologii niepewnych
Kartograficzna reprezentacja wiedzy przedstawia zaleŜności między konceptami w postaci
mapy konceptów, czyli zbioru regionów. Koncepty w terminologii reprezentowane są jako
ciąg bitów „0” lub „1” oznaczających odpowiednio brak przynaleŜności lub przynaleŜność
poszczególnych regionów do konceptów. Rysunek 2 przedstawia przykładową
ontologię(terminologię), jak równieŜ odpowiadającą jej mapę konceptów.
Rys. 2. Przykładowa ontologia oraz odpowiadająca jej mapa konceptów
Na mapie znajdują się cztery moŜliwe regiony, oznaczone odpowiednio literami A, B, C
i D. Zazwyczaj moŜemy załoŜyć, Ŝe istnienie kaŜdego z wymienionych regionów jest
pewne, czyli system wie, Ŝe kaŜdy z istniejących regionów jest spełnialny (ang. satisfiable).
Sytuację taką obrazuje rysunek 3a. Wartości 1 oznaczają całkowitą pewność co do istnienia
danego regionu. Mogą jednak wystąpić sytuacje, w których istnienie wszystkich regionów
wcale nie musi być pewne - moŜemy zróŜnicować poziomy pewności dla poszczególnych
regionów. Mówimy wtedy o ontologii niepewnej. Rysunek 3b przedstawia przykładową
mapę konceptów odpowiadającą takiej ontologii. Istnienie kaŜdego z wymienionych
regionów określane jest przez współczynnik spełnialności ε [9], który intuicyjnie moŜna
interpretować jako szansę wystąpienia danego regionu, czyli równieŜ szansę, Ŝe do danego
regionu moŜe naleŜeć przynajmniej jeden osobnik. Dlatego teŜ mapa regionów została
wzbogacona o informacje dotyczące współczynnika spełnialności - liczbę rzeczywistą
z przedziału <0, 1>.
Rys. 3. Przykład ontologii pewnej (a) oraz niepewnej (b)
Ontologie niepewne mogą mieć róŜne źródła pochodzenia; na przykład mogą być
tworzone na podstawie aksjomatów o róŜnym stopniu pewności. Inna moŜliwość to łączenie
ontologii (ang. ontology merging) o róŜnych terminologiach. Ze względu na niemoŜność
pełnego określenia przez system podobieństwa między konceptami nowo powstałe regiony
mogą mieć róŜne współczynniki spełnialności [9].
4.
Wyznaczanie
atomowych
współczynników
spełnialności
dla
obszarów
Wyznaczenie współczynników spełnialności dla kaŜdego z obszarów atomowych wymaga
przyjęcia pewnej interpretacji wartości współczynnika wiarygodności α aksjomatu
terminologicznego. Poprzez współczynnik wiarygodności rozumiemy pewną wartość
rzeczywistą z zakresu <0, 1>, przypisaną kaŜdemu aksjomatowi. Przykład listy aksjomatów
wraz z przypisanymi im wartościami współczynnika wiarygodności został przedstawiony na
rysunku 4.
Rys. 4. Przykładowa lista aksjomatów wraz z wartościami współczynnika
wiarygodności
Intuicyjnie współczynnik wiarygodności moŜna rozumieć jako szansę, Ŝe dany aksjomat
opisuje prawdziwą zaleŜność, jednak w kaŜdym modelu ta interpretacja jest uściślana.
Aksjomaty, na podstawie których budowana jest ontologia, mogą mieć róŜne wartości
współczynnika wiarygodności. Źródłem tych róŜnic, jak równieŜ samego występowania
tego współczynnika, mogą być na przykład źródła danych o róŜnym zaufaniu. Niektóre
źródła przygotowywane są przez ekspertów, inne natomiast mogą być przygotowywane
przez amatorów. Zazwyczaj zaufanie co do zawartości tych pierwszych jest większe. Mimo,
iŜ oba źródła mogą opisywać te same dziedziny, to współczynnik wiarygodności dla
aksjomatów ze źródła pierwszego typu będzie większy aniŜeli dla aksjomatów ze źródła,
których autorem nie jest ekspert.
PoniŜej zostały przedstawione dwa róŜne modele wyznaczania współczynników
spełnialności ε obszarów atomowych na podstawie wartości współczynników
wiarygodności aksjomatów.
4.1.
Model obszarów atomowych
Model obszarów atomowych bazuje bezpośrednio na metodzie kartograficznej. W metodzie
tej w czasie przetwarzania kaŜdego aksjomatu usuwane są regiony niespełnialne. W modelu
obszarów atomowych regiony niespełnialne nie są usuwane, natomiast przypisywana jest im
pewna wartość nazwana cząstkowym współczynnikiem spełnialności µ. Interpretacja
cząstkowego współczynnika spełnialności jest analogiczna jak współczynnika spełnialności
ε, odnosi się jednak tylko do cząstkowej informacji bazy wiedzy dotyczącej tylko jednego
aktualnie przetwarzanego aksjomatu. Analogiczna wartość jest przypisywana regionom
spełnialnym. Wartości cząstkowych współczynników spełnialności są wyznaczane na
podstawie wartości współczynnika wiarygodności α. Dla regionów niespełnialnych
µ = 1 - α, natomiast dla regionów spełnialnych µ = α. W taki sposób wyznaczane są
wartości cząstkowych współczynników spełnialności dla kaŜdego z aksjomatów.
Rys. 5. Proces wyznaczania wartości współczynnika spełnialności w modelu
obszarów atomowych
MoŜna przyjąć wiele sposobów wyznaczania współczynnika spełnialności. W tym modelu
współczynnik spełnialności ε jest arbitralnie wyznaczany jako średnia arytmetyczna
cząstkowych współczynników spełnialności (właściwości innych sposobów są tematem
dalszych moŜliwych badań). Zbiór moŜliwych regionów dla ontologii tworzonej z listy
aksjomatów z rysunku 4 zawiera 16 regionów odpowiadających wszystkim moŜliwym
kombinacjom przynaleŜności do 4 konceptów.
Na rysunku 5 przedstawiony został proces wyznaczania współczynników spełnialności
dla regionów dla tej ontologii. Dla kaŜdego aksjomatu wyznaczany jest zbiór 16 regionów,
którym przypisywane są wartości cząstkowych współczynników spełnialności obliczone
w opisany uprzednio sposób. Wartości współczynnika spełnialności dla poszczególnych
regionów na mapie docelowej wyznaczanie są, jak juŜ wcześniej wspomniano, jako średnia
arytmetyczna cząstkowych współczynników spełnialności z odpowiadających regionów
źródłowych (zbiorów regionów dla poszczególnych aksjomatów). Warto zwrócić uwagę na
fakt, Ŝe regiony składowe o niskim cząstkowym współczynniku spełnialności mają równieŜ
odwzorowanie w niskiej wartości współczynnika spełnialności w docelowym zbiorze
regionów.
4.2.
Model aksjomatyczny
Model aksjomatyczny bazuje na moŜliwych rodzajach aksjomatów dotyczących relacji
pomiędzy konceptami. W logice opisowej [1] moŜemy wyróŜnić pięć moŜliwych relacji
pomiędzy konceptami. Relacje te zostały przedstawione na rysunku 6.
Rys. 6. MoŜliwe relacje pomiędzy konceptami
Dla dwóch konceptów C1 i C2 moŜemy powiedzieć, Ŝe:
a. C1 jest równy C2 (rysunek 7a),
b. C1 zawiera się w C2 (rysunek 7b),
c. C2 zawiera się w C1 (rysunek 7c),
d. C1 jest rozłączny z C2 (rysunek 7d),
e. nie zachodzi Ŝadne z powyŜszych (rysunek 7e).
W ogólnym przypadku, jeśli o konceptach C1 i C2 nic nie wiemy, to moŜemy wyróŜnić
cztery obszary (C1 ⊓ C2, ¬C1 ⊓ ¬C2, ¬C1 ⊓ C2, C1 ⊓ ¬C2). Tabela 1 przedstawia, które
z obszarów występują dla poszczególnych relacji między konceptami.
W modelu aksjomatycznym współczynnik wiarygodności jest intuicyjnie interpretowany
jako prawdopodobieństwo zachodzenia zdefiniowanej w aksjomacie relacji pomiędzy
konceptami. Dla aksjomatu 1 z rysunku 4 wiemy, Ŝe współczynnik wiarygodności tego
aksjomatu jest równy 0,6. Wiedząc, Ŝe zachodzi przynajmniej jedna z poprzednio
zdefiniowanych pięciu relacji pomiędzy konceptami, moŜemy dla uproszczenia załoŜyć, Ŝe
współczynniki wiarygodności pozostałych relacji są równe i wynoszą 0,1
(4 * 0,1 + 0,6 = 1). NiezaleŜnie od pozostałych aksjomatów moŜemy wyznaczyć wartości
cząstkowych współczynników spełnialności µ dla czterech obszarów (niekoniecznie
atomowych) rozłącznych (wspomniane wcześniej kombinacje konceptów C1 i C2).
Tabela 1. Obecność obszarów w zaleŜności od relacji między konceptami
a
b
c
d
C1 ⊓ C2
+
+
+
¬C1 ⊓ ¬C2
+
+
+
¬C1 ⊓ C2
+
+
C1 ⊓ ¬C2
e
+
+
+
+
+
+
+
Aby lepiej zobrazować tę metodę weźmy dla przykładu aksjomat A ⊓ B ≡ C. Lewą
stronę aksjomatu traktujemy jako koncept C1 (nie interesują nas zaleŜności między
konceptami A i B), prawą natomiast jako C2. Definiujemy następnie cztery obszary dla
kombinacji opisanych powyŜej: o1 ≡ (A ⊓ B) ⊓ C, o2 ≡ ¬(A ⊓ B) ⊓ ¬C, o3 ≡ ¬(A ⊓ B) ⊓ C
oraz o4 ≡ (A ⊓ B) ⊓ ¬C. Dla kaŜdego z tych obszarów wyznaczamy współczynnik µ.
Tabela 2. Obliczanie cząstkowych współczynników spełnialności dla aksjomatu
A⊓B≡C
o1
o2
o3
o4
a
0,6
0,6
b
0,1
0,1
0,1
c
0,1
0,1
0,1
d
0,1
0,1
0,1
e
0,1
0,1
0,1
0,1
µ
0,9
1
0,3
0,3
W pierwszym kroku w tabeli 1 zamiast symbolu + wstawiamy wartość odpowiadającego
relacji współczynnika wiarygodności. Dla analizowanego aksjomatu wstawiamy wartości
0,6 i 0,1. W tabeli 2 przedstawiono wynik tej operacji dla aksjomatu 1. Ostatnia kolumna
pokazuje wartość współczynnika µ dla poszczególnych obszarów, będącą sumą wszystkich
wartości występujących w wierszu odpowiadającym danemu obszarowi. W analogiczny
sposób moŜna wyznaczyć wartości współczynnika µ dla pozostałych dwóch aksjomatów
(tabela 3 i tabela 4). Mając tak wyznaczone cząstkowe współczynniki spełnialności,
moŜliwe jest wyznaczenie współczynników spełnialności dla kaŜdego z obszarów
atomowych. Na liście aksjomatów na rysunku 4 zdefiniowane są cztery koncepty. Liczba
obszarów atomowych dla ontologii zbudowanej z tych aksjomatów jest równa 24 = 16.
KaŜdemu z tych obszarów przyporządkowane są trzy wartości cząstkowych
współczynników spełnialności wyznaczonych dla kaŜdego z aksjomatów. Cztery obszary
zdefiniowane dla jednego aksjomatu są rozłączne (moŜliwe kombinacje konceptów C1 i C2).
Stąd dowolny ustalony region zawiera się tylko w jednym z tych obszarów. Wartość
cząstkowego współczynnika spełnialności dla jednego aksjomatu jest równa wartości
cząstkowego współczynnika spełnialności wyznaczonego dla obszaru, do którego badany
region naleŜy.
Tabela 3. Obliczanie cząstkowych współczynników spełnialności dla
aksjomatu B ⊑ D
a
b
c
B⊓D
0,2
0,2
0,2
¬B ⊓ ¬D
0,2
0,2
0,2
¬B ⊓ D
0,2
B ⊓ ¬D
0,2
e
µ
0,2
0,8
0,2
0,2
1
0,2
0,2
0,6
0,2
0,2
0,6
d
Tabela 4. Obliczanie cząstkowych współczynników spełnialności dla aksjomatu
A⊓D≡⊥
a
b
c
A⊓D
0,025
0,025
0,025
¬A ⊓ ¬D
0,025
0,025
0,025
¬A ⊓ D
A ⊓ ¬D
0,025
0,025
e
µ
0,025
0,1
0,9
0,025
1
0,9
0,025
0,95
0,9
0,025
0,95
d
W modelu aksjomatycznym wartość współczynnika spełnialności danego regionu jest
wyznaczana, podobnie jak dla modelu obszarów atomowych, jako średnia arytmetyczna
wartości cząstkowych współczynników spełnialności tego obszaru atomowego. Rysunek 7
przedstawia sposób wyznaczania wartości współczynnika spełnialności dla kaŜdego
z obszarów atomowych dla ontologii budowanej z aksjomatów z rysunku 4.
Warto tutaj zwrócić uwagę na fakt, iŜ zastosowanie dowolnego z opisanych modeli daje
w wyniku podobne wartości współczynnika spełnialności dla regionów na mapie docelowej.
Regiony o niskim współczynniku spełnialności w modelu obszarów atomowych równieŜ
mają niski współczynnik spełnialności przy korzystaniu z modelu aksjomatycznego.
Podobna zaleŜność występuje dla regionów o wysokim współczynniku spełnialności.
Pozwala to wnioskować, Ŝe modele dobrze opisują sposoby obliczania współczynników
spełnialności dla poszczególnych regionów ontologii niepewnej.
Przedstawione modele wyznaczania współczynników spełnialności obszarów
atomowych zakładają analizę wszystkich moŜliwych obszarów atomowych, co sprawia, Ŝe
ontologia niepewna składa się z 2n obszarów atomowych. Zarządzanie taką liczbą obszarów
atomowych jest w praktyce nierealizowalne, dlatego zaproponowano metodę eliminacji dla
ontologii niepewnych opisaną w kolejnej sekcji.
Rys. 7. Proces wyznaczania wartości współczynnika spełnialności w modelu
aksjomatycznym
5.
Eliminacja w ontologiach niepewnych
Ze względu na istnienie regionów o róŜnych poziomach pewności wprowadzone zostało
pojęcie k-spełnialności. K-spełnialność określa minimalny poziom pewności, na jakim baza
wiedzy postrzega ontologię niepewną. Dla ustalonej wartości k, wszystkie regiony
o pewności mniejszej niŜ k są dla klienta niewidoczne. Przykładowo, dla ontologii
z rysunku 3b przy 0,1-spełnialności region B nie będzie widoczny, co oznacza, Ŝe dla
klienta nie istnieje (nie jest brany pod uwagę przy wnioskowaniu) koncept "koty bez
rodziców" - w pewnym sensie jest on teŜ niewidoczny dla systemu wnioskującego.
Wprowadzenie k-spełnialności powoduje konieczność rozszerzenia definicji podstawowych
zaleŜności między konceptami [1] poprzez uwzględnienie poziomu pewności konceptów:
• k-spełnialność (ang. satisfiability): Koncept C jest k-spełnialny względem
terminologii T, jeśli istnieje przynajmniej jeden region naleŜący do konceptu C
o współczynniku spełnialności nie mniejszym niŜ k (rys. 9a).
• k-zawieranie (ang. subsumption): Koncept C k-zawiera się w koncepcie D
względem terminologii T, jeśli wszystkie regiony naleŜące do konceptu C
o współczynniku spełnialności nie mniejszym niŜ k naleŜą równieŜ do konceptu
D, co zapisujemy C ⊑k D. Regiony o współczynniku spełnialności mniejszym
niŜ k składające się na koncepty C lub D są niewidoczne, więc równieŜ nie są
uwzględniane przy badaniu zawierania się konceptów (rys. 9b).
•
k-równowaŜność (ang. equivalence): Dwa koncepty C i D są k-równowaŜne
względem terminologii T, jeśli wszystkie regiony o współczynniku
spełnialności nie mniejszym niŜ k naleŜące do konceptu C naleŜą do konceptu
D oraz wszystkie regiony o współczynniku spełnialności nie mniejszym niŜ
k naleŜące do konceptu D naleŜą do konceptu C. Innymi słowy, dwa koncepty
C i D są k-równowaŜne jeśli C ⊑k D oraz D ⊑k C. Zapisujemy to C ≡k D.
•
Podobnie jak przy operacji zawierania, regiony o współczynniku spełnialności
mniejszym niŜ k, składające się na koncepty C lub D są niewidoczne, więc
równieŜ nie są uwzględniane przy badaniu równowaŜności konceptów (rys. 9c).
k-rozłączność (ang. disjointness): Dwa koncepty C i D są k-rozłączne
względem terminologii T, jeśli nie mają Ŝadnych wspólnych regionów
o współczynniku spełnialności nie mniejszym niŜ k. Analogiczne ograniczenia
dotyczące widzialności regionów jak dla operacji zawierania i równowaŜności
konceptów występują podczas badania rozłączności konceptów - regiony
o współczynniku spełnialności mniejszym niŜ k składające się na koncepty C
lub D są niewidoczne (rys. 9d).
Rys. 8. Podstawowe zaleŜności między konceptami z uwzględnieniem k-spełnialności.
Zdefiniowanie poziomu k-spełnialności powoduje, iŜ regiony atomowe
o współczynniku spełnialności mniejszym niŜ k nie są widoczne przy wnioskowaniu.
6.
Zapytania terminologiczne w ontologiach niepewnych
Tradycyjnie, podstawowy mechanizm wnioskujący udostępniany przez systemy oparte na
logice opisowej sprawdza zawieranie się konceptów. Analogicznie jak w przypadku
ontologii pewnych, równieŜ w przypadku ontologii niepewnych takie sprawdzenie jest
wystarczające do przeprowadzenia pozostałych typów wnioskowań. MoŜna pokazać, Ŝe
podobnie jak dla tradycyjnego wnioskowania [1], pozostałe trzy problemy moŜna
zredukować do problemu k zawierania się:
• Koncept C jest k-niespełnialny C k-zawiera się w ⊥.
• Koncepty C i D są k-równowaŜne C k-zawiera się w D i D k-zawiera się
w C.
•
Koncepty C i D są k-rozłączne C ⊓ D k-zawiera się w ⊥.
Wszystkie języki opisowe oparte na logice opisowej oferują operator koniunkcji oraz
koncept niespełnialny, więc kaŜdy z nich moŜna równieŜ wykorzystać do wnioskowania na
ontologiach niepewnych. Aby jednak móc przeprowadzać wnioskowanie opisanych typów,
system wnioskujący musi potrafić rozwiązać problem zawierania się konceptów. Rysunek 9
przedstawia przykładową ontologię niepewną, dla której chcemy sprawdzić, czy koncept X
zawiera się w Y.
Rys. 9. Przykładowa ontologia niepewna dla rozwiązania problemu zawierania się
konceptów
Jeśli rozwaŜać problem zawierania się konceptów bez uwzględniania współczynników
spełnialności, to odpowiedź na zadane pytanie jest oczywista: koncept X nie zawiera się
w koncepcie Y - koncepty X oraz Y reprezentują zupełnie inne regiony (mające, co prawda,
część wspólną, jednak jest to niewystarczające). Wprowadzając k-spełnialność, w procesie
wnioskowania ograniczamy się do regionów o współczynniku spełnialności większym bądź
równym k, natomiast pozostałe regiony są ignorowane. Dla przykładu przyjmijmy dla
ontologii z rysunku 10 0,1-spełnialność. Widzimy, Ŝe region B staje się "niewidoczny",
poniewaŜ jego współczynnik spełnialności jest równy 5% (0,05) i jest mniejszy od
przyjętego k równego 0,1. W takiej sytuacji koncept X jest reprezentowany tylko przez
region D, a w konsekwencji zawiera się on w koncepcie Y reprezentowanym przez sumę
regionów C i D.
7.
Podsumowanie
W rozdziale przedstawione zostały modele wyznaczania współczynników spełnialności
podczas budowy ontologii niepewnych, jak równieŜ wykonywania zapytań
terminologicznych na tych ontologiach. Problem ontologii niepewnych jest problemem
niezwykle istotnym, szczególnie tam, gdzie wnioski z nich wysnuwane są krytyczne.
Ontologie niepewne i wykonywanie na nich zapytań mogą równieŜ znaleźć zastosowanie
w systemach integracji ontologii [9], łączących wiele, czasami znacząco róŜniących się
ontologii. Zaprezentowane modele wydają się pokrywać szeroki zakres potencjalnych
zastosowań. Aktualne prace, prowadzone w ramach projektu PIPS, skupiają się nie tylko na
opracowaniu efektywnych algorytmów przetwarzania zapytań terminologicznych, ale
równieŜ zapytań dotyczących asercji [8].
8.
Podziękowania
Autorzy dziękują Teresie Grabowskiej i Wojciechowi Waloszkowi za pomoc w analizie
róŜnych modeli budowy ontologii niepewnych i ich wartościowe komentarze.
LITERATURA
[1] Baader F. A., McGuiness D. L., Nardi D., Patel-Schneider P. F.: The Description Logic
Handbook: Theory, implementation, and applications, Cambridge University Press,
2003.
[2] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: The Cartographer Algorithm
for Processing and Querying Description Logics Ontologies, P. S. Szczepaniak, J.
Kacprzyk, A. Niewiadomski (red.), Lecture Notes in Artifical Intelligence, Advances In
Web Intelligence, Czerwiec 2005, str. 163-169.
[3] Goczyła K., Waloszek W.: Topologiczna analiza ontologii opartych na logice
opisowej, S. Kozielski, B. Małysiak, P. Kasprowski, D. Mrozek (red.), Bazy Danych Modele, Technologie, Narzędzia, WKŁ 2005, Roz. XXIII, str. 191-197.
[4] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Cartographic Approach to
Knowledge Representation and Management in KaSeA. International Workshop on
Description Logics, 2005, str. 217.
[5] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Problematyka zarządzania
wiedzą w systemach typu e-health, J. Górski, A. Wardziński (red.), InŜynieria
oprogramowania - Nowe wyzwania, WNT 2004, Roz. XXVI, str. 358-371.
[6] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Inference Mechanisms for
Knowledge Management System in E-health Environment, VII Krajowa Konferencja
InŜynierii Oprogramowania, Kraków 2005 (zaakceptowana do publikacji).
[7] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Hybryd Architecture of DL
Knowledge Base In KaSeA. International Workshop on Description Logics, 2005, str.
216
[8] Goczyła K., Zawadzki M.: Przetwarzanie i wnioskowanie z wiedzy o róŜnym poziomie
zaufania, S. Kozielski, B. Małysiak, P. Kasprowski, D. Mrozek (red.), Bazy Danych Modele, Technologie, Narzędzia, WKŁ 2005, Roz. XXIV, str. 207-213.
[9] Goczyła K., Grabowska T.: Metoda ELPAR łączenia ontologii oparta na ich
kartograficznej reprezentacji, I Krajowa Konferencja Naukowa - Technologie
Przetwarzania Danych, 2005 (zaakceptowana do publikacji)
[10] Staab S., Studer R.: Handbook on Ontologies, Springer-Verlag, 2004
PROCESSING QUERIES AGAINST TERMINOLOGIES OF
UNCERTAIN DESCRIPTION LOGICS' BASED ONTOLOGIES.
Information systems based on knowledge bases are becoming more and more popular.
A significant number of existing systems utilize ontologies for describing knowledge. In the
process of building an ontology it is very often assumed, that the information stored in it are
valid. Such assumption is usually correct, however there can exist applications where it may
not be adequate enough. The chapter introduces uncertain ontologies and presents proposals
of extending knowledge cartography approach with aspects of trust to the terminology.
There have been also presented methods for processing queries against terminologies of
uncertain ontologies.

Podobne dokumenty