Processing Queries Against Terminologies of Uncertain Description
Transkrypt
Processing Queries Against Terminologies of Uncertain Description
PRZETWARZANIE ZAPYTAŃ DO TERMINOLOGII ONTOLOGII NIEPEWNYCH OPARTYCH NA LOGICE OPISOWEJ Krzysztof GOCZYŁA*, Michał ZAWADZKI∗∗ Streszczenie. Systemy informatyczne oparte na bazach wiedzy stają się coraz bardziej popularne. Znacząca ilość istniejących systemów do opisu wiedzy wykorzystuje ontologie. Budując ontologie, bardzo często zakłada się, Ŝe informacje w nich przechowywane są pewne. W niektórych jednak zastosowaniach takie załoŜenie moŜe nie być do końca prawdziwe. Niniejszy Rozdział wprowadza w tematykę ontologii niepewnych oraz prezentuje propozycje rozszerzenia kartograficznej reprezentacji wiedzy o aspekty zaufania do terminologii. Przedstawione zostały równieŜ sposoby przetwarzania zapytań terminologicznych dla ontologii niepewnych. 1. Wstęp W procesie budowania ontologii [10] zazwyczaj przyjmuje się załoŜenie, Ŝe wszystkie informacje w nich zdefiniowane są pewne. Zakłada się, Ŝe terminologia właściwie odwzorowuje interesującą dziedzinę wiedzy oraz Ŝe wszystkie asercje opisują rzeczywiste sytuacje. Zwykle zapomina się lub świadomie nie bierze się pod uwagę problemu niepewności przechowywanych danych, a zarazem wniosków wysnuwanych na ich podstawie. W większości przypadków załoŜenie o poprawności danych, które definiuje ontologia, jest jak najzupełniej uzasadnione, jednak istnieją takŜe takie zastosowania, w których tego aspektu nie wolno pomijać. Przykładem systemu, w którym poprawność i pewność wniosków jest krytyczna, moŜe być system medyczny. RozwaŜania przedstawione w niniejszym rozdziale opierają się na kartograficznej reprezentacji wiedzy (ang. knowledge cartography) [2], [4], [4] - nowym podejściu do * Politechnika Gdańska, Katedra InŜynierii Oprogramowania, Narutowicza 11/12, 80-952 Gdańsk, e-mail: [email protected] ∗∗ Politechnika Gdańska, Katedra InŜynierii Oprogramowania, Narutowicza 11/12, 80-952 Gdańsk, e-mail: [email protected] ul. Gabriela ul. Gabriela reprezentacji ontologii oraz algorytmie jej przetwarzania i wnioskowania opracowanym w Katedrze InŜynierii oprogramowania Politechniki Gdańskiej. Podejście to, oparte na logice opisowej (ang. description logics - DL), było i jest dalej rozwijane w ramach projektu PIPS (Personalised Information Platform for Life and Health Services) [5], [5], objętym 6. Programem Ramowym Unii Europejskiej. Głównym celem projektu PIPS jest opracowanie infrastruktury informatycznej ukierunkowanej na indywidualnych obywateli, wspomagającej ochronę ich zdrowia i utrzymywanie zdrowego stylu Ŝycia. Istotną częścią tego projektu jest podsystem zarządzania wiedzą KaSeA [4], [7] z silnikiem wnioskującym opartym na podejściu kartograficznym. Zastosowanie podejścia kartograficznego pozwala na efektywne wykonywanie zapytań zarówno dotyczących terminologii jak i części asercjonalnej ontologii. Niniejszy rozdział koncentruje się aspektach pewności dotyczących części terminologicznej ontologii. Aspekty pewności dotyczące części asercjonalnej przedstawione zostały m.in. w [8]. Druga sekcja pokrótce prezentuje kartograficzną reprezentację wiedzy. W sekcji trzeciej wprowadzone zostało pojęcie ontologii niepewnych oraz propozycja rozszerzenia kartograficznej reprezentacji wiedzy o elementy dotyczące pewności terminologii. Zaprezentowane zostały równieŜ sposoby przetwarzania zapytań do części terminologicznej dla ontologii niepewnych. Ostatnia sekcja podsumowuje rozdział. 2. Kartograficzna reprezentacja wiedzy Sercem kaŜdego systemu wykorzystującego bazy wiedzy oparte na ontologiach jest efektywny silnik wnioskujący umoŜliwiający przetwarzanie informacji o duŜej liczbie osobników. Takie wymaganie spełnia kartograficzna reprezentacja wiedzy i zbudowany na jej bazie system KaSeA. Efektywność tego systemu w przetwarzaniu zapytań zarówno terminologicznych, jak i asercjonalnych została potwierdzona w projekcie PIPS [3], [4], [4]. Kartograficzna reprezentacja wiedzy opiera się na następujących załoŜeniach: • Część terminologiczna bazy wiedzy jest uaktualniana bardzo rzadko, więc moŜe być uznana za stałą. • Wykonywanie zapytań jest duŜo częstsze niŜ uaktualnianie bazy wiedzy (czyli dodawanie nowych asercji). W związku z tym wydajność przetwarzania zapytań jest duŜo bardziej istotna niŜ wydajność aktualizacji. W podejściu kartograficznym definiuje się opis zaleŜności między konceptami w terminologii jako mapę konceptów (stąd teŜ nazwa podejścia). Mapa jest tworzona w czasie tworzenia bazy wiedzy. Taką mapę moŜna graficznie przedstawić w formie podobnej do diagramów Venna. KaŜdy obszar atomowy (taki, który nie zawiera Ŝadnych innych obszarów) reprezentuje unikalne i poprawne (spełnialne w terminach ontologii) przecięcie konceptów bazowych. Przecięcia konceptów, które nie są poprawne względem aksjomatów znajdujących się w terminologii, są z mapy usuwane. Obszary atomowe będą dalej nazywane regionami. Przykładową terminologię oraz odpowiadającą jej mapę konceptów przedstawia rysunek 1. W ontologii zdefiniowane zostały cztery koncepty: Planeta, Satelita, Gwiazda oraz CiałoNiebieskie. Dodatkowo wprowadzone zostały dwa standardowe koncepty logiki opisowej: ⊤ oznaczający zbiór wszystkich osobników z opisywanej dziedziny oraz ⊥, który jest konceptem pustym - nie naleŜą do niego Ŝadne osobniki. Koncept Planeta zawiera się w koncepcie Satelita, więc kaŜda planeta jest satelitą, ale niekoniecznie na odwrót. Część wspólna konceptów Gwiazda i Planeta jest pusta, zatem Ŝadna gwiazda nie jest planetą i na odwrót. Ostatni aksjomat informuje, Ŝe kaŜdy osobnik z dziedziny jest wystąpieniem konceptu CiałoNiebieskie. Rys. 1. Przykładowa terminologia oraz odpowiadająca jej mapa konceptów Poszczególnym regionom mapy przypisane są liczby całkowite z przedziału [1, n], gdzie n jest liczbą poprawnych regionów. Jako Ŝe kaŜdy obszar na mapie składa się z pewnej liczby regionów, moŜe być on reprezentowany przez ciąg binarny o długości n, z wartościami „1” na pozycjach odpowiadających regionom składowym i wartościami „0” na pozostałych pozycjach. W ten sposób moŜemy kaŜdemu konceptowi w terminologii przypisać pewną sygnaturę - ciąg bitów reprezentujących obszar pokrywany na mapie przez dany koncept. I tak na przykład Satelita na sygnaturę 01101, gdyŜ na obszar tego konceptu składają się regiony nr 2, 3 i 5, natomiast Planeta ma sygnaturę 00001, poniewaŜ tylko region nr 5 wchodzi w skład obszaru tego konceptu. 3. Wprowadzenie do ontologii niepewnych Kartograficzna reprezentacja wiedzy przedstawia zaleŜności między konceptami w postaci mapy konceptów, czyli zbioru regionów. Koncepty w terminologii reprezentowane są jako ciąg bitów „0” lub „1” oznaczających odpowiednio brak przynaleŜności lub przynaleŜność poszczególnych regionów do konceptów. Rysunek 2 przedstawia przykładową ontologię(terminologię), jak równieŜ odpowiadającą jej mapę konceptów. Rys. 2. Przykładowa ontologia oraz odpowiadająca jej mapa konceptów Na mapie znajdują się cztery moŜliwe regiony, oznaczone odpowiednio literami A, B, C i D. Zazwyczaj moŜemy załoŜyć, Ŝe istnienie kaŜdego z wymienionych regionów jest pewne, czyli system wie, Ŝe kaŜdy z istniejących regionów jest spełnialny (ang. satisfiable). Sytuację taką obrazuje rysunek 3a. Wartości 1 oznaczają całkowitą pewność co do istnienia danego regionu. Mogą jednak wystąpić sytuacje, w których istnienie wszystkich regionów wcale nie musi być pewne - moŜemy zróŜnicować poziomy pewności dla poszczególnych regionów. Mówimy wtedy o ontologii niepewnej. Rysunek 3b przedstawia przykładową mapę konceptów odpowiadającą takiej ontologii. Istnienie kaŜdego z wymienionych regionów określane jest przez współczynnik spełnialności ε [9], który intuicyjnie moŜna interpretować jako szansę wystąpienia danego regionu, czyli równieŜ szansę, Ŝe do danego regionu moŜe naleŜeć przynajmniej jeden osobnik. Dlatego teŜ mapa regionów została wzbogacona o informacje dotyczące współczynnika spełnialności - liczbę rzeczywistą z przedziału <0, 1>. Rys. 3. Przykład ontologii pewnej (a) oraz niepewnej (b) Ontologie niepewne mogą mieć róŜne źródła pochodzenia; na przykład mogą być tworzone na podstawie aksjomatów o róŜnym stopniu pewności. Inna moŜliwość to łączenie ontologii (ang. ontology merging) o róŜnych terminologiach. Ze względu na niemoŜność pełnego określenia przez system podobieństwa między konceptami nowo powstałe regiony mogą mieć róŜne współczynniki spełnialności [9]. 4. Wyznaczanie atomowych współczynników spełnialności dla obszarów Wyznaczenie współczynników spełnialności dla kaŜdego z obszarów atomowych wymaga przyjęcia pewnej interpretacji wartości współczynnika wiarygodności α aksjomatu terminologicznego. Poprzez współczynnik wiarygodności rozumiemy pewną wartość rzeczywistą z zakresu <0, 1>, przypisaną kaŜdemu aksjomatowi. Przykład listy aksjomatów wraz z przypisanymi im wartościami współczynnika wiarygodności został przedstawiony na rysunku 4. Rys. 4. Przykładowa lista aksjomatów wraz z wartościami współczynnika wiarygodności Intuicyjnie współczynnik wiarygodności moŜna rozumieć jako szansę, Ŝe dany aksjomat opisuje prawdziwą zaleŜność, jednak w kaŜdym modelu ta interpretacja jest uściślana. Aksjomaty, na podstawie których budowana jest ontologia, mogą mieć róŜne wartości współczynnika wiarygodności. Źródłem tych róŜnic, jak równieŜ samego występowania tego współczynnika, mogą być na przykład źródła danych o róŜnym zaufaniu. Niektóre źródła przygotowywane są przez ekspertów, inne natomiast mogą być przygotowywane przez amatorów. Zazwyczaj zaufanie co do zawartości tych pierwszych jest większe. Mimo, iŜ oba źródła mogą opisywać te same dziedziny, to współczynnik wiarygodności dla aksjomatów ze źródła pierwszego typu będzie większy aniŜeli dla aksjomatów ze źródła, których autorem nie jest ekspert. PoniŜej zostały przedstawione dwa róŜne modele wyznaczania współczynników spełnialności ε obszarów atomowych na podstawie wartości współczynników wiarygodności aksjomatów. 4.1. Model obszarów atomowych Model obszarów atomowych bazuje bezpośrednio na metodzie kartograficznej. W metodzie tej w czasie przetwarzania kaŜdego aksjomatu usuwane są regiony niespełnialne. W modelu obszarów atomowych regiony niespełnialne nie są usuwane, natomiast przypisywana jest im pewna wartość nazwana cząstkowym współczynnikiem spełnialności µ. Interpretacja cząstkowego współczynnika spełnialności jest analogiczna jak współczynnika spełnialności ε, odnosi się jednak tylko do cząstkowej informacji bazy wiedzy dotyczącej tylko jednego aktualnie przetwarzanego aksjomatu. Analogiczna wartość jest przypisywana regionom spełnialnym. Wartości cząstkowych współczynników spełnialności są wyznaczane na podstawie wartości współczynnika wiarygodności α. Dla regionów niespełnialnych µ = 1 - α, natomiast dla regionów spełnialnych µ = α. W taki sposób wyznaczane są wartości cząstkowych współczynników spełnialności dla kaŜdego z aksjomatów. Rys. 5. Proces wyznaczania wartości współczynnika spełnialności w modelu obszarów atomowych MoŜna przyjąć wiele sposobów wyznaczania współczynnika spełnialności. W tym modelu współczynnik spełnialności ε jest arbitralnie wyznaczany jako średnia arytmetyczna cząstkowych współczynników spełnialności (właściwości innych sposobów są tematem dalszych moŜliwych badań). Zbiór moŜliwych regionów dla ontologii tworzonej z listy aksjomatów z rysunku 4 zawiera 16 regionów odpowiadających wszystkim moŜliwym kombinacjom przynaleŜności do 4 konceptów. Na rysunku 5 przedstawiony został proces wyznaczania współczynników spełnialności dla regionów dla tej ontologii. Dla kaŜdego aksjomatu wyznaczany jest zbiór 16 regionów, którym przypisywane są wartości cząstkowych współczynników spełnialności obliczone w opisany uprzednio sposób. Wartości współczynnika spełnialności dla poszczególnych regionów na mapie docelowej wyznaczanie są, jak juŜ wcześniej wspomniano, jako średnia arytmetyczna cząstkowych współczynników spełnialności z odpowiadających regionów źródłowych (zbiorów regionów dla poszczególnych aksjomatów). Warto zwrócić uwagę na fakt, Ŝe regiony składowe o niskim cząstkowym współczynniku spełnialności mają równieŜ odwzorowanie w niskiej wartości współczynnika spełnialności w docelowym zbiorze regionów. 4.2. Model aksjomatyczny Model aksjomatyczny bazuje na moŜliwych rodzajach aksjomatów dotyczących relacji pomiędzy konceptami. W logice opisowej [1] moŜemy wyróŜnić pięć moŜliwych relacji pomiędzy konceptami. Relacje te zostały przedstawione na rysunku 6. Rys. 6. MoŜliwe relacje pomiędzy konceptami Dla dwóch konceptów C1 i C2 moŜemy powiedzieć, Ŝe: a. C1 jest równy C2 (rysunek 7a), b. C1 zawiera się w C2 (rysunek 7b), c. C2 zawiera się w C1 (rysunek 7c), d. C1 jest rozłączny z C2 (rysunek 7d), e. nie zachodzi Ŝadne z powyŜszych (rysunek 7e). W ogólnym przypadku, jeśli o konceptach C1 i C2 nic nie wiemy, to moŜemy wyróŜnić cztery obszary (C1 ⊓ C2, ¬C1 ⊓ ¬C2, ¬C1 ⊓ C2, C1 ⊓ ¬C2). Tabela 1 przedstawia, które z obszarów występują dla poszczególnych relacji między konceptami. W modelu aksjomatycznym współczynnik wiarygodności jest intuicyjnie interpretowany jako prawdopodobieństwo zachodzenia zdefiniowanej w aksjomacie relacji pomiędzy konceptami. Dla aksjomatu 1 z rysunku 4 wiemy, Ŝe współczynnik wiarygodności tego aksjomatu jest równy 0,6. Wiedząc, Ŝe zachodzi przynajmniej jedna z poprzednio zdefiniowanych pięciu relacji pomiędzy konceptami, moŜemy dla uproszczenia załoŜyć, Ŝe współczynniki wiarygodności pozostałych relacji są równe i wynoszą 0,1 (4 * 0,1 + 0,6 = 1). NiezaleŜnie od pozostałych aksjomatów moŜemy wyznaczyć wartości cząstkowych współczynników spełnialności µ dla czterech obszarów (niekoniecznie atomowych) rozłącznych (wspomniane wcześniej kombinacje konceptów C1 i C2). Tabela 1. Obecność obszarów w zaleŜności od relacji między konceptami a b c d C1 ⊓ C2 + + + ¬C1 ⊓ ¬C2 + + + ¬C1 ⊓ C2 + + C1 ⊓ ¬C2 e + + + + + + + Aby lepiej zobrazować tę metodę weźmy dla przykładu aksjomat A ⊓ B ≡ C. Lewą stronę aksjomatu traktujemy jako koncept C1 (nie interesują nas zaleŜności między konceptami A i B), prawą natomiast jako C2. Definiujemy następnie cztery obszary dla kombinacji opisanych powyŜej: o1 ≡ (A ⊓ B) ⊓ C, o2 ≡ ¬(A ⊓ B) ⊓ ¬C, o3 ≡ ¬(A ⊓ B) ⊓ C oraz o4 ≡ (A ⊓ B) ⊓ ¬C. Dla kaŜdego z tych obszarów wyznaczamy współczynnik µ. Tabela 2. Obliczanie cząstkowych współczynników spełnialności dla aksjomatu A⊓B≡C o1 o2 o3 o4 a 0,6 0,6 b 0,1 0,1 0,1 c 0,1 0,1 0,1 d 0,1 0,1 0,1 e 0,1 0,1 0,1 0,1 µ 0,9 1 0,3 0,3 W pierwszym kroku w tabeli 1 zamiast symbolu + wstawiamy wartość odpowiadającego relacji współczynnika wiarygodności. Dla analizowanego aksjomatu wstawiamy wartości 0,6 i 0,1. W tabeli 2 przedstawiono wynik tej operacji dla aksjomatu 1. Ostatnia kolumna pokazuje wartość współczynnika µ dla poszczególnych obszarów, będącą sumą wszystkich wartości występujących w wierszu odpowiadającym danemu obszarowi. W analogiczny sposób moŜna wyznaczyć wartości współczynnika µ dla pozostałych dwóch aksjomatów (tabela 3 i tabela 4). Mając tak wyznaczone cząstkowe współczynniki spełnialności, moŜliwe jest wyznaczenie współczynników spełnialności dla kaŜdego z obszarów atomowych. Na liście aksjomatów na rysunku 4 zdefiniowane są cztery koncepty. Liczba obszarów atomowych dla ontologii zbudowanej z tych aksjomatów jest równa 24 = 16. KaŜdemu z tych obszarów przyporządkowane są trzy wartości cząstkowych współczynników spełnialności wyznaczonych dla kaŜdego z aksjomatów. Cztery obszary zdefiniowane dla jednego aksjomatu są rozłączne (moŜliwe kombinacje konceptów C1 i C2). Stąd dowolny ustalony region zawiera się tylko w jednym z tych obszarów. Wartość cząstkowego współczynnika spełnialności dla jednego aksjomatu jest równa wartości cząstkowego współczynnika spełnialności wyznaczonego dla obszaru, do którego badany region naleŜy. Tabela 3. Obliczanie cząstkowych współczynników spełnialności dla aksjomatu B ⊑ D a b c B⊓D 0,2 0,2 0,2 ¬B ⊓ ¬D 0,2 0,2 0,2 ¬B ⊓ D 0,2 B ⊓ ¬D 0,2 e µ 0,2 0,8 0,2 0,2 1 0,2 0,2 0,6 0,2 0,2 0,6 d Tabela 4. Obliczanie cząstkowych współczynników spełnialności dla aksjomatu A⊓D≡⊥ a b c A⊓D 0,025 0,025 0,025 ¬A ⊓ ¬D 0,025 0,025 0,025 ¬A ⊓ D A ⊓ ¬D 0,025 0,025 e µ 0,025 0,1 0,9 0,025 1 0,9 0,025 0,95 0,9 0,025 0,95 d W modelu aksjomatycznym wartość współczynnika spełnialności danego regionu jest wyznaczana, podobnie jak dla modelu obszarów atomowych, jako średnia arytmetyczna wartości cząstkowych współczynników spełnialności tego obszaru atomowego. Rysunek 7 przedstawia sposób wyznaczania wartości współczynnika spełnialności dla kaŜdego z obszarów atomowych dla ontologii budowanej z aksjomatów z rysunku 4. Warto tutaj zwrócić uwagę na fakt, iŜ zastosowanie dowolnego z opisanych modeli daje w wyniku podobne wartości współczynnika spełnialności dla regionów na mapie docelowej. Regiony o niskim współczynniku spełnialności w modelu obszarów atomowych równieŜ mają niski współczynnik spełnialności przy korzystaniu z modelu aksjomatycznego. Podobna zaleŜność występuje dla regionów o wysokim współczynniku spełnialności. Pozwala to wnioskować, Ŝe modele dobrze opisują sposoby obliczania współczynników spełnialności dla poszczególnych regionów ontologii niepewnej. Przedstawione modele wyznaczania współczynników spełnialności obszarów atomowych zakładają analizę wszystkich moŜliwych obszarów atomowych, co sprawia, Ŝe ontologia niepewna składa się z 2n obszarów atomowych. Zarządzanie taką liczbą obszarów atomowych jest w praktyce nierealizowalne, dlatego zaproponowano metodę eliminacji dla ontologii niepewnych opisaną w kolejnej sekcji. Rys. 7. Proces wyznaczania wartości współczynnika spełnialności w modelu aksjomatycznym 5. Eliminacja w ontologiach niepewnych Ze względu na istnienie regionów o róŜnych poziomach pewności wprowadzone zostało pojęcie k-spełnialności. K-spełnialność określa minimalny poziom pewności, na jakim baza wiedzy postrzega ontologię niepewną. Dla ustalonej wartości k, wszystkie regiony o pewności mniejszej niŜ k są dla klienta niewidoczne. Przykładowo, dla ontologii z rysunku 3b przy 0,1-spełnialności region B nie będzie widoczny, co oznacza, Ŝe dla klienta nie istnieje (nie jest brany pod uwagę przy wnioskowaniu) koncept "koty bez rodziców" - w pewnym sensie jest on teŜ niewidoczny dla systemu wnioskującego. Wprowadzenie k-spełnialności powoduje konieczność rozszerzenia definicji podstawowych zaleŜności między konceptami [1] poprzez uwzględnienie poziomu pewności konceptów: • k-spełnialność (ang. satisfiability): Koncept C jest k-spełnialny względem terminologii T, jeśli istnieje przynajmniej jeden region naleŜący do konceptu C o współczynniku spełnialności nie mniejszym niŜ k (rys. 9a). • k-zawieranie (ang. subsumption): Koncept C k-zawiera się w koncepcie D względem terminologii T, jeśli wszystkie regiony naleŜące do konceptu C o współczynniku spełnialności nie mniejszym niŜ k naleŜą równieŜ do konceptu D, co zapisujemy C ⊑k D. Regiony o współczynniku spełnialności mniejszym niŜ k składające się na koncepty C lub D są niewidoczne, więc równieŜ nie są uwzględniane przy badaniu zawierania się konceptów (rys. 9b). • k-równowaŜność (ang. equivalence): Dwa koncepty C i D są k-równowaŜne względem terminologii T, jeśli wszystkie regiony o współczynniku spełnialności nie mniejszym niŜ k naleŜące do konceptu C naleŜą do konceptu D oraz wszystkie regiony o współczynniku spełnialności nie mniejszym niŜ k naleŜące do konceptu D naleŜą do konceptu C. Innymi słowy, dwa koncepty C i D są k-równowaŜne jeśli C ⊑k D oraz D ⊑k C. Zapisujemy to C ≡k D. • Podobnie jak przy operacji zawierania, regiony o współczynniku spełnialności mniejszym niŜ k, składające się na koncepty C lub D są niewidoczne, więc równieŜ nie są uwzględniane przy badaniu równowaŜności konceptów (rys. 9c). k-rozłączność (ang. disjointness): Dwa koncepty C i D są k-rozłączne względem terminologii T, jeśli nie mają Ŝadnych wspólnych regionów o współczynniku spełnialności nie mniejszym niŜ k. Analogiczne ograniczenia dotyczące widzialności regionów jak dla operacji zawierania i równowaŜności konceptów występują podczas badania rozłączności konceptów - regiony o współczynniku spełnialności mniejszym niŜ k składające się na koncepty C lub D są niewidoczne (rys. 9d). Rys. 8. Podstawowe zaleŜności między konceptami z uwzględnieniem k-spełnialności. Zdefiniowanie poziomu k-spełnialności powoduje, iŜ regiony atomowe o współczynniku spełnialności mniejszym niŜ k nie są widoczne przy wnioskowaniu. 6. Zapytania terminologiczne w ontologiach niepewnych Tradycyjnie, podstawowy mechanizm wnioskujący udostępniany przez systemy oparte na logice opisowej sprawdza zawieranie się konceptów. Analogicznie jak w przypadku ontologii pewnych, równieŜ w przypadku ontologii niepewnych takie sprawdzenie jest wystarczające do przeprowadzenia pozostałych typów wnioskowań. MoŜna pokazać, Ŝe podobnie jak dla tradycyjnego wnioskowania [1], pozostałe trzy problemy moŜna zredukować do problemu k zawierania się: • Koncept C jest k-niespełnialny C k-zawiera się w ⊥. • Koncepty C i D są k-równowaŜne C k-zawiera się w D i D k-zawiera się w C. • Koncepty C i D są k-rozłączne C ⊓ D k-zawiera się w ⊥. Wszystkie języki opisowe oparte na logice opisowej oferują operator koniunkcji oraz koncept niespełnialny, więc kaŜdy z nich moŜna równieŜ wykorzystać do wnioskowania na ontologiach niepewnych. Aby jednak móc przeprowadzać wnioskowanie opisanych typów, system wnioskujący musi potrafić rozwiązać problem zawierania się konceptów. Rysunek 9 przedstawia przykładową ontologię niepewną, dla której chcemy sprawdzić, czy koncept X zawiera się w Y. Rys. 9. Przykładowa ontologia niepewna dla rozwiązania problemu zawierania się konceptów Jeśli rozwaŜać problem zawierania się konceptów bez uwzględniania współczynników spełnialności, to odpowiedź na zadane pytanie jest oczywista: koncept X nie zawiera się w koncepcie Y - koncepty X oraz Y reprezentują zupełnie inne regiony (mające, co prawda, część wspólną, jednak jest to niewystarczające). Wprowadzając k-spełnialność, w procesie wnioskowania ograniczamy się do regionów o współczynniku spełnialności większym bądź równym k, natomiast pozostałe regiony są ignorowane. Dla przykładu przyjmijmy dla ontologii z rysunku 10 0,1-spełnialność. Widzimy, Ŝe region B staje się "niewidoczny", poniewaŜ jego współczynnik spełnialności jest równy 5% (0,05) i jest mniejszy od przyjętego k równego 0,1. W takiej sytuacji koncept X jest reprezentowany tylko przez region D, a w konsekwencji zawiera się on w koncepcie Y reprezentowanym przez sumę regionów C i D. 7. Podsumowanie W rozdziale przedstawione zostały modele wyznaczania współczynników spełnialności podczas budowy ontologii niepewnych, jak równieŜ wykonywania zapytań terminologicznych na tych ontologiach. Problem ontologii niepewnych jest problemem niezwykle istotnym, szczególnie tam, gdzie wnioski z nich wysnuwane są krytyczne. Ontologie niepewne i wykonywanie na nich zapytań mogą równieŜ znaleźć zastosowanie w systemach integracji ontologii [9], łączących wiele, czasami znacząco róŜniących się ontologii. Zaprezentowane modele wydają się pokrywać szeroki zakres potencjalnych zastosowań. Aktualne prace, prowadzone w ramach projektu PIPS, skupiają się nie tylko na opracowaniu efektywnych algorytmów przetwarzania zapytań terminologicznych, ale równieŜ zapytań dotyczących asercji [8]. 8. Podziękowania Autorzy dziękują Teresie Grabowskiej i Wojciechowi Waloszkowi za pomoc w analizie róŜnych modeli budowy ontologii niepewnych i ich wartościowe komentarze. LITERATURA [1] Baader F. A., McGuiness D. L., Nardi D., Patel-Schneider P. F.: The Description Logic Handbook: Theory, implementation, and applications, Cambridge University Press, 2003. [2] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: The Cartographer Algorithm for Processing and Querying Description Logics Ontologies, P. S. Szczepaniak, J. Kacprzyk, A. Niewiadomski (red.), Lecture Notes in Artifical Intelligence, Advances In Web Intelligence, Czerwiec 2005, str. 163-169. [3] Goczyła K., Waloszek W.: Topologiczna analiza ontologii opartych na logice opisowej, S. Kozielski, B. Małysiak, P. Kasprowski, D. Mrozek (red.), Bazy Danych Modele, Technologie, Narzędzia, WKŁ 2005, Roz. XXIII, str. 191-197. [4] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Cartographic Approach to Knowledge Representation and Management in KaSeA. International Workshop on Description Logics, 2005, str. 217. [5] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Problematyka zarządzania wiedzą w systemach typu e-health, J. Górski, A. Wardziński (red.), InŜynieria oprogramowania - Nowe wyzwania, WNT 2004, Roz. XXVI, str. 358-371. [6] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Inference Mechanisms for Knowledge Management System in E-health Environment, VII Krajowa Konferencja InŜynierii Oprogramowania, Kraków 2005 (zaakceptowana do publikacji). [7] Goczyła K., Grabowska T., Waloszek W., Zawadzki M.: Hybryd Architecture of DL Knowledge Base In KaSeA. International Workshop on Description Logics, 2005, str. 216 [8] Goczyła K., Zawadzki M.: Przetwarzanie i wnioskowanie z wiedzy o róŜnym poziomie zaufania, S. Kozielski, B. Małysiak, P. Kasprowski, D. Mrozek (red.), Bazy Danych Modele, Technologie, Narzędzia, WKŁ 2005, Roz. XXIV, str. 207-213. [9] Goczyła K., Grabowska T.: Metoda ELPAR łączenia ontologii oparta na ich kartograficznej reprezentacji, I Krajowa Konferencja Naukowa - Technologie Przetwarzania Danych, 2005 (zaakceptowana do publikacji) [10] Staab S., Studer R.: Handbook on Ontologies, Springer-Verlag, 2004 PROCESSING QUERIES AGAINST TERMINOLOGIES OF UNCERTAIN DESCRIPTION LOGICS' BASED ONTOLOGIES. Information systems based on knowledge bases are becoming more and more popular. A significant number of existing systems utilize ontologies for describing knowledge. In the process of building an ontology it is very often assumed, that the information stored in it are valid. Such assumption is usually correct, however there can exist applications where it may not be adequate enough. The chapter introduces uncertain ontologies and presents proposals of extending knowledge cartography approach with aspects of trust to the terminology. There have been also presented methods for processing queries against terminologies of uncertain ontologies.