Zrealizowany projekt dotyczył tematyki odwzorowywania ontologii

Transkrypt

Zrealizowany projekt dotyczył tematyki odwzorowywania ontologii
Nr wniosku: 152592, nr raportu: 3273. Kierownik (z rap.): mgr inż. Marcin Mirosław Pietranik
Zrealizowany projekt dotyczył tematyki odwzorowywania ontologii, będącej jednym z aspektów integracji
tych struktur wiedzy. Podstawową motywacją do sformułowania jego głównego celu projektu było
spostrzeżenie, że relacyjne bazy danych nie są wystarczająco ekspresywne i elastyczne, a dane które mają
zostać gromadzone cechują się rosnąca różnorodnością, zarówno pod względem zawartości, jak i struktury.
Równocześnie coraz częściej pojawia się potrzeba integracji niezależnych systemów komputerowych
umożliwiająca wymianę używanych przez nie danych przy zachowaniu ich spójności. Rozwiązaniem tych
problemów może być użycie ontologii oraz metod ich odwzorowania, a więc wyznaczania ich fragmentów,
które w najbardziej zbliżony sposób odnoszą się do tych samych obiektów modelowanego wycinka
rzeczywistości.
Szeroko omawiane w literaturze rozwiązania tego problemu, są jednak silnie uzależnione od standardu
zapisywania ontologii jakim jest OWL. Dogłębna analiza dostępnych publikacji pozwoliła zauważyć, że
odniesienie problematyki tylko do tego pojedynczego formatu, wymusza odrzucenie uniwersalności i
teoretycznego ugruntowania problematyki, co powoduje brak odporności na zmiany specyfikacji OWL.
Format ten ponadto posiada szereg ograniczeń np. brak możliwości zdefiniowania semantyki atrybutów,
pozwalającej na opisanie wielu znaczeń jakie przyjmują atrybuty, gdy są przypisywane różnym klasom.
Dodatkowo koszt związany z wdrożeniem obsługi tego języka w rzeczywistych systemach informatycznych
może być zbyt wysoki.
W projekcie podjęto się zatem opracowania spójnej definicji ontologii oraz zestawu uniwersalnych metod
ich odwzorowywania bazujących ściśle na przyjętej podstawie teoretycznej. Rozwiązane zostały następujące
zadania cząstkowe:
1.
Opracowanie definicji ontologii i ich elementów składowych. Ontologie obejmują wszystkie
poziomy szczegółowości fragmentu rzeczywistości jaki ma zostać zamodelowany. W ramach projektu
przygotowano precyzyjne definicje zarówno ontologii, jak również klas i ich struktur (obejmujących
atrybuty i ich semantykę), relacji pomiędzy klasami oraz ich instancji.
2.
Opracowanie metody odwzorowywania ontologii na poziomie atrybutów i klas. Atrybuty są
najmniejszym elementem możliwym do zdefiniowania w ontologiach. Odwzorowywanie ontologii na tym
poziomie polega na znalezieniu funkcji stopnia z jakim informacje wyrażone w wybranym atrybucie, mogą
zostać przekształcone do innego atrybutu z innej klasy. Pojedyncze atrybuty służą jednak tylko opisaniu
pewnych niepodzielnych charakterystyk klas. Aby wyznaczyć całościowe odwzorowanie ontologii
konieczne stało się opracowanie metody, która będzie odpowiadała na pytanie w jakim stopniu informacje
zawarte w pewnej klasie zadanej ontologii można przekształcić do innej klasy z drugiej ontologii.
3.
Opracowanie metody odwzorowywania ontologii na poziomie relacji. Relacje są używane do
wyrażenia interakcji w jakie mogą ze sobą wchodzić dwie lub więcej klas. W celu ich odwzorowania, nie
jest jednak możliwe proste porównanie zbiorów klas jakie są nimi połączone. W projekcie opracowana
została metoda odwzorowywania relacji obejmująca wykrywanie relacji sprzecznych, relacji z ontologii
źródłowej, które uzupełniają opis interakcji klas w ontologii docelowej oraz wyznaczająca stopień, z którym
dwie niesprzeczne relacje mogą zostać dopasowane.
4.
Opracowanie metody odwzorowywania ontologii na poziomie instancji. Ontologie oprócz
definicji klas zawierają również ich instancje, a więc konkretyzacje obiektów, których modelem jest dana
klasa. W projekcie opracowany został algorytm wyznaczający zbiory instancji, których zarówno klasy jak i
przypisane wartości atrybutów są możliwe do jednoznacznego dopasowania.
5.
Projekt oraz implementacja środowiska eksperymentalnego. W ramach prac projektowych
zaimplementowany został system informatyczny w oryginalny sposób wykorzystujący bezschematową bazę
danych MongoDB oraz nowoczesne technologie prezentacji treści w formie aplikacji webowej. Jest on
praktyczną realizacją wszystkich przedstawionych rozwiązań teoretycznych.
6.
Opracowanie procedury weryfikacji oraz badania eksperymentalne. Dotychczasowe metody
odwzorowywania ontologii spotykane w literaturze nie wykorzystywały atrybutów klas. Wynika z tego
trudność bezpośredniego porównania obecnych rozwiązań z rozwiązaniem zaproponowanym podczas
realizacji projektu. Problem ten obejmuje między innymi zebranie danych testowych przy zapewnieniu ich
odpowiedniej liczności i reprezentatywności. W projekcie opracowana została nowatorska metoda
weryfikacji wyznaczanych odwzorowań, bazująca na analizie histogramów błędów popełnianych przez
dostępne systemy odwzorowujące oraz statyczny test znaków. Korzystając z przygotowanej procedury
testowej oraz zaimplementowanego środowiska przeprowadzony został eksperyment weryfikujący
poprawność i skuteczność przygotowanych algorytmów. Wykonana została zarówno analiza statystyczna
uzyskanych wyników oraz ich dokładna analiza szczegółowa.