Zrealizowany projekt dotyczył tematyki odwzorowywania ontologii
Transkrypt
Zrealizowany projekt dotyczył tematyki odwzorowywania ontologii
Nr wniosku: 152592, nr raportu: 3273. Kierownik (z rap.): mgr inż. Marcin Mirosław Pietranik Zrealizowany projekt dotyczył tematyki odwzorowywania ontologii, będącej jednym z aspektów integracji tych struktur wiedzy. Podstawową motywacją do sformułowania jego głównego celu projektu było spostrzeżenie, że relacyjne bazy danych nie są wystarczająco ekspresywne i elastyczne, a dane które mają zostać gromadzone cechują się rosnąca różnorodnością, zarówno pod względem zawartości, jak i struktury. Równocześnie coraz częściej pojawia się potrzeba integracji niezależnych systemów komputerowych umożliwiająca wymianę używanych przez nie danych przy zachowaniu ich spójności. Rozwiązaniem tych problemów może być użycie ontologii oraz metod ich odwzorowania, a więc wyznaczania ich fragmentów, które w najbardziej zbliżony sposób odnoszą się do tych samych obiektów modelowanego wycinka rzeczywistości. Szeroko omawiane w literaturze rozwiązania tego problemu, są jednak silnie uzależnione od standardu zapisywania ontologii jakim jest OWL. Dogłębna analiza dostępnych publikacji pozwoliła zauważyć, że odniesienie problematyki tylko do tego pojedynczego formatu, wymusza odrzucenie uniwersalności i teoretycznego ugruntowania problematyki, co powoduje brak odporności na zmiany specyfikacji OWL. Format ten ponadto posiada szereg ograniczeń np. brak możliwości zdefiniowania semantyki atrybutów, pozwalającej na opisanie wielu znaczeń jakie przyjmują atrybuty, gdy są przypisywane różnym klasom. Dodatkowo koszt związany z wdrożeniem obsługi tego języka w rzeczywistych systemach informatycznych może być zbyt wysoki. W projekcie podjęto się zatem opracowania spójnej definicji ontologii oraz zestawu uniwersalnych metod ich odwzorowywania bazujących ściśle na przyjętej podstawie teoretycznej. Rozwiązane zostały następujące zadania cząstkowe: 1. Opracowanie definicji ontologii i ich elementów składowych. Ontologie obejmują wszystkie poziomy szczegółowości fragmentu rzeczywistości jaki ma zostać zamodelowany. W ramach projektu przygotowano precyzyjne definicje zarówno ontologii, jak również klas i ich struktur (obejmujących atrybuty i ich semantykę), relacji pomiędzy klasami oraz ich instancji. 2. Opracowanie metody odwzorowywania ontologii na poziomie atrybutów i klas. Atrybuty są najmniejszym elementem możliwym do zdefiniowania w ontologiach. Odwzorowywanie ontologii na tym poziomie polega na znalezieniu funkcji stopnia z jakim informacje wyrażone w wybranym atrybucie, mogą zostać przekształcone do innego atrybutu z innej klasy. Pojedyncze atrybuty służą jednak tylko opisaniu pewnych niepodzielnych charakterystyk klas. Aby wyznaczyć całościowe odwzorowanie ontologii konieczne stało się opracowanie metody, która będzie odpowiadała na pytanie w jakim stopniu informacje zawarte w pewnej klasie zadanej ontologii można przekształcić do innej klasy z drugiej ontologii. 3. Opracowanie metody odwzorowywania ontologii na poziomie relacji. Relacje są używane do wyrażenia interakcji w jakie mogą ze sobą wchodzić dwie lub więcej klas. W celu ich odwzorowania, nie jest jednak możliwe proste porównanie zbiorów klas jakie są nimi połączone. W projekcie opracowana została metoda odwzorowywania relacji obejmująca wykrywanie relacji sprzecznych, relacji z ontologii źródłowej, które uzupełniają opis interakcji klas w ontologii docelowej oraz wyznaczająca stopień, z którym dwie niesprzeczne relacje mogą zostać dopasowane. 4. Opracowanie metody odwzorowywania ontologii na poziomie instancji. Ontologie oprócz definicji klas zawierają również ich instancje, a więc konkretyzacje obiektów, których modelem jest dana klasa. W projekcie opracowany został algorytm wyznaczający zbiory instancji, których zarówno klasy jak i przypisane wartości atrybutów są możliwe do jednoznacznego dopasowania. 5. Projekt oraz implementacja środowiska eksperymentalnego. W ramach prac projektowych zaimplementowany został system informatyczny w oryginalny sposób wykorzystujący bezschematową bazę danych MongoDB oraz nowoczesne technologie prezentacji treści w formie aplikacji webowej. Jest on praktyczną realizacją wszystkich przedstawionych rozwiązań teoretycznych. 6. Opracowanie procedury weryfikacji oraz badania eksperymentalne. Dotychczasowe metody odwzorowywania ontologii spotykane w literaturze nie wykorzystywały atrybutów klas. Wynika z tego trudność bezpośredniego porównania obecnych rozwiązań z rozwiązaniem zaproponowanym podczas realizacji projektu. Problem ten obejmuje między innymi zebranie danych testowych przy zapewnieniu ich odpowiedniej liczności i reprezentatywności. W projekcie opracowana została nowatorska metoda weryfikacji wyznaczanych odwzorowań, bazująca na analizie histogramów błędów popełnianych przez dostępne systemy odwzorowujące oraz statyczny test znaków. Korzystając z przygotowanej procedury testowej oraz zaimplementowanego środowiska przeprowadzony został eksperyment weryfikujący poprawność i skuteczność przygotowanych algorytmów. Wykonana została zarówno analiza statystyczna uzyskanych wyników oraz ich dokładna analiza szczegółowa.