pobierz plik referatu

Transkrypt

pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Rozdział 26
w
Przegląd metod porównywania ontologii
1 Wstęp
da
.b
w
w
Streszczenie. Heterogeniczność i mnogość tworzonych ontologii oraz ich
szerokie (już istniejące i potencjalne) zastosowania pociągają za sobą konieczność znajdowania równoważnych obiektów w różnych ontologiach.
W artykule zaprezentowany zostanie przegląd aktualnych technik porównywania ontologii, a w szczególności zostaną omówione miary podobieństwa
terminologicznego, strukturalnego, instancyjnego oraz semantycznego.
Przedstawione zostaną także kierunki badań w tej dziedzinie.
pl
s.
Ontologie odgrywają kluczową rolę w zagadnieniach związanych z pozyskiwaniem informacji, integracją danych, modelowaniem i monitorowaniem procesów biznesowych. Obecnie istnieje już wiele ontologii, tzw. wyższego poziomu, które mogą być wykorzystane do
tworzenia innych ontologii (np. CYC http://www.cyc.com/). Tworzonych jest także dużo
tzw. ontologii dziedzinowych, czyli ontologii opisujących jedną dziedzinę. W obrębie
ontologii dziedzinowych opisujących jedną dziedzinę zauważalne są jednak różnice w pojmowaniu tej dziedziny, np. w zakresie klas, poziomie szczegółowości oraz w aspektach
technicznych, jak np. używanej terminologii. Wyszukiwarka Sieci Semantycznej Swoogle
(http://swoogle.umbc.edu/) przeszukuje ponad 10000 ontologii jakie już znajdują się w sieci www. Zachodzi zatem potrzeba porównywania ontologii i znajdowania równoważnych
obiektów w różnych ontologiach. Kluczową rolę w narzędziach do porównywania ontologii
odgrywają miary podobieństwa (ang. similarity measures).
W podrozdziale 2 przedstawiono definicję ontologii oraz wprowadzono pojęcie mediacji
pomiędzy ontologiami. Podrozdział 3 poświecono ogólnej definicji miar podobieństwa oraz
klasyfikacji miar podobieństwa w odniesieniu do ontologii. Przegląd podejść do określania
podobieństwa pomiędzy ontologiami przedstawiono w podrozdziale 4. W zakończeniu
zaprezentowano kierunki dalszych badań w tej dziedzinie.
2 Ontologie
Ontologię można zdefiniować jako „jawną konceptualizację rzeczywistości” przy czym
konceptualizacja rozumiana jest jako „abstrakcyjna, uproszczona wizja świata, którą chceGrażyna Paliwoda-Pękosz
Uniwersytet Ekonomiczny w Krakowie, Katedra Informatyki, ul. Rakowicka 27, 31-510 Kraków,
Polska
email:[email protected]
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
G.Paliwoda-Pękosz
my przedstawić w jakimś celu” [9]. Dotychczasowe opracowania dotyczące podobieństwa
ontologii najczęściej opierają się na modelu ontologii opracowanym na Uniwersytecie
w Karlsruhe [19], [6].
O := (C, T, R, A, I, V, ≤C, ≤R, ≤A, σR, σA, ιc, ιT, ιR, ιA)
(1)
w
Ontologia (O) jest strukturą składającą się z:
− zbiorów konceptów/klas1 – abstrakcyjnych pojęć (C), typów danych (T), relacji –
związków pomiędzy konceptami (R), atrybutów – właściwości konceptów (A),
instancji – konkretnych jednostek opisywanych przez ontologię (I) oraz wartości
danych (V),
− relacji częściowego porządku zwanych hierarchią konceptów lub taksonomią (≤C),
hierarchii relacji (≤R) oraz hierarchii atrybutów (≤A),
− funkcji określającej, które koncepty mogą być połączone określoną relacją, zwanej
sygnaturą relacji (σR: R → C2) oraz funkcji określającej dla każdego atrybutu jego
możliwe przypisania do konceptów i możliwe typy danych tego atrybutu
(σA: A → C×T),
− funkcji określającej przypisanie instancji do konceptów
(ιc: C → 2I),
− funkcji określającej przypisanie wartości do typów
(ιT: T → 2V),
− funkcji określającej przypisanie par instancji do relacji
(ιR: R → 2I×I),
− funkcji określającej wartość atrybutu dla danej instancji
(ιA: A → 2I×V).
Ontologie porównuje się w celu rozwiązania problemów związanych z mnogością
i heterogenicznością tworzonych ontologii (różne ontologie opisujące tą samą dziedzinę,
różny zakres dziedzinowy ontologii). Na tzw. mediację (ang. mediation) pomiędzy ontologiami składają się [5]:
− mapowanie ontologii (ang. ontology mapping), czyli poszukiwanie semantycznych
związków pomiędzy ontologiami i znajdowanie reguł odpowiedniości pomiędzy
elementami ontologii, np. równoważność klas lub relacji w dwóch ontologiach,
− łączenie ontologii (ang. ontology merging) tworzenie z wielu ontologii jednej ontologii.
da
.b
w
w
RÓWNOWAŻNOŚĆ/ZAWIERANIE
O1
O2
atrybutów
relacji
instancji
Rys. 1. Cele porównań ontologii
pl
s.
klas
Źródło: Opracowanie własne.
1
W niektórych opracowaniach stosuje się określenie klasa na określenie konceptu i taka też
terminologia będzie używana w niniejszym opracowaniu.
326
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Przegląd metod porównywania ontologii
Najogólniej mediację pomiędzy ontologiami można rozpatrywać w aspekcie porównywania
takich obiektów ontologii jak klasy, atrybuty klas, relacje oraz instancje i znajdowania
elementów równoważnych lub zawierających się (rys. 1).
3 Miary podobieństwa
w
3.1 Definicja
Miara podobieństwa jest funkcją rzeczywistą:
w
S: O×O → [0, 1]
(2)
spełniającą warunki:
∀ x∈O S(x, x) = 1 oraz dla x < > y S(x,y) < 1
w
da
.b
Miara podobieństwa może być symetryczna (jeżeli spełniony jest warunek symetryczności, tzn. ∀ x, y∈O S(x, y) = S(y, x) ) lub niesymetryczna (zob. przykład miary opisanej
wzorem 7).
Miary podobieństwa par obiektów ontologii (klas, atrybutów, relacji, instancji) można
podzielić na terminologiczne (leksykalne), strukturalne, instancyjne i semantyczne [7], [2].
3.2 Podobieństwo terminologiczne
Podobieństwo terminologiczne (ang. terminological) określa podobieństwo obiektów na
podstawie porównywania ich nazw lub URI. Do bezpośredniego porównywania nazw można wykorzystać, np. tzw. odległość edycyjną [16]. Jest to minimalna liczba operacji (kasowanie, dodanie, wstawienie, przestawienie), która jest potrzebna do tego, aby z jednego ciągu znaków otrzymać drugi. Przykładem takiej miary jest miara dopasowania łańcuchów
znaków (SM) zaproponowana w [17] bazująca na odległości edycyjnej zdefiniowana następująco:
pl
s.
⎛ min( l1 , l 2 ) − ed (l1 , l 2 ) ⎞
⎟ ∈ [0,1]
SM (l1 , l 2 ) = max⎜⎜ 0,
⎟
min( l1 , l 2 )
⎝
⎠
(3)
l1, l2 – porównywane ciągi znaków
|l1|, |l2| - długości tych ciągów
ed - odległość edycyjna.
Inne podejście, które nie wykorzystuje odległości edycyjnej, zastosowano przy opracowywaniu miary Jaro [15], [13]:
gdzie:
1 ⎛ m m m − t ⎞⎟
Jaro(l1 , l 2 ) = ⎜⎜ + +
m ⎟⎠
3 ⎝ l1 l 2
gdzie:
(4)
l1, l2 – porównywane ciągi znaków
1
K
1
L
l1 = l1 ... l1 , l 2 = l 2 ... l 2
327
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
G.Paliwoda-Pękosz
m - liczba wspólnych znaków w ciągach l1, l2, przy czym znak l1i w ciągu l1 jest
wspólny z ciągiem l2 jeżeli ∃ j: i - H ≤ j ≤ i + H , l1i = l 2j oraz H =
min ( l1 , l 2
)
2
t – połowa liczby transpozycji, przy czym transpozycja definiowana jest następują-
w
co: jeżeli l1' = l1z ' ... l1t ' jest ciągiem znaków z ciągu l1 wspólnych z l2, a l '2 = l e2' ... l 2f ' jest
ciągiem znaków z ciągu l2 wspólnych z l1, to transpozycją jest numer pozycji i, takiej, że
i'
i'
l1 ≠ l 2 .
w
Winkler [21] zmodyfikował miarę zdefiniowaną przez Jaro i zaproponował miarę, która
uwzględnia (preferuje znaki wspólne na początku ciągów) liczbę takich samych znaków na
początku obu ciągów (P):
Jaro − Winkler(l1 , l2 ) = Jaro(l1 , l2 ) +
max(P,4)
(1 − Jaro(l1 , l2 ))
10
(5)
w
Przegląd innych metod porównywania ciągów znaków można znaleźć np. w [4], a metody uwzględniające dodatkowo zbiór synonimów (Wordnet) w [20].
3.3 Podobieństwo strukturalne
da
.b
Podobieństwo strukturalne (ang. structural) można podzielić na:
− strukturalne wewnętrzne – porównywanie struktury wewnętrznej obiektu, np. liczby
atrybutów,
− strukturalne zewnętrzne – porównywanie grafowej struktury ontologii – podobieństwo sąsiadów.
Miarą podobieństwa strukturalnego może być odległość Jaccarda, którą dla dwóch
zbiorów A, B definiuje się jako:
J ( A, B ) =
A∩ B
A∪ B
(6)
3.4 Podobieństwo instancyjne
pl
s.
Może ona być wykorzystywana do porównywania strukturalnego klas i relacji w ontologiach. W pracy [20] za sąsiedztwa klas przyjęto klasy powiązane za pomocą relacji
subClassOf, a dla relacji za pomocą relacji subPropertyOf.
W miarach podobieństwa instancyjnego (ang. extensional) do porównywania klas wykorzystuje się zbiory instancji należące do tych klas, natomiast podczas porównywania relacji
korzysta się ze zbiorów par instancji będących w odpowiednich relacjach. Przykładowo,
jeżeli dwa zbiory instancji należące do dwóch różnych klas byłyby równe, to te klasy
byłyby uważane za równoważne [13], [1].
3.5 Podobieństwo semantyczne
Najogólniej, podobieństwo semantyczne jest to podobieństwo obiektów określane na podstawie ich znaczenia. W odniesieniu do ontologii, podobieństwo semantyczne jest to podo328
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Przegląd metod porównywania ontologii
w
bieństwo określane na podstawie wewnętrznej, formalnej, logicznej struktury reprezentacji
wiedzy w ontologii. Może ono być różnie definiowane w zależności od tej struktury. Przykładowo, OWL DL bazuje na logice opisowej SHOIN(D), natomiast OWL 1.1 na SROIQ
(http://www.w3.org/Submission/owl11-overview). Przykładem miar należących do tej grupy są miary podobieństwa semantycznego bazujące na logice ALC [2]. Podstawą tych miar
są definicje konceptu2 charakterystycznego oraz charakterystycznego zbioru akceptacji.
Koncept c należący do zbioru konceptów C (|C|=n), jest charakterystyczny jeżeli jest
przecięciem n literałów (konceptów lub zanegowanych konceptów), z których każdy pojawia się w tym przecięciu tylko raz. Zbiór wszystkich konceptów charakterystycznych zbioru C jest oznaczany jako ξ(C).
Charakterystyczny zbiór akceptacji (Z(T)) dla danego Tbox T zawierającego zbiór nazw
konceptów C jest to podzbiór ξ(C) zawierający wszystkie koncepty charakterystyczne, które są spójne względem T, tzn. dla każdego K∈Z(T) istnieje I - interpretacja T, taka, że KI ≠
ø. Przykładem miary podobieństwa semantycznego konceptów jest miara pokrycia γ (ang.
coverage measure), która określa stopień pokrycia jednej ontologii przez drugą (wzór 7).
w
w
γ ( T1 , T2 ) =
Ζ( T1 ) ∩ Z ( T2 )
(7)
Z ( T1 )
da
.b
gdzie: T1, T2 – zbiory aksjomatów TBox odpowiadające odpowiednio pierwszej i drugiej
ontologii
Z(T1), Z(T2) – charakterystyczne zbiory akceptacji odpowiednio dla T1 i T2.
Jest to miara niesymetryczna. Dla dwóch zbiorów Tbox, z dwóch ontologii, określa stopień pokrycia pierwszego zbioru akceptacji przez drugi. Definicja tej miary zostanie wyjaśniona na przykładzie.
Niech C={ZwierzeDomowe, Kot, Pies}. Zbiór konceptów charakterystycznych zbioru
konceptów C będzie się zatem składał z ośmiu elementów, które zakodowano symbolicznie
w tabeli na rys. 2. Znak 1 w tabeli oznacza koncept, natomiast 0 negację konceptu z odpowiedniego wiersza. Przykładowo, w kolumnie drugiej tabeli zakodowano koncept charakterystyczny postaci: Kot ¬Pies ZwierzeDomowe.
Rozważmy dwa zbiory aksjomatów TBox postaci:
ZwierzeDomowe}, T2 = {ZwierzeDomowe ≡ Kot Pies}
T1={Kot
Charakterystyczne zbiory akceptacji Z(T1) i Z(T2) odpowiednio dla zbiorów aksjomatów
T1, T2 przedstawiono na rys. 2. Miara pokrycia pierwszej ontologii przez drugą wynosi 2/3,
natomiast miara pokrycia drugiej ontologii przez pierwszą wynosi 1, ponieważ stosując
wzór 7 otrzymujemy:
4 2
= ,
6 3
pl
s.
γ ( T1 , T2 ) =
γ ( T2 , T1 ) =
4
=1
4
2
W logikach opisowych używa się terminów koncept i rola dla określenia odpowiednio klasy
i relacji.
329
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
G.Paliwoda-Pękosz
Z(T1)
Kot
Pies
ZwierzeDomowe
1
1
1
1
0
1
0
0
0
0
1
1
0
1
0
0
0
1
1
1
0
1
0
0
w
Z(T2)
Rys. 2. Przykład zbioru konceptów charakterystycznych oraz charakterystycznych zbiorów
akceptacji dla zbioru konceptów {Kot, Pies, ZwierzeDomowe}
w
Źródło: Opracowanie własne
Definicje innych miar mających zastosowanie do konceptów oraz ról (odpowiedniki klas
i relacji w DL) dla logiki ALC można znaleźć w [2], natomiast miary mające zastosowanie
do OWL DL bazującego na logice SHOIN(D) w [10].
w
3.6 Porównanie miar podobieństwa
da
.b
Podstawowym rodzajem miar podobieństwa, wykorzystywanym w pozostałych rodzajach
miar, jest podobieństwo terminologiczne. Nie jest ono jednak wystarczające do określenia
podobieństwa pomiędzy elementami ontologii, ponieważ nie uwzględnia grafowej reprezentacji ontologii. To zagadnienie ujmują natomiast strukturalne miary podobieństwa.
Ściśle związane z intuicyjnym pojmowaniem klas i relacji są miary podobieństwa instancyjnego. Nie zawsze można je jednak zastosować z uwagi na niewystarczającą liczbę dostępnych instancji. Semantyczne miary podobieństwa opierają się na formalizmie matematycznym wykorzystywanym do opisu ontologii, ale proces konstrukcji takich miar jest bardzo złożony. W tabeli 1 zamieszczono porównanie mocnych i słabych stron miar podobieństw.
Tabela 1. Porównanie miar podobieństw
Terminologiczne
Strukturalne
Mocne strony
Łatwe do
zaimplementowania
algorytmy
Uwzględniają strukturę
elementów ontologii
i powiązania pomiędzy nimi
Słabe strony
Nie uwzględniają
powiązań pomiędzy
elementami ontologii
pl
s.
Rodzaj podobieństwa
Instancyjne
Intuicyjna interpretacja
Semantyczne
Formalizm matematyczny
Skomplikowana
implementacja
Potrzebne zbiory
instancji
Skomplikowana
implementacja
Źródło: Opracowanie własne
Miary podobieństwa uwzględniają różne aspekty konstrukcji ontologii i wzajemnie się
uzupełniają. Z tego też względu badania idą w kierunku konstrukcji kompleksowych miar
podobieństwa (zob. podrozdział 4).
330
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Przegląd metod porównywania ontologii
4 Porównywanie ontologii
w
Dotychczasowe badania w dziedzinie porównywania ontologii rozpatrują różne elementy
ontologii, ale jak na razie brak kompleksowego rozwiązania tego zagadnienia.
Znaczna część konstruowanych modeli opiera się na modelu przedstawionym w pracy
[6]. Model ten składa się z trzech warstw (Rys. 3):
− warstwa danych – porównywanie wyłącznie wartości danych – dla łańcuchów
znaków wykorzystanie odległości edycyjnej, a dla liczb zwykłe porównywanie,
− ontologii – porównywanie relacji semantycznych z wykorzystaniem grafowej
reprezentacji struktury ontologii,
− kontekstu – porównywanie sposobu wykorzystania obiektów ontologii.
W każdej z tych warstw wykorzystuje się informacje o dziedzinie dla jakiej była
tworzona ontologia.
Warstwa ontologii
Warstwa danych
dzie
dzino
wa
da
.b
w
w
Warstwa kontekstu wiedza
Rys. 3. Model podobieństwa
Źródło: Opracowanie własne na podstawie [6], Fig.1
Wiedza dziedzinowa może pochodzić z innych ontologii. W pracy [18] zaprezentowano
możliwość wykorzystania Wordnetu jako wiedzy dziedzinowej do rozwiązania problemu
homonimów.
W artykule [20] zaprezentowano metodę określania podobieństwa ontologii zapisanych
w języku OWL Lite. Autorzy rozpatrywali podobieństwo takich elementów ontologii jak:
klasy, relacje i instancje. Skonstruowali dla nich miary podobieństwa (sim) będące średnią
ważoną miar podobieństwa leksykalnego (siml), strukturalnego (sims) i instancyjnego
(simex):
pl
s.
sim(e1 , e2 ) = λl siml (e1 , e2 ) + λs sims (e1 , e2 ) + λex simex (e1 , e2 )
(8)
gdzie: (e1, e2) – para klas, relacji lub instancji
Współczynniki λl, λs, λex były różnie dobierane w zależności od obiektów jakich dotyczyła miara. Podobieństwo leksykalne było obliczane z wykorzystaniem miary JaroWinkler (wzór 5) oraz wykorzystano Wordnet jako źródło synonimów. Podobieństwo
strukturalne zostało określane przy pomocy miary Jaccarda (wzór 6) na zbiorach klas, relacji oraz instancji natomiast podobieństwo instancyjne dla klas i relacji3 było liczone przy
pomocy miary Jaccarda na odpowiednich zbiorach instancji związanych z klasami i relacjami.
Podobne podejście do ustalania kompleksowej miary podobieństwa będącej funkcją
miar podobieństw dla atrybutów, ról i konceptów, bazujące na logice opisowej i metodzie
kartograficznej zostało zaprezentowane w [8].
3
W przypadku instancji nie ma sensu mówić o podobieństwie instancyjnym.
331
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
G.Paliwoda-Pękosz
Możliwości wykorzystania sieci neuronowych do znajdowania wag różnych elementów
miar porównywania ontologii przedstawiono w pracy [12]. Skonstruowana miara s jest
sumą ważoną miar porównujących nazwy klas (s1), atrybuty klas (s2) oraz relacje (s3):
3
s = ∑ wi si
(9)
i =1
w
3
gdzie: wi – wagi dla i = 1,..3, takie, że
∑w
i =1
i
=1
Podobieństwo nazw klas k1, k2 określane jest funkcją:
w
gdy n(k1 ) = n(k 2 ) lub n(k1 ), n(k 2 ) − synonimy
⎧1
⎪
s1 (k1 , k 2 ) = ⎨
ed (n(k1 ), n(k 2 ))
⎪1 − max(lenght(n(k )), lenght(n(k ))) w przeciwnym wypadku
1
2
⎩
(10)
w
gdzie: n(ki) nazwa klasy, ed – odległość edycyjna.
Podobieństwo atrybutów natomiast określane jest jako:
s2 (k1 , k 2 ) =
n
m
(11)
da
.b
gdzie: n – liczba dopasowanych atrybutów (czyli o takich samych typach lub kompatybilnych np. float i double i podobieństwie nazw (s1) powyżej pewnego progu)
m – liczba atrybutów klasy o mniejszej liczbie atrybutów.
Podczas obliczania podobieństwa relacji model uwzględnia jedynie relację super/
subclassof. Dla każdej z klas k1, k2 tworzony jest ciąg klas, które są przodkami tej klasy
(rys. 4). Następnie oblicza się podobieństwo nazw wszystkich możliwych par z obu
ciągów. Za wartość podobieństwa relacji przyjmuje się wartość maksymalną obliczonych
podobieństw.
s3 (k1 , k 2 ) = max{s1 (k1i , k 2j )
gdzie i = 1, ..., N1 , j = 1, ..., N 2 }
(12)
przy czym Ni – liczba przodków klasy i (dla 1=1,2).
pl
s.
Thing
2
3
k1
2
k1
k2
1
k2
subClassOF
1
k1
subClassOF
k2
k1
Rys. 4. Porównywanie klas z uwzględnieniem relacji super/subClassOf
Żródło: Opracowanie własne na podstawie opisu w [12]
W celu znalezienia wag we wzorze na obliczanie podobieństwa (wzór 9) skonstruowano
sieć neuronową, jednowarstową, z trzema neuronami. Zbiorem uczącym dla tej sieci był
332
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Przegląd metod porównywania ontologii
zbiór losowo wybranych konceptów z jednej ontologii, dla których znaleziono „ręcznie”
klasy równoważne w drugiej ontologii.
5 Wnioski i kierunki badań
w
Generalnie, podejścia do mapowania ontologii można podzielić na te, które wykorzystują
reprezentację ontologii w postaci grafu skierowanego, w którego wierzchołkach znajdują
się klasy, a krawędziami są relacje oraz te, które opierają się na tzw. semantyce ontologii,
czyli zapisie elementów ontologii w postaci klauzul logicznych. Z uwagi na fakt, iż
standardem W3C jest OWL opierający się na logikach opisowych, a jak wskazują wyniki
badań [3] większość tworzonych ontologii (76%) zapisywana jest właśnie w tym języku
oraz najczęściej wykorzystywanym narzędziem tworzenia ontologii jest Protege
(http://protege.stanford.edu/, w wersji 4.0 bazuje na OWL 1.1 z logiką SROIQ), wydaje się
celowe skupienie wysiłków nad metodami porównywania ontologii bazującymi na semantyce. Jest to zadanie niezmiernie złożone i jak dotąd nierozwiązane w sposób kompleksowy.
Miary podobieństwa są zazwyczaj sumą kilku miar cząstkowych. Istotnym zagadnieniem jest znajdowanie wag dla poszczególnych składników miary. Ciekawym kierunkiem
badań wydaje się być zastosowanie sieci neuronowych do określania wag poszczególnych
elementów miar.
1.
da
.b
w
w
Literatura
pl
s.
Albertoni R. & De Martino M.: Semantic Similarity of Ontology Instances Tailored on the
Application Context. ODBASE- OTM Conferences. LNCS Vol. 4275, 2006, 1020-1038.
2. Araujo R., Pinto H.S.: Towards Semantics-Based Ontology Similarity. Proceedings of the
Workshop on Ontology Matching (OM2007) at ISWC/ASWC2007, Busan, South Korea.
3. Cardoso J.: The Semantic Web Vision: Where are We? IEEE Intelligent Systems,
September/October 2007, 22-26.
4. Cohen W.W., Ravikumar P., Fienberg S.E.: A Comparison Of String Distance Metrics.
Proceedings of the IJCAI-2003 Workshop on Information Integration on the Web, 2003.
5. Davies J., Studer R., Warren P. (redaktorzy): Semantic Web technologies, Trends and research
in ontology based systems. John Wiley & Sons, 2006.
6. Ehrig, M., Haase, P., Stojanovic, N., and Hefke, M.: Similarity for Ontologies –
A Comprehensive Framework. ECIS 2005. Regensburg, Germany.
7. Euzenat J., Valtchev P.: An Integrative Proximity Measure For Ontology Alignment.
Proceedings of SWC-2003 workshop on semantic information integration, Sanibel Island (FL
US), 2003, 33–38.
8. Goczyła K., Zawadzka T.: Zależności pomiędzy ontologiami i ich wpływ na problem integracji
ontologii. w Bazy Danych: Struktury, Algorytmy, Metody. Kozielski S., Małysiak B.,
Kasprowski P., Mrozek D. (red.), WKŁ, 2006.
9. Gruber T.: Toward Principles for the Design of Ontologies Used for Knowledge Sharing. In
Formal Ontology in Conceptual Analysis and Knowledge Representation, edited by Guarino N.
and Poli R., Kluwer Academic Publishers, 1995.
10. Hu B., Kalfoglou Y., Alani H, Dupplaw D., Lewis P, Shadbolt N.: Semantic Metrics. In
Proceedings of the 15-th International Conference on Knowledge Engineering and Knowledge
Management (EKAW06), Podebrady, Czech Rep, 2006.
333
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
G.Paliwoda-Pękosz
w
12. Huang J., Dang J., Vidal J.M., Huhns M.: Ontology Matching using an Artificial Neural
Networks to learn Weighs. Proceedings of the 12-th Joint International Conference on AI,
Hyderabad, Indie, Workshop: Semantic Web for Collaborative Knowledge Acquisition, 2007.
13. Izaac A., Meij L., Schlobach S., Wang S.: An empirical Study of Instance-Based Ontology
Matching. In ISWC/ASWC 2007. Aberer K. (eds), Springer-Verlag Berlin Heidelberg 2007,
253-266.
14. Jaro M. A.: Advances in record linking methodology as applied to the 1985 census of Tampa
Florida. Journal of the American Statistical Society 84 (406), 1989, 414-420.
15. Jaro M. A.: Probabilistic linkage of large public health data file. Statistics in Medicine 14, 1995,
491-498.
16. Levenshtein V.: Binary Codes Capable of Correcting Deletions, Insertions and Reversals.
Cybernetics and Control Theory, 10(8), 1966, 707-710.
17. Maedche A., Staab S.: Measuring Similarity between Ontologies. In Proceedings of the
European Conference on Knowledge Acquisition and Management - (EKAW-2002). Madrid,
Spain, October 1-4, 251-263.
18. Reynaud Ch., Safar B.: Exploiting WordNet as Background Knowledge. The Second
International Workshop on Ontology Matching, The 6th International Semantic Web Conference
ISWC-2007 November 11, BEXCO, Busan, Korea, 2007.
19. Stumme, G., Ehrig, M., Handschuh, S., Hotho, A., Maedche, A., Motik, B., Oberle, D., Schmitz,
C., Staab, S., Stojanovic, L., Stojanovic, N., Studer, R., Sure, Y., Volz, R., Zacharias, V.: The
Karlsruhe View On Ontologies. Technical report. University of Karlsruhe, Institute AIFB, 2003.
20. Udrea O., Getoor L.: Combining Statistical And Logical Inference For Ontology Alignment,
IJCAI-07 workshop on Semantic Web for Collaborative Knowledge Acquisition, 2007.
21. Winkler W. E.: The state of record linkage and current research problems. Statistics of Income
Division, Internal Revenue Service Publication R99/04, 1999.
da
.b
w
w
pl
s.
334
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008

Podobne dokumenty