Zarzadzanie wiedza - Wykład Sieci semantyczne

Transkrypt

Zarzadzanie wiedza - Wykład Sieci semantyczne
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Zarządzanie wiedzą
Wykład
Sieci semantyczne
Joanna Kołodziejczyk
czerwiec 2010
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Ontologie
Wiedza semantyczna
Semantyczne metody reprezentacji wiedzy
Semantic Web
Struktura sieci semantycznej
Inżynieria ontologii
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Plan wykładu
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Definicja ontologii
Jest to formalna reprezentacja wiedzy przez zbiór konceptów z
zadanej dziedziny i relacji pomiędzy konceptami. Jest stosowana do
wnioskowania w dziedzinie i może być użyta do opisywania
dziedziny.
"formal, explicit specification of a shared conceptualisation"
Ontologia dostarcza wspólnego słownika, który może być użyty do
modelowania danej dziedziny, tj. typy istniejących obiektów i
konceptów z ich własnościami i relacjami.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Jak zaprezentować różnorodność świata
Czy można stworzyć ogólny model, który można rozwijać przez
opisywanie wiedzy o poszczególnych elementach modelu?
Głównym celem jest stworzenie kategorii, do których należą różne
obiekty.
Taki ogólny zarys konceptów nazywa się Ontologiami nadrzędnymi
upper ontology
¯
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Przykłady ontologii nadrzędnych
http://www.cyc.com/cycdoc/upperont-diagram.html
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Cechy ontologii nadrzędnych
Ontologia nadrzędna jest ograniczona do pojęć ogólnych, meta,
abstrakcyjnych i filozoficznych i dlatego jest na tyle ogólna, by
opisać szeroką gamę dziedzin z różnych obszarów. Nie uwzględnia
się w niej pojęć specyficznych dla dziedziny, choć pokazuje
struktury i zbiory pojęć ogólnych nad dziedzinami, w których
ontologia specyficzna można być budowana.
Cechy odróżniające ontologię nadrzędną od specyficznych dla
dziedziny:
I Przeznaczenie ogólne: w jej ramach można ująć wiedzę na
temat kilku dziedzin bez pomijania jakichkolwiek jej aspektów.
I Różne aspekty wiedzy muszą być ujednolicone, gdyż
wnioskowanie na danych zazwyczaj wymaga równoległego
działania w różnych dziedzinach. np. systemy powinny równie
dobrze funkcjonować we wszystkich jednostkach miar.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Co to jest ontologia
Ontologia jest to jawny opis (słownik) pewnej dziedziny, który
zawiera:
I
pojęcia
I
własnołci i atrybuty pojęć,
I
relacje,
I
aksjomaty
I
instancje (niekoniecznie).
Ontologia wprowadza:
I
jednolitą terminologią,
I
jednolitą interpretację (definicję) pojęć.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Plan wykładu
Ontologie
Wiedza semantyczna
Semantyczne metody reprezentacji wiedzy
Semantic Web
Inżynieria ontologii
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Pozyskiwanie wiedzy z Internetu
Wiedza w Internecie ma bardzo zróżnicowany charakter:
I
różne formaty plików
I
wielkość danych
I
różna struktura
A może uda się tą wiedzę okiełznać?... podać w precyzyjnym i
możliwym do przetwarzania formacie?
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Ramy (FRAMES)
Twórca Marvin Minsky 1975.
Według Minskiego, każdy element świata może być reprezentowany
w postaci bytu zwanego ramą. Nazwał on ramą strukturę danych
opisującą pewien obiekt, w którym umieszcza się wszystkie typowe i
oczekiwane informacje, ale również przypuszczenie o tym obiekcie.
Koncepcja Minskiego oparta jest na obserwacji człowieka w nowej
sytuacji i otoczeniu mającego jednak o dziedzinie pewne
wcześniejsze wyobrażenia. Człowiek wydobywa wówczas z pamięci
określoną ramę i konfrontuje sytuację z wiedzą zawartą w ramie.
Gdy natomiast natykamy się na nowy obiekt staramy się o nim
zapamiętać jak najwięcej informacji, co jest równoważne z
tworzeniem nowej ramy.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Wiedza "w ramach"
Ramy dają możliwość reprezentacji wiedzy deklaratywnej i
proceduralnej. Pozwalają ma wyraźne oddzielenie reguł w danej
dziedzinie od reguł niezbędnych do poprawnego działania systemu
ekspertowego.
Potrafią grupować informacje dotyczące wybranego fragmentu
wiedzy w postaci jednej ramy, co upraszcza weryfikację i
modyfikację bazy wiedzy.
Idea ram poszerzona o aspekty behawioralne stała się podstawą do
obiektowych języków programowania.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Struktura ramy
Rama jest strukturą opisującą obiekt i składa się z podstruktur:
klatek (slots). Każdy slot reprezentuje:
I
własność
I
cechę
opisywanego obiektu. Opisują zatem wiedzę wg schematu
(<obiekt><atrybut><wartość>)
Klatka dzieli się na fasety, które opisują ograniczenia dla wartości
slotów.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Przykład
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Przykład
http://kio.eti.pg.gda.pl/kmg/publications/papers/Studia_Informatica.pdf
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Przykład — opis
I
OWN: sloty własne
I
Template: sloty szablonowe
I
Metaklasa: jej sloty szablonowe stają się własnymi klas.
I
Klasa: zawiera własne sloty szablonowe (klasy dziedziczą po
sobie sloty K3 po K1)
I
Obiekt nie zawiera slotów szablonowych a jego własne sloty
pochodzą z szablonowych slotów klasy, którą reprezentuje.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Zalety i wady
I
można określać domyślne wartości dla slotów
I
można podawać ograniczenia
I
można opisać procedury na slotach
I
nadmierna ogólność
I
brak formalnej definicji
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Sieci semantyczne (semantic networks)
Opracowane prze Quillana w 1968r.
Założeniem było stworzenie modelu pamięci ludzkiej. Ten model
okazał się przydatny do reprezentacji wiedzy.
Posługując się pojęciami możemy stworzyć sieć stwierdzeń jako
pewien graf, którego węzłami są stwierdzenia a gałęziami relacje.
Węzłom i gałęziom można przypisać wagi określające stopień
przekonania o słuszności stwierdzeń.
Sieć semantyczna jest pewnego rodzaju logiką, gdzie relacje między
obiektami są przedstawione w postaci rysunku. Wnioskowanie to
poruszanie się po grafie.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Przykład
http://kio.eti.pg.gda.pl/kmg/publications/papers/Studia_Informatica.pdf
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Opis przykładu
I
relacje:
I
I
hierarchia abstrakcji (strzałka blokowa)
hierarchia własności (strzałka zwykła)
I
klasy, obiekty (pogrubione kółko)
I
wartości (kółko)
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Przykład (jakie zdarzenie opisuje?)
http://www.cse.unsw.edu.au/ billw/cs9414/notes/kr/frames/frames.html
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Logika deskrypcyjna - Description Logic
Logika opisowa jest formalizmem będącym rozstrzygalnym podzbiorem
rachunku predykatów pierwszego rzędu. Z tego też względu nadaje się do
algorytmizacji i przetwarzania komputerowego.
Reprezentacja wiedzy o świecie w formie ontologii opartych na logice
opisowej (w skrócie: ontologii DL) bazuje na następujących założeniach:
I
istnieje pewne uniwersum (zwane też dziedziną zainteresowań),
które chcemy opisać w formie ontologii
I
elementy tego uniwersum, zwane osobnikami, są wystąpieniami
pojęć
I
pojęcia są ze sobą powiązane binarnymi relacjami zwanymi rolami
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Budowa DL
TBox (terminological box): terminologia ontologii, w skład której
wchodzą:
1. zbiór konceptów,
2. zbiór ról
3. zbiór aksjomatów definiujących ograniczenia nałożone na
koncepty i role
ABox (assertional box): opis świata.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Języki opisu ontologii oparte o DL
Każdy język z licznej rodziny języków logiki opisowej zawiera pewne
podstawowe elementy składowe:
1. koncepty atomowe, w tym koncept uniwersalny > (Top),
reprezentujący uniwersum, oraz koncept pusty ⊥ (Bottom),
reprezentujący koncept, który nie może mieć żadnych
wystąpień;
2. role atomowe;
3. konstruktory służące do tworzenia złożonych konceptów i ról.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Intuicyjna semantyka
Pojęcia reprezentują klasy, czyli zbiory obiektów.
Role reprezentują relacje między parami obiektów.
Pojęcia atomowe są nazwami elementarnych (niedefiniowanych)
pojęć, a konstrukcje reprezentują obiekty złożone.
Dzięki temu można użyć kilku własności (tzn. pojęć nadrzędnych
lub ograniczeń atrybutów) równocześnie w definicji pojęcia.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Logika (język) ALC
Konstruktor
¬C
C uD
C tD
∃R.C
∀R.C
Znaczenie
negacja pojęcia
część wspólna pojęć
suma pojęć
Kwantyfikacja egzystencjalna: zbiór takich osobników, które są powiązane przynajmniej jeden raz
rolą R z osobnikiem należącym do konceptu C
Kwantyfikacja ogólna: zbiór takich osobników, których wszystkie istniejące powiązania rolą R dotyczą osobników należących do konceptu C (obejmuje także takie osobniki które nie są powiązane
rolą R z żadnymi osobnikami)
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Przykład
Ontologia zawiera pojęcia: Osoba, Mężczyzna, Kobieta i Rodzic
oraz rolą maDziecko.
Tbox
Mężczyzna v Osoba
Kobieta v Osoba
Kobieta u Mężczyzna ≡ ⊥
Rodzic ≡ Osoba u∃maDziecko.Osoba
Ojciec ≡ Mężczyzna u Rodzic
Matka ≡ Kobieta u Rodzic
Joanna Kołodziejczyk
ABox
Kobieta (Anna)
Kobieta (Joanna)
Mężczyzna (Karol)
maDziecko (Anna, Joanna)
maDziecko (Anna, Karol)
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Semantyczne metody reprezentacji wiedzy
Inne zdania
Rozszerzamy ontologię o rolą maSyna, wówczas prawdziwy jest
aksjomat:
maSynavmaDziecko
syn zawsze jest Mężczyzną
∃maSyna.¬Mężczyzna ≡ ⊥.
tylko Rodzice mogą mieć synów
∃maSyna.> v Rodzic
wprowadzamy asercję: maSyna(Karol, Jan)
i pytamy: types(Jan) (czyli podaj wszystkie pojęcia z terminologii z wystąpieniem Jan)
odp: Mężczyzna, Osoba
a następnie: types(Karol)
odp: Rodzic, Mężczyzna, Osoba
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Struktura sieci semantycznej
Plan wykładu
Ontologie
Wiedza semantyczna
Semantic Web
Struktura sieci semantycznej
Inżynieria ontologii
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Struktura sieci semantycznej
Czym jest sieć semantyczna?
Sieć Semantyczna jest to rozszerzenie istniejącej sieci WWW o
mechanizmy semantyczne, tak aby informacje dostępne w tej sieci
były dobrze zdefiniowane i umożliwiały lepszą współpracę
komputerom i ludziom.
Idea budowy Sieci Semantycznej została podjęta jako odpowiedź na
gwałtowne rozrastanie się Internetu, a w szczególności tych
zasobów informacyjnych, które nazywamy Word Wide Web
(WWW).
Wiedza w sieci jest nieuporządkowana, porozrzucana po różnych
zakątkach i nie jest skatalogowana.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Struktura sieci semantycznej
Warstwy sieci semantycznej
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Struktura sieci semantycznej
Warstwy w podejściu semantycznym - opis
Element
URI
UNICODE
XML
RDF
Znaczenie
adresowanie zasobów sieci (pod jednym URI wiele zasobów)
binarne kodowanie znaków dowolnego alfabetu
definiowanie typów dokumentów; możliwość definiowania przestrzeni nazw (name spaces NS), co pozwala
na unikanie konfliktów w sytuacji, gdy w różnych miejscach Sieci pod tymi samymi nazwami rozumie się różne
pojęcia. Pozwala wyrażać treść dokumentów, strukturalizowaną w formy drzewiaste.
(Resource Description Framework), wyraża proste ontologie w postaci trójek RDF <obiekt, właściwość, wartość>.
<rdf:resource rdf:about="http://pg#JK"pg:nazwisko=”Kowalski” >
<pg:stronaDomowa rdf:resource="http://www.pg/page.html"/>
</rdf:resource>
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Element
RDFS
OWL
RIF
SPARQL
Logic and Proof
Trust
Struktura sieci semantycznej
Znaczenie
RDF Schemata opisuje cechy i klasy źródeł opartych na RDF
język ontologii oparty na trójkach RDF, ALC i kilku
rozwinięciach
(Rule Interchange Format), określa reguły jak uzyskiwać nowe informacje z ontologii, jak je łączyć i
opisuje inne formy manipulacji obiektami.
protokół i język zapytań dla sieci semantycznych
ontologie rozszerzane są o reguły dedukcyjne i proceduralne, zapisane na przykład w języku RuleML
lub podobnym
stosowanie podpisu cyfrowego i związanej z nim
odpowiedniej infrastruktury bezpieczeństwa
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Struktura sieci semantycznej
Agenty w Sieci Semnatycznej
http://infolab.stanford.edu/pub/gio/2000/FoodChain.htm
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Plan wykładu
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Poprawność ontologii
Ontologia jest poprawna, jeśli poprawnie realizuje stawiane jej
wymagania.
Model formalny świata zapisany w ontologii musi odpowiadać
rzeczywistej dziedzinie, dla której dana ontologia została stworzona.
Metody tworzenia potrzebnych ontologi:
I
integrowanie ontologii (ontology integration) poprzez tworzenie
nowej ontologii z wykorzystaniem ontologii już istniejących,
I
łączenie ontologii (ontology merging) w jedną ontologię
ujednolicającą wszystkie łączone ontologie,
I
budowanie ontologii (ontology building) na nowo.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Integrowanie i łączenie ontologii
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Integrowanie ontologii
Proces integrowania ontologii polega na tworzeniu nowej ontologii z
ontologii istniejących (ontologii integrowanych) w taki sposób, że:
I
ontologie integrowane są dostosowywane do konkretnych
potrzeb, a następnie
I
ontologie te są wzbogacane
Specjalizacja ontologii: terminy w ontologii są zbyt ogólne np.
ProduktyZbożowe, a potrzebne jest pojecie Pieczywo.
Wzbogacenie ontologii: terminy w ontologii są zbyt szczególne np.
Pieczywo i dodaje się Produkty Zbożowe.
Mogą być też definiowane dodatkowe role, atrybuty i pojęcia.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
łączenie ontologii
łączenie ontologii jest w rzeczywistości szczególnym przypadkiem
integrowania ontologii.
łączone ontologie nie są dostosowywane do konkretnych potrzeb,
ontologia wynikowa nie definiuje żadnych nowych terminów.
W rzeczywistości łączenie ontologii jest procesem znajdowania
wspólnych terminów pomiędzy różnymi ontologiami i wywiedzenie z
nich nowej ontologii wynikowej, która umożliwia współpracę
systemów komputerowych opartych na ontologiach łączonych.
Joanna Kołodziejczyk
Zarządzanie wiedzą
Ontologie
Wiedza semantyczna
Semantic Web
Inżynieria ontologii
Tworzenie ontologii
Po zdefiniowaniu celu budowania nowej ontologii i analizie
istniejących ontologii należy zidentyfikować pojęcia, relacje
pomiędzy pojęciami, określić atrybuty i role oraz ostatecznie zapisać
ontologię w formalnym języku, np. OWL.
Formalny opis modelowanego świata zazwyczaj powstaje z
półformalnego opisu rzeczywistości. Na podstawie opisu
półformalnego inżynierowie wiedzy formułują taksonomię
konceptów.
Taka taksonomia wzbogacana jest o dodatkowe zależności między
pojęciami, inne niż relacja zawierania, oraz odpowiednie role i
atrybuty, będące binarnymi relacjami między pojęciami oraz
pomiędzy pojęciami a dziedzinami konkretnymi.
Joanna Kołodziejczyk
Zarządzanie wiedzą