Zarzadzanie wiedza - Wykład Sieci semantyczne
Transkrypt
Zarzadzanie wiedza - Wykład Sieci semantyczne
Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Zarządzanie wiedzą Wykład Sieci semantyczne Joanna Kołodziejczyk czerwiec 2010 Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Ontologie Wiedza semantyczna Semantyczne metody reprezentacji wiedzy Semantic Web Struktura sieci semantycznej Inżynieria ontologii Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Plan wykładu Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Definicja ontologii Jest to formalna reprezentacja wiedzy przez zbiór konceptów z zadanej dziedziny i relacji pomiędzy konceptami. Jest stosowana do wnioskowania w dziedzinie i może być użyta do opisywania dziedziny. "formal, explicit specification of a shared conceptualisation" Ontologia dostarcza wspólnego słownika, który może być użyty do modelowania danej dziedziny, tj. typy istniejących obiektów i konceptów z ich własnościami i relacjami. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Jak zaprezentować różnorodność świata Czy można stworzyć ogólny model, który można rozwijać przez opisywanie wiedzy o poszczególnych elementach modelu? Głównym celem jest stworzenie kategorii, do których należą różne obiekty. Taki ogólny zarys konceptów nazywa się Ontologiami nadrzędnymi upper ontology ¯ Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Przykłady ontologii nadrzędnych http://www.cyc.com/cycdoc/upperont-diagram.html Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Cechy ontologii nadrzędnych Ontologia nadrzędna jest ograniczona do pojęć ogólnych, meta, abstrakcyjnych i filozoficznych i dlatego jest na tyle ogólna, by opisać szeroką gamę dziedzin z różnych obszarów. Nie uwzględnia się w niej pojęć specyficznych dla dziedziny, choć pokazuje struktury i zbiory pojęć ogólnych nad dziedzinami, w których ontologia specyficzna można być budowana. Cechy odróżniające ontologię nadrzędną od specyficznych dla dziedziny: I Przeznaczenie ogólne: w jej ramach można ująć wiedzę na temat kilku dziedzin bez pomijania jakichkolwiek jej aspektów. I Różne aspekty wiedzy muszą być ujednolicone, gdyż wnioskowanie na danych zazwyczaj wymaga równoległego działania w różnych dziedzinach. np. systemy powinny równie dobrze funkcjonować we wszystkich jednostkach miar. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Co to jest ontologia Ontologia jest to jawny opis (słownik) pewnej dziedziny, który zawiera: I pojęcia I własnołci i atrybuty pojęć, I relacje, I aksjomaty I instancje (niekoniecznie). Ontologia wprowadza: I jednolitą terminologią, I jednolitą interpretację (definicję) pojęć. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Plan wykładu Ontologie Wiedza semantyczna Semantyczne metody reprezentacji wiedzy Semantic Web Inżynieria ontologii Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Pozyskiwanie wiedzy z Internetu Wiedza w Internecie ma bardzo zróżnicowany charakter: I różne formaty plików I wielkość danych I różna struktura A może uda się tą wiedzę okiełznać?... podać w precyzyjnym i możliwym do przetwarzania formacie? Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Ramy (FRAMES) Twórca Marvin Minsky 1975. Według Minskiego, każdy element świata może być reprezentowany w postaci bytu zwanego ramą. Nazwał on ramą strukturę danych opisującą pewien obiekt, w którym umieszcza się wszystkie typowe i oczekiwane informacje, ale również przypuszczenie o tym obiekcie. Koncepcja Minskiego oparta jest na obserwacji człowieka w nowej sytuacji i otoczeniu mającego jednak o dziedzinie pewne wcześniejsze wyobrażenia. Człowiek wydobywa wówczas z pamięci określoną ramę i konfrontuje sytuację z wiedzą zawartą w ramie. Gdy natomiast natykamy się na nowy obiekt staramy się o nim zapamiętać jak najwięcej informacji, co jest równoważne z tworzeniem nowej ramy. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Wiedza "w ramach" Ramy dają możliwość reprezentacji wiedzy deklaratywnej i proceduralnej. Pozwalają ma wyraźne oddzielenie reguł w danej dziedzinie od reguł niezbędnych do poprawnego działania systemu ekspertowego. Potrafią grupować informacje dotyczące wybranego fragmentu wiedzy w postaci jednej ramy, co upraszcza weryfikację i modyfikację bazy wiedzy. Idea ram poszerzona o aspekty behawioralne stała się podstawą do obiektowych języków programowania. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Struktura ramy Rama jest strukturą opisującą obiekt i składa się z podstruktur: klatek (slots). Każdy slot reprezentuje: I własność I cechę opisywanego obiektu. Opisują zatem wiedzę wg schematu (<obiekt><atrybut><wartość>) Klatka dzieli się na fasety, które opisują ograniczenia dla wartości slotów. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Przykład Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Przykład http://kio.eti.pg.gda.pl/kmg/publications/papers/Studia_Informatica.pdf Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Przykład — opis I OWN: sloty własne I Template: sloty szablonowe I Metaklasa: jej sloty szablonowe stają się własnymi klas. I Klasa: zawiera własne sloty szablonowe (klasy dziedziczą po sobie sloty K3 po K1) I Obiekt nie zawiera slotów szablonowych a jego własne sloty pochodzą z szablonowych slotów klasy, którą reprezentuje. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Zalety i wady I można określać domyślne wartości dla slotów I można podawać ograniczenia I można opisać procedury na slotach I nadmierna ogólność I brak formalnej definicji Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Sieci semantyczne (semantic networks) Opracowane prze Quillana w 1968r. Założeniem było stworzenie modelu pamięci ludzkiej. Ten model okazał się przydatny do reprezentacji wiedzy. Posługując się pojęciami możemy stworzyć sieć stwierdzeń jako pewien graf, którego węzłami są stwierdzenia a gałęziami relacje. Węzłom i gałęziom można przypisać wagi określające stopień przekonania o słuszności stwierdzeń. Sieć semantyczna jest pewnego rodzaju logiką, gdzie relacje między obiektami są przedstawione w postaci rysunku. Wnioskowanie to poruszanie się po grafie. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Przykład http://kio.eti.pg.gda.pl/kmg/publications/papers/Studia_Informatica.pdf Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Opis przykładu I relacje: I I hierarchia abstrakcji (strzałka blokowa) hierarchia własności (strzałka zwykła) I klasy, obiekty (pogrubione kółko) I wartości (kółko) Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Przykład (jakie zdarzenie opisuje?) http://www.cse.unsw.edu.au/ billw/cs9414/notes/kr/frames/frames.html Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Logika deskrypcyjna - Description Logic Logika opisowa jest formalizmem będącym rozstrzygalnym podzbiorem rachunku predykatów pierwszego rzędu. Z tego też względu nadaje się do algorytmizacji i przetwarzania komputerowego. Reprezentacja wiedzy o świecie w formie ontologii opartych na logice opisowej (w skrócie: ontologii DL) bazuje na następujących założeniach: I istnieje pewne uniwersum (zwane też dziedziną zainteresowań), które chcemy opisać w formie ontologii I elementy tego uniwersum, zwane osobnikami, są wystąpieniami pojęć I pojęcia są ze sobą powiązane binarnymi relacjami zwanymi rolami Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Budowa DL TBox (terminological box): terminologia ontologii, w skład której wchodzą: 1. zbiór konceptów, 2. zbiór ról 3. zbiór aksjomatów definiujących ograniczenia nałożone na koncepty i role ABox (assertional box): opis świata. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Języki opisu ontologii oparte o DL Każdy język z licznej rodziny języków logiki opisowej zawiera pewne podstawowe elementy składowe: 1. koncepty atomowe, w tym koncept uniwersalny > (Top), reprezentujący uniwersum, oraz koncept pusty ⊥ (Bottom), reprezentujący koncept, który nie może mieć żadnych wystąpień; 2. role atomowe; 3. konstruktory służące do tworzenia złożonych konceptów i ról. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Intuicyjna semantyka Pojęcia reprezentują klasy, czyli zbiory obiektów. Role reprezentują relacje między parami obiektów. Pojęcia atomowe są nazwami elementarnych (niedefiniowanych) pojęć, a konstrukcje reprezentują obiekty złożone. Dzięki temu można użyć kilku własności (tzn. pojęć nadrzędnych lub ograniczeń atrybutów) równocześnie w definicji pojęcia. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Logika (język) ALC Konstruktor ¬C C uD C tD ∃R.C ∀R.C Znaczenie negacja pojęcia część wspólna pojęć suma pojęć Kwantyfikacja egzystencjalna: zbiór takich osobników, które są powiązane przynajmniej jeden raz rolą R z osobnikiem należącym do konceptu C Kwantyfikacja ogólna: zbiór takich osobników, których wszystkie istniejące powiązania rolą R dotyczą osobników należących do konceptu C (obejmuje także takie osobniki które nie są powiązane rolą R z żadnymi osobnikami) Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Przykład Ontologia zawiera pojęcia: Osoba, Mężczyzna, Kobieta i Rodzic oraz rolą maDziecko. Tbox Mężczyzna v Osoba Kobieta v Osoba Kobieta u Mężczyzna ≡ ⊥ Rodzic ≡ Osoba u∃maDziecko.Osoba Ojciec ≡ Mężczyzna u Rodzic Matka ≡ Kobieta u Rodzic Joanna Kołodziejczyk ABox Kobieta (Anna) Kobieta (Joanna) Mężczyzna (Karol) maDziecko (Anna, Joanna) maDziecko (Anna, Karol) Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Semantyczne metody reprezentacji wiedzy Inne zdania Rozszerzamy ontologię o rolą maSyna, wówczas prawdziwy jest aksjomat: maSynavmaDziecko syn zawsze jest Mężczyzną ∃maSyna.¬Mężczyzna ≡ ⊥. tylko Rodzice mogą mieć synów ∃maSyna.> v Rodzic wprowadzamy asercję: maSyna(Karol, Jan) i pytamy: types(Jan) (czyli podaj wszystkie pojęcia z terminologii z wystąpieniem Jan) odp: Mężczyzna, Osoba a następnie: types(Karol) odp: Rodzic, Mężczyzna, Osoba Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Struktura sieci semantycznej Plan wykładu Ontologie Wiedza semantyczna Semantic Web Struktura sieci semantycznej Inżynieria ontologii Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Struktura sieci semantycznej Czym jest sieć semantyczna? Sieć Semantyczna jest to rozszerzenie istniejącej sieci WWW o mechanizmy semantyczne, tak aby informacje dostępne w tej sieci były dobrze zdefiniowane i umożliwiały lepszą współpracę komputerom i ludziom. Idea budowy Sieci Semantycznej została podjęta jako odpowiedź na gwałtowne rozrastanie się Internetu, a w szczególności tych zasobów informacyjnych, które nazywamy Word Wide Web (WWW). Wiedza w sieci jest nieuporządkowana, porozrzucana po różnych zakątkach i nie jest skatalogowana. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Struktura sieci semantycznej Warstwy sieci semantycznej Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Struktura sieci semantycznej Warstwy w podejściu semantycznym - opis Element URI UNICODE XML RDF Znaczenie adresowanie zasobów sieci (pod jednym URI wiele zasobów) binarne kodowanie znaków dowolnego alfabetu definiowanie typów dokumentów; możliwość definiowania przestrzeni nazw (name spaces NS), co pozwala na unikanie konfliktów w sytuacji, gdy w różnych miejscach Sieci pod tymi samymi nazwami rozumie się różne pojęcia. Pozwala wyrażać treść dokumentów, strukturalizowaną w formy drzewiaste. (Resource Description Framework), wyraża proste ontologie w postaci trójek RDF <obiekt, właściwość, wartość>. <rdf:resource rdf:about="http://pg#JK"pg:nazwisko=”Kowalski” > <pg:stronaDomowa rdf:resource="http://www.pg/page.html"/> </rdf:resource> Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Element RDFS OWL RIF SPARQL Logic and Proof Trust Struktura sieci semantycznej Znaczenie RDF Schemata opisuje cechy i klasy źródeł opartych na RDF język ontologii oparty na trójkach RDF, ALC i kilku rozwinięciach (Rule Interchange Format), określa reguły jak uzyskiwać nowe informacje z ontologii, jak je łączyć i opisuje inne formy manipulacji obiektami. protokół i język zapytań dla sieci semantycznych ontologie rozszerzane są o reguły dedukcyjne i proceduralne, zapisane na przykład w języku RuleML lub podobnym stosowanie podpisu cyfrowego i związanej z nim odpowiedniej infrastruktury bezpieczeństwa Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Struktura sieci semantycznej Agenty w Sieci Semnatycznej http://infolab.stanford.edu/pub/gio/2000/FoodChain.htm Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Plan wykładu Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Poprawność ontologii Ontologia jest poprawna, jeśli poprawnie realizuje stawiane jej wymagania. Model formalny świata zapisany w ontologii musi odpowiadać rzeczywistej dziedzinie, dla której dana ontologia została stworzona. Metody tworzenia potrzebnych ontologi: I integrowanie ontologii (ontology integration) poprzez tworzenie nowej ontologii z wykorzystaniem ontologii już istniejących, I łączenie ontologii (ontology merging) w jedną ontologię ujednolicającą wszystkie łączone ontologie, I budowanie ontologii (ontology building) na nowo. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Integrowanie i łączenie ontologii Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Integrowanie ontologii Proces integrowania ontologii polega na tworzeniu nowej ontologii z ontologii istniejących (ontologii integrowanych) w taki sposób, że: I ontologie integrowane są dostosowywane do konkretnych potrzeb, a następnie I ontologie te są wzbogacane Specjalizacja ontologii: terminy w ontologii są zbyt ogólne np. ProduktyZbożowe, a potrzebne jest pojecie Pieczywo. Wzbogacenie ontologii: terminy w ontologii są zbyt szczególne np. Pieczywo i dodaje się Produkty Zbożowe. Mogą być też definiowane dodatkowe role, atrybuty i pojęcia. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii łączenie ontologii łączenie ontologii jest w rzeczywistości szczególnym przypadkiem integrowania ontologii. łączone ontologie nie są dostosowywane do konkretnych potrzeb, ontologia wynikowa nie definiuje żadnych nowych terminów. W rzeczywistości łączenie ontologii jest procesem znajdowania wspólnych terminów pomiędzy różnymi ontologiami i wywiedzenie z nich nowej ontologii wynikowej, która umożliwia współpracę systemów komputerowych opartych na ontologiach łączonych. Joanna Kołodziejczyk Zarządzanie wiedzą Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii Tworzenie ontologii Po zdefiniowaniu celu budowania nowej ontologii i analizie istniejących ontologii należy zidentyfikować pojęcia, relacje pomiędzy pojęciami, określić atrybuty i role oraz ostatecznie zapisać ontologię w formalnym języku, np. OWL. Formalny opis modelowanego świata zazwyczaj powstaje z półformalnego opisu rzeczywistości. Na podstawie opisu półformalnego inżynierowie wiedzy formułują taksonomię konceptów. Taka taksonomia wzbogacana jest o dodatkowe zależności między pojęciami, inne niż relacja zawierania, oraz odpowiednie role i atrybuty, będące binarnymi relacjami między pojęciami oraz pomiędzy pojęciami a dziedzinami konkretnymi. Joanna Kołodziejczyk Zarządzanie wiedzą