Zarządzanie Zunifikowanymi Metadanymi w Rozproszonych

Transkrypt

Akademia Górniczo-Hutnicza im. Stanisława Staszica w
Krakowie
Wydział Informatyki, Elektroniki i Telekomunikacji
Katedra Informatyki
Autoreferat rozprawy doktorskiej
Zarządzanie Zunifikowanymi
Metadanymi w Rozproszonych
Infrastrukturach Komputerowych
Dużej Skali
Autor:
mgr inż. Bartosz Kryza
Promotor:
Prof. dr hab. inż. Jacek Kitowski
Promotor pomocniczy:
dr inż. Renata Słota
Kraków, Poland
27 czerwca 2014
1
Wprowadzenie
Pierwsza dekada XXI wieku przyniosła znaczące uzależnienie praktycznie każdego aspektu
ludzkiego życia od dostępności i efektywności systemów informatycznych. Niestety ilość
oraz stopień różnorodności zasobów dostępnych w sieci powoduje coraz większe problemy
z dostępem do informacji i zasobów odpowiadających konkretnemu żądaniu. Większość
narzędzi do wyszukiwania informacji opiera się na porównywaniu ciągów znaków oraz
nie pozwala na uzyskanie zagregowanej odpowiedzi. Jedną z głównych przyczyn takiego
stanu rzeczy jest fakt, że większość danych i zasobów dostępnych w sieci nie posiada
odpowiednich adnotacji, czyli metadanych.
Według raportu IDC [9], już w roku 2007 ilość danych jaka została wytworzona przekroczyła światowe zasoby pamięci trwałej, która wówczas była szacowana na 281 eksabajtów.
W [13] pokazano, że w roku 2007 wszystkie komputery na świecie były w stanie wykonać
6.4 Tera MIPS czyli ok. 1018 operacji na sekundę, przetransmitowały 2.1 zeta bitów danych (1021 ) oraz przechowywały 295 eksabajtów danych. Pod koniec 2013 roku na świecie
istniało już ponad 30 maszyn o wydajności powyżej jednego peta FLOP, z czego najszybsza Tianhe-2 ma ponad 33 petaFLOP’y. Obecnie naukowcy planują już kolejne generacje
superkomputerów o wydajności eksaFLOP [7].
Zdaniem wielu ekspertów, taki przyrost ilości informacji i mocy obliczeniowej wprowadza konieczność zmiany paradygmatu w jaki prowadzi się badania naukowe wykorzystujące
technologie informatyczne. Przede wszystkim konieczne jest zapewnienie systemom informatycznych większego stopnia autonomii, poprzez realizację następujących wymagań:
• wszystkie elementy związane z komunikacją między zasobami i usługami takie jak
identyfikatory, wiadomości, pliki, urządzenia oraz ich atrybuty powinny być oparte
o ustrukturyzowane typy danych (w przeciwieństwie do zwykłych ciągów znaków),
które można łatwo analizować z poziomu maszynowego,
• implementacja usług musi zapewniać łatwe wyszukiwanie i dopasowywanie zasobów
do siebie, pozwalając na automatyczne odnajdywanie pojedynczych usług lub ciągów
usług będących w stanie zrealizować konkretne żądanie,
• same infrastruktury informatyczne powinny być dynamiczne i adaptować się do aktualnego stanu środowiska.
2
Teza i cele rozprawy
Celem tej pracy jest opracowanie nowego podejścia do zarządzania metadanymi w rozproszonych infrastrukturach komputerowych dużej skali z wykorzystaniem technologii Sieci
Semantycznej. Jednym z założeń tej pracy jest rozumienie pojęcia metadanych w takich
1
infrastrukturach w szerszym kontekście, mianowicie metadanych rozumianych jako dodatkowe informacje nie tylko o danych, ale również zasobach, usługach, procesach czy użytkownikach. Aby zapewnić efektywne zastosowanie tak rozumianych metadanych konieczne
są odpowiednie formalizmy do ich reprezentowania oraz platforma zarządzająca nimi, czyli
przechowująca metadane w sposób skalowalny, bezpieczny oraz umożliwiający kontrolowaną ewolucję tak gromadzonej wiedzy. Jest to szczególnie istotne w infrastrukturach
informatycznych dużej skali składających się z heterogenicznych platform obsługujących
różne aspekty infrastruktury.
Obecne rozwijane technologie informatyczne mają potencjał aby znacząco poprawić
sposób w jaki infrastruktury informatyczne dużej skali są zorganizowane, zarządzane oraz
monitorowane. Środowiska typu Grid i Cloud, wraz z technologiami wirtualizacji pozwalają na wprowadzenie abstrakcji sprzętowej infrastruktury w aspektach obliczeniowych,
sieciowych oraz przechowywania danych. Paradygmat usług sieciowych (SOA) pozwala
na wirtualizację dostępu do oprogramowania, umożliwiając tworzenie złożonych usług i
aplikacji z dostępnych usług sieciowych. Technologie Sieci Semantycznej umożliwiają abstrakcję metadanych do postaci sformalizowanej oraz wnioskowania po ich zawartości.
Teza niniejszej rozprawy jest zatem następująca:
Unification of metadata in large distributed computing infrastructures using Semantic Web technologies can significantly improve resource discovery and management aspects of Grid and Cloud environments, and in particular enable dynamic establishment of Virtual
Organizations over heterogeneous IT platforms.
oraz w tłumaczeniu na język polski:
Unifikacja metadanych w rozproszonych infrastrukturach informatycznych dużej skali przy wykorzystaniu technologii Sieci Semantycznej może znacząco poprawić aspekty wyszukiwania zasobów oraz
zarządzania infrastrukturą środowisk typu Grid i Cloud, a w szczególności umożliwić dynamiczne tworzenie Organizacji Wirtualnych
w heterogenicznych środowiskach IT.
Teza jest dowiedziona poprzez zaproponowanie oraz stworzenie nowego podejścia do
unifikacji metadanych przy użyciu technologii Sieci Semantycznej, co znacząco usprawnia
wyszukiwanie zasobów takich jak dane, usługi oraz dopasowywanie usług. W celu pokazania jak zarządzać tego rodzaju metadanymi stworzona została rozproszona baza wiedzy
posiadająca takie cechy jak model rozproszenia metadanych, wsparcie dla ewolucji wiedzy
oraz umożliwienie migracji metadanych z klasycznych systemów przechowywania danych.
Na końcu, pokazano jak przy wykorzystaniu takiego podejścia do metadanych można tworzyć dynamicznie Organizacje Wirtualne oparte o wynegocjowany kontrakt.
2
2.1
Osiągnięcia rozprawy
W skrócie, główne osiągnięcia tej rozprawy to:
• Specyfikacja, opracowanie oraz ewaluacja modułowej architektury zunifikowanych
metadanych, wspierającej zarządzanie metadanymi w infrastrukturach informatycznych dużej skali, pozwalającą adresować takie aspekty jak zarządzanie danymi, wyszukiwanie usług oraz kompozycja aplikacji typu workflow,
• Projekt i implementacja rozproszonej semantycznej bazy wiedzy działającej w paradygmacie SOA, wspierającej wnioskowanie oraz ewolucję wiedzy,
• Projekt i implementacja metody do konwertowania danych przechowywanych w standardzie MOF (Managed Object Format) do standardu OWL (Web Ontology Language) na przykładzie standardu CIM (Common Information Model),
• Projekt narzędzia do pół-automatycznego tłumaczenia metadanych przechowywanych w bazach relacyjnych, katalogach LDAP oraz plikach XML do postaci semantycznej,
• Projekt i implementacja platformy do budowania i zarządzania Organizacjami Wirtualnymi wspierającej takie aspekty jak wyszukiwanie partnerów, definicja celu, negocjacja kontraktu, zarządzanie użytkownikami, zarządzanie danymi, dynamiczne
utworzenie Organizacji Wirtualnej na podstawie kontraktu, w tym konfiguracji warstwy bezpieczeństwa i monitorowania,
• Projekt i implementacja środowiska do rozproszonej negocjacji kontraktu dla potrzeb Organizacji Wirtualnych w postaci formalnej, specyfikacja procesu negocjacji,
ontologii kontraktu oraz narzędzi umożliwiających prowadzenie negocjacji w sposób
rozproszony.
3
Stan wiedzy
Zarządzanie zunifikowanymi metadanymi w infrastrukturach komputerowych dużej skali,
dyskutowane w niniejszej pracy, jest związane z tematyką zarówno dotyczącą infrastruktur
komputerowych jak i technologii semantycznych.
Główne trendy w dziedzinie systemów komputerowych dużej skali to środowiska Grid
[15] oraz Cloud [18].
Systemy typu Grid są reprezentowane przez takie platformy jak Globus [8], gLite [16],
UNICORE [23] czy QosCosGrid [4]. Istotnym aspektem tych środowisk jest pojęcie Organizacji Wirtualnej, pozwalające na dzielenie użytkowników w grupy zainteresowań oraz
przydzielanie zasobów obliczeniowych oraz przechowywania danych według tych grup.
3
Każde środowisko typu Grid posiada własne rozwiązanie pozwalające na zarządzanie tymi
grupami takie jak VOMS [1] czy UVOS [3].
Kolejnym krokiem w rozwoju systemów rozproszonych dużej skali było pojawienie się
środowisk typu Cloud [22], umożliwiających budowanie wirtualnych infrastruktur obliczeniowych oraz przechowywania danych w oparciu o zasoby sprzętowe dostarczane przez
zewnętrznych dostawców. Zasoby typu Cloud mogą być udostępniane w oparciu o różne
modele, takie jak:
• Infrastruktura jako usługa (IaaS - ang. Infrastructure as a Service)
• Platforma jako usługa (PaaS - ang. Platform as a Service)
• Oprogramowanie jako usługa (SaaS - ang. Software as a Service)
• Dane jako usługa (DaaS - ang. Data as a Service)
• Komunikacja jako usługa (CaaS - ang. Communication as a Service)
gdzie w zależności od wybranego modelu usługobiorca może operować na poziomie
systemu operacyjnego maszyn wirtualnych (IaaS) lub korzystać bezpośrednio z oprogramowania wysokiego poziomu uruchomionego na zdalnych maszynach (SaaS).
Ze względu na brak jednoznacznych standardów wśród dostawców platform typu Cloud, użytkownicy stoją przed poważnych problemem uzależnienia się od pierwotnie wybranego dostawcy i utrudnionym korzystaniem z wielu dostawców jednocześnie w ramach
jednej aplikacji (ang. vendor lock-in).
Jednym z głównych problemów zarówno dotyczących środowisk Grid oraz Cloud, jest
problem heterogeniczności opisów wszelkiego rodzaju zasobów, takich jak użytkownicy,
sprzęt, dane, usługi czy procesy. Heterogeniczność ma charakter zarówno syntaktyczny,
czyli różne aspekty systemów są opisane przy użyciu różnych standardów (np. XML,
LDAP, JSON) oraz charakter semantyczny, mianowicie są opisane przy użyciu niekompatybilnych konceptualizacji. Powoduje to konieczność tłumaczenia metadanych pomiędzy
tymi standardami w przypadku gdy konieczne jest np. uzyskanie odpowiedzi na pytanie dotyczące zasobów z różnych kategorii. W szczególności powoduje to, że tworzenie
dynamicznych Organizacji Wirtualnych opartych o formalny kontrakt, mogący zawierać
stwierdzenia dotyczące różnych zasobów jest bardzo utrudnione.
W zakresie badań nad metadanymi istnieje wiele definicji oraz sposobów ich interpretacji. Jedna z bardziej uniwersalnych [11] proponuje traktować metadane jako:
. . . dane, które opisują strukturę i procesy organizacji używających informacji,
oraz które opisują systemy używane do zarządzania informacją.
Definicja ta przyjmuje, że metadane nie muszą być tylko ”danymi o danych”, ale można je traktować również szerzej, jako dane o wszelakich zasobach będących istotną częścią
4
działania danej organizacji. Obecnie istnieje kilka standardów reprezentowania metadanych, wykorzystywanych w profesjonalnych systemach katalogowania informacji, takie jak:
Text Encoding Initiative [24], Metadata Encoding and Transmission Standard [6], Machine
Readable Cataloguing [5] czy CERIF [14]. W dziedzinie zarządzania zasobami informatycznymi również istnieją już standardy pozwalające na opisywanie całych infrastruktur
jak i wybranych aspektów, takie jak Simple Knowledge Organization System (SKOS) [19],
GLUE Schema [2] czy Common Information Model (CIM) [20]. Jednakże najczęściej w
ramach jednej infrastruktury komputerowej wykorzystywanych jest wiele standardów jednocześnie do opisania różnych aspektów. Powoduje to utrudnione wyszukiwanie zasobów z
różnych systemów (np. planowania wykonania zadania w środowisku Grid wymaga informacji o zasobach sprzętowych, ich aktualnym obciążeniu, praw dostępu do zasobów oraz
lokalizacji danych wejściowych i wyjściowych).
Z drugiej strony, istnieje obecnie wiele rozwiązań pozwalających na zaadresowanie
heterogeniczności metadanych poprzez wykorzystanie technologii związanych z Siecią Semantyczną, takich jak RDF [21], OWL [12], OWL 2 [10], WSMO [17].
4
Unifikacja metadanych w rozproszonych infrastrukturach
komputerowych z zastosowaniem semantyki
Złożoność istniejących środowisk komputerowych doprowadziła do współistnienia wielu
niekompatybilnych standardów reprezentacji metadanych opisujących te środowiska. Wiodącą ideą tej pracy jest próba usprawnienia wielu scenariuszy użycia poprzez umożliwienie
unifikacji metadanych przy użyciu technologi Sieci Semantycznej.
Przykładem takiej heterogeniczności jest infrastruktura Grid oparta o środowisko Globus, co przedstawiono na Rysunku 1:
Rysunek 1: Przykład współistnienia wielu standardów metadanych w ramach jednego
środowiska Grid.
W celu zaadresowania tego problemu w ramach tej pracy została opracowana specjalna
5
struktura ontologii umożliwiająca budowanie opisów semantycznych dotyczących różnych
aspektów infrastruktur komputerowych (Rysunek 2).
Ontology
Generic
Data
Ontology
Generic
Service
Ontology
Generic
Workflow
Ontology
Domain
Application
Ontology
Domain
Resource
Ontology
Domain
Data
Ontology
Domain
Service
Ontology
Domain
Workflow
Ontology
Application
Registry
Resource
Registry
Data
Registry
Service
Registry
Workflow
Registry
Generic
Application
Ontology
Generic
Resource
Rysunek 2: Zaproponowana struktura ontologii.
Struktura zbudowana jest w oparciu o 2 wymiary. Pierwszy wymiar (poziomu) określa
poziom ogólności danej ontologii, domyślnie przyjmuje się 3 poziomy:
• Ogólny (ang. Generic) - zawiera pojęcia wspólne dla danej infrastruktury komputerowej, bez pojęć specyficznych dla konkretnych aplikacji czy dziedzin zastosowania.
Pojęcia z tego poziomu są ’rozumiane’ przez komponenty warstwy pośredniej infrastruktury,
• Domenowo-specyficzny (ang. Domain) - zawiera pojęcia dotyczące danej dziedziny
aplikacyjnej (np. w ramach konkretnej Organizacji Wirtualnej). Pojęcia tworzone na
tym poziomie powinny w miarę możliwości korzystać z bardziej ogólnych pojęć warstwy ogólnej (takich jak np. usługa, plik, zadanie), dzięki czemu będą rozpoznawalne
przez komponenty warstwy pośredniej,
• Rejestr (ang. Registry) - na tym poziomie znajdują się instancje pojęć z warstw
wyższych reprezentujące instancje rzeczywistych lub wirtualnych obiektów z danej
dziedziny (np. pliki, zasoby sprzętowy, usługi, procesy, itp.)
Przykład wykorzystania tego podejścia na przykładzie aplikacji monitorowania i optymalizacji ruchu drogowego w mieście jest przedstawiony na Rysunku 3.
W ramach pracy zostały opracowane szczegółowe ontologie poziomu ogólnego, w zależności od możliwości wykorzystujące istniejące ontologie.
6
Application
Data
Resource
Resource
Service
Storage
Object
Data
Registry
Domain specific
Generic
Location
DataObject
Transform
Format
Urban
Location
Profile
Format
Conversion
Output
BinaryFormat
Worklfow
RLSFile
RealWorld
Resource
Service
Input
DataObject
AVI
Surveillance
Camera
Workflow
parameterType
OnewayStreet
Surveillance
Video
hasFormat
lfn:scv001.avi
ViaGaribaldi
SC0004
MPEGOutput
hasOutput
SCV001
AVIInput
hasInput
isStoredIn
atLocation
fromCamera
contains
SCV001.avi
AVI2MPEGProfile
- class
- subClassOf
- individual
- instanceOf
Wf001
AVI2MPEGService
presentedBy
contains
- property
Rysunek 3: Przykład złożonej ontologii zgodnej z zaproponowaną strukturą.
W przypadku ontologii zasobów opracowano i zaimplementowano w ramach pracy
odwzorowanie standardu Common Information Model (CIM) do postaci semantycznej
(OWL) (patrz Tabela 1). Standard CIM jest modelem pozwalającym modelować złożone
infrastruktury komputerowe opartym o Managed Object Format.
W oparciu o opracowane mapowanie zaimplementowano również narzędzie CIM2OWL
pozwalające na dynamiczną konwersję zasobów opisanych w standardzie CIM do postaci
semantycznej.
5
Zarządzanie semantycznymi metadanymi przy użyciu bazy wiedzy
W celu umożliwienia zastosowania zaproponowanej w poprzednim rozdziale struktury ontologii, konieczne jest odpowiednie wsparcie ze strony bazy wiedzy wykorzystywanej do
zarządzania taką ontologią. W ramach tej rozprawy opracowano rozproszoną bazę wiedzy
o nazwie GOM, cechującą się m.in.:
• rozproszeniem wspierającym zaproponowaną strukturę zależności pomiędzy poszczególnymi ontologiami,
• możliwość wsparcia dla różnych mechanizmów przechowywania danych oraz silników
wnioskujących,
• wsparcie dla ewolucji wiedzy.
7
Tabela 1: Definicja mapowania ze standardu CIM do OWL.
CIM Artifact
OWL Construct
Class
<owl:Class>
Generalization
Association
(Aggregation,
Composition)
<rdfs:subClassOf>
<owl:Class rdf:ID="...">
<rdfs:subClassOf
rdf:resource="cim-meta:CIM_Association/>
</owl:Class>
Property
<owl:DatatypeProperty>
REF Property
<owl:ObjectProperty>
Method
<cim-meta:hasMethod>
Default Value
<cim-meta:defaultValue>
Override
<rdfs:subPropertyOf>
Key
<owl:InverseFunctionalProperty>
Min, Max
<owl:minCardinality>, <owl:maxCardinality>
<cim-meta:CIM_Value> composed of <cim-meta:value>
and <cim-meta:valueMap>
ValueMap, Values
Deprecated
Required
Experimental
Alias
<owl:deprecatedClass> or <owl:deprecatedProperty>
<owl:minCardinality rdf:datatype="&xsd;int">1
</owl:minCardinality>
<cim-meta:Experimental>
<owl:equivalentClass>, <owl:equivalentProperty>
or <owl:sameAs>
ModelCorrespondence <rdfs:seeAlso>
Read, Write
<cim-meta:readable>, <cim-meta:writeable>
Version
<cim-meta:cimVersion>
Abstract
<cim-meta:Abstract>
Units
<rdfs:comment>
Vectors
<rdfs:comment>
8
Architektura bazy wiedzy GOM jest przedstawiona na Rysunku 4.
GOM Clients
GOM Infrastructure
WS Proxy
WSRF Proxy
GOM
Engine
Admin
Manager
GOM
Engine
In
Memory
GOM
GOM
Engine
Engine
Apache
In
Derby
Memory
GOM
Engine
GOM
Berkeley
Engine
DB
MySQL
Rysunek 4: Ogólna architektura bazy wiedzy GOM.
Baza wiedzy jest podzielona na kilka komponentów funkcjonalnych:
• Engine Manager - komponent odpowiedzialny za rejestrowanie i monitorowanie poszczególnych instancji komponentów,
• GOM Engine - pojedynczy komponent bazy wiedzy zarządzający jedną ontologią
(na poziomie taksonomii) lub rejestrem semantycznym (na poziomie instancji pojęć
z ontologii),
• GOM Admin - interfejs administratora,
• Proxy - interfejs umożliwiający dostęp poprzez protokół SOAP,
Najważniejszy komponent to GOM Engine, który w przypadku prostych systemów
może działać samodzielnie przechowując całość informacji semantycznych. Jego budowa
jest przedstawiona na Rysunku 5.
Interfejs pojedynczego komponentu GOM Engine posiada 2 zasadnicze kanały: do modyfikacji bazy wiedzy oraz przeszukiwania bazy wiedzy. Wszystkie operacje modyfikacji
9
Query
Event
knowledge
provision
knowledge
consumption
Query Dispatcher
Event Dispatcher
Event handlers
Create
RDQL
Change
SPARQL
Remove
RDQL2OWL
store
State
Event
Model
extract
recover
Model
GOM Engine
modify
Rysunek 5: Budowa komponentu GOM Engine bazy wiedzy.
pojedynczego komponentu są zapisywane w rejestrze Event Model, co pozwala na odtworzenie stanu bazy wiedzy z dowolnego momentu w przeszłości. State Model przechowuje
aktualny stan danego komponentu ontologii i po każdej modyfikacji wykonuje wnioskowanie przy użyciu silnika wnioskującego w zależności od konfiguracji.
Oprócz wymagań funkcjonalnych nie bez znaczenia pozostaje wydajność bazy wiedzy.
W celu oszacowania możliwości bazy wiedzy GOM zostały przeprowadzone szczegółowe
testy wydajnościowe w wielu różnych konfiguracjach. Wykresy 6 oraz 7 przedstawiają
odpowiednio czasy potrzebne na dodanie 100 nowych obiektów do bazy wiedzy oraz czasy wnioskowania po modyfikacji bazy wiedzy w zależności od aktualnego rozmiaru bazy
wiedzy.
10
30
25
Time [s]
20
15
10
5
0
00
700
InMemory-Jena
InMemory-Pellet
MySQL-Jena
MySQL-Pellet
0
0
600
00
500
00
400
00
300
0
00
0
200
100
0
100
Knowledge base size (resource descriptions)
ApacheDerby-Jena
ApacheDerby-Pellet
BerkeleyDB-Jena
BerkeleyDB-Pellet
Rysunek 6: Czas dodania 100 instancji dla różnych konfiguracji
600
500
Time [s]
400
300
200
100
0
0
600
0
700
0
0
0
00
500
0
400
00
300
0
00
0
200
100
0
100
Knowledge base size (resource descriptions)
InMemory-Jena
InMemory-Pellet
MySQL-Jena
MySQL-Pellet
ApacheDerby-Jena
ApacheDerby-Pellet
BerkeleyDB-Jena
BerkeleyDB-Pellet
Rysunek 7: Czasy wnioskowania dla różnych konfiguracji
Z testów wynika jasno, że w przypadku danych semantycznych bardzo ważne jest
zachowanie odpowiedniego kompromisu pomiędzy persystencją danych, złożonością wnioskowania oraz wydajnością zapytań i modyfikacji wiedzy.
Jednym z przykładów zastosowania opisywanej bazy wiedzy oraz zaproponowanej
struktury ontologii jest umożliwienie interoperabilności heterogenicznych infrastruktur typu Grid. W ramach tej pracy zaproponowano szczegółowe rozwiązanie polegające na stworzeniu w oparciu o bazę wiedzy GOM warstwy pośredniczącej o nazwie Grid Abstraction
Layer pomiędzy infrastrukturą europejską (EGEE) oraz chińską (VEGA) (patrz Rysunek
8).
11
VEGA
EGEE
MyProxy
C
WMS
B
D
GRAM
H
CLI
E
T
F
CE
S
L
L&B
U
RC
M
N
O
SE
P
Input
File
W
Grid Abstraction Layer
A
I
G
Grip
Mngmnt
J
K
gLite
proxy
Job
R
V
Output
File
SE
Rysunek 8: Przykład interoperabilności pomiędzy EGEE oraz VEGA podczas wykonywania zadania obliczeniowego.
Istotnym problemem w przypadku zastosowania technologii semantycznych w istniejących
systemach, jest konwersja i transfer metadanych, istniejących w typowych standardach
bazodanowych takich jak bazy relacyjne, katalogi LDAP czy dokumenty XML do postaci
semantycznej. W celu usprawnienia tego procesu w ramach tej pracy zostało zaprojektowane oraz zintegrowane z bazą wiedzy GOM narzędzie o nazwie X2R pozwalające na
integrację danych przechowywanych w wyżej wymienionych źródłach danych do postaci
semantycznej. Architektura narzędzia jest zaprezentowana na Rysunku 9.
Rysunek 9: Ogólna architektura narzędzia X2R.
6
Semantyczna platforma dla Organizacji Wirtualnych
Zaproponowane w poprzednich rozdziałach podejście polegające na unifikacji opisów semantycznych otwiera drogę do nowych podejść do wykorzystania infrastruktur kompute12
rowych dużej skali. Jedną z takich możliwości jest umożliwienie budowy dynamicznych
Organizacji Wirtualnych na heterogenicznych infrastrukturach komputerowych typu Grid
czy Cloud. Dzięki zunifikowaniu opisów zasobów i procesów tych infrastruktur i organizacji
możliwe jest opracowanie standardu opisu zasad współpracy partnerów w ramach takie
organizacji poprzez utworzenie formalnego kontraktu.
W ramach tej pracy opracowane zostało środowisko o nazwie FiVO (Framework for
Intelligent Virtual Organizations), oparte na bazie wiedzy GOM, umożliwiające wsparcie
dla wszystkich elementów cyklu Organizacji Wirtualnej takich jak incepcja, wykonanie,
ewolucja i rozwiązanie, w szczególności:
• Grupowanie organizacji w zależności od ich zainteresowań (Virtual Breeding Environments - VBE)
• Wsparcie dla wyszukiwania organizacji spełniających określone kryteria
• Możliwość budowy Organizacji Wirtualnych w sposób dynamiczny
• Wsparcie dla procesu negocjacji kontraktu Organizacji Wirtualnej w sposób rozproszony
• Automatyzacja procesu uruchomienia Organizacji Wirtualnej w zakresie infrastruktury bezpieczeństwa oraz monitorowania
• Weryfikacja i monitorowanie procesu wykonania Organizacji Wirtualnej w sensie
zgodności z wynegocjowanym kontraktem
Architektura FiVO jest przedstawiona na Rysunku 10. Środowisko jest stworzone w
architekturze SOA, co zapewnia dużą interoperabilność w różnorodnych aplikacjach. Komunikacja pomiędzy poszczególnymi komponentami platformy opiera się na szynie ESB
(Enterprise Service Bus). Każda organizacja może posiadać własną instancję FiVO, dzięki
czemu ma pełną kontrolę nad własnymi danymi i metadanymi.
Poszczególne komponenty FiVO to:
• Negotiations GUI - interfejs do negocjacji zaimplementowany w środowisku Eclipse,
• NLPN - komponent wspierający negocjacje w języku naturalnym,
• DCNS - komponent pozwalający na rozproszone negocjacje pomiędzy organizacjami,
• VBE Registry - instancja bazy wiedzy GOM zawierająca rejestr danego inkubatora
organizacji wirtualnych,
13
FiVO
Negotiations
GUI
translate Sentence
NLPN
query GOM
add OWL contract
query GOM
(send, accept)
invitation
(join, leave) VBE
(add, modify, reject)
contract statement
VO Management and Deployment
new VO Contract
Organization
Registry
query GOM
add OWL contract
(add, modify, reject)
contract statement
SECE
VO
Contract
convert
(LDAP, XML, RDBMS)
to OWL
VBE
Registry
SLAM
query GOM
query GOM
query GOM
(join, leave) VBE
DCNS
GOM
X2R
Rysunek 10: Architektura systemu FiVO.
• Organization Registry - instancja bazy wiedzy GOM przechowująca rejestr zasobów
organizacji,
• VO Contract - instancja bazy wiedzy GOM przechowująca kontrakt VO,
• X2R - wtyczka do bazy wiedzy GOM pozwalająca na pozyskiwanie, semantycznych
metadanych z niesemantycznych źródeł danych takich jak bazy relacyjne, katalogi
LDAP czy dokumenty XML,
• SECE - komponent pozwalający na automatyczną konfigurację warstwy bezpieczeństwa w zakresie autoryzacji dostępu do zasobów na podstawie wynegocjowanego
kontraktu,
• SLAM - komponent monitorujący wykonywanie Organizacji Wirtualnej w sensie
zgodności z wynegocjowanym kontraktem.
Proces negocjacji odbywa się w sposób asynchroniczny, poprzez tworzenie i modyfikowanie stwierdzeń kontraktów. Każde stwierdzenie jest zdefiniowane formalnie w postaci
odpowiedniej instancji ontologi kontraktu. Ontologia kontraktu posiada zbiór pojęć i relacji określających możliwe stwierdzenia (patrz Rysunek 11). Poszczególne stany procesu
negocjacji przedstawione są na Rysunku 12. Przykład stwierdzenia kontraktu dotyczącego
autoryzacji jest przedstawiony poniżej.
<ContractOntology:SecurityStatement rdf:about="#SEC_S_01">
<ContractOntology:hasAuthorizationPolicy rdf:resource="#SEC_A_01"/>
</ContractOntology:SecurityStatement>
<SecurityOntology:AuthorizationPolicy rdf:about="#SEC_A_01">
<SecurityOntology:appliesToResource rdf:resource="#SEC_O_01"/>
<SecurityOntology:hasRule rdf:resource="#SEC_R_01"/>
<SecurityOntology:hasRule rdf:resource="#SEC_R_02"/>
14
Contract Ontology
Contract statements
Contract
ApplicationDeployment
ResourceProvision
hasStatement
ContractStatement
hasSignature
VOLifetime
AuthorizationPolicy
RoleAssignment
DefinitionStatement
ContractSignature
PenaltyClause
KnowledgeSource
StatementCondition
SecurityRequirement
RoleDefinition
QoSStatement
Rysunek 11: Struktura ontologii kontraktu
define VO Goal
(VO Administrator)
invite Partners
(VO Administrator)
Negotiations
Initiated
Participants
Accepted
invite Partners
(VO Administrator)
start Negotiations
(VO Administrator)
statement Created
(VO Participant)
insufficient Participants
(VO Administrator)
statement Modified
(VO Participant)
cancel Negotiations
(VO Administrator)
Negotiations
Paused
Negotiations
Ongoing
statement Accepted
(VO Participant)
participant Resigned
(VO Participant)
statement Rejected
(VO Participant)
statement Rejected
(VO Participant)
[ all Statements Accepted ]
statement Created
(VO Participant)
[ all Partners Accepted ]
Negotiations
Accepted
Contract
Accepted
deploy VO
(VO Administrator)
Rysunek 12: Możliwe stany procesu negocjacji
</SecurityOntology:AuthorizationPolicy>
<SecurityOntology:AuthorizationObject rdf:about="#SEC_O_01">
<rdf:type rdf:resource="&TravelCNO;AccomodationManagingApplication"/>
</SecurityOntology:AuthorizationObject>
15
<owl:Thing rdf:about="#SEC_R_01">
<rdf:type rdf:resource="&SecurityOntology;Rule"/>
<SecurityOntology:appliesToAction rdf:resource="&TravelCNO;checkFreeVacancies
"/>
<SecurityOntology:hasCondition rdf:resource="#SEC_C_02"/>
</owl:Thing>
<owl:Thing rdf:about="#SEC_R_02">
<rdf:type rdf:resource="&SecurityOntology;Rule"/>
<SecurityOntology:appliesToAction rdf:resource="&TravelCNO;bookVacancies"/>
<SecurityOntology:appliesToAction rdf:resource="&TravelCNO;checkFreeVacancies
"/>
<SecurityOntology:hasCondition rdf:resource="#SEC_C_01"/>
</owl:Thing>
<owl:Thing rdf:about="#SEC_C_01">
<rdf:type rdf:resource="&SecurityOntology;Condition"/>
<SecurityOntology:appliesToSubject rdf:resource="#TourManager"/>
</owl:Thing>
<owl:Thing rdf:about="#SEC_C_02">
<SecurityOntology:appliesToSubject rdf:resource="#Client"/>
</owl:Thing>
Stwierdzenia kontraktu mogą odwoływać się do zasobów opisanych w ramach zunifikowanej warstwy metadanych, dzięki czemu dalsze kroki przetwarzania kontraktu mające
na celu automatyczne utworzenie i uruchomienie Organizacji Wirtualnej potrafią dobrze
zinterpretować znaczenie poszczególnych elementów kontraktu.
7
Podsumowanie
Podsumowując, główne osiągnięcia przedstawionej pracy doktorskiej to:
• Specyfikacja oraz implementacja modularnej architektury unifikacji metadanych przy
użyciu technologii Sieci Semantycznej, wspierającą zarządzanie informacjami o zasobach, umożliwiając lepsze zarządzanie danymi, wyszukiwanie usług czy koordynowanie procesów.
• Projekt oraz implementacja rozproszonej bazy wiedzy wspierającej zaproponowaną
strukturą metadanych.
• Projekt i implementacja metody konwersji standardu Common Information Model
do języka Web Ontology Language (OWL).
• Projekt narzędzia do pół-automatycznej translacji informacji z postaci relacyjnej,
LDAP oraz XML to postaci semantycznej.
16
• Projekt i implementacja środowiska do zarządzania Organizacjami Wirtualnymi
wspierającego dynamiczne budowanie kolaboracji opartych na rozproszonych infrastrukturach komputerowych.
• Projekt i rozwój środowiska do negocjacji kontraktu dla potrzeb dynamicznych Organizacji Wirtualnych.
• Projekt systemu autentykacji i autoryzacji opartego na wynegocjowanym kontrakcie
w ramach Organizacji Wirtualnych.
Niniejsza praca pokazuje, że zaproponowane w tezie zunifikowane podejście do zarządzania metadanymi w rozproszonych infrastrukturach informatycznych dużej skali może
znacznie usprawnić zarządzanie zasobami oraz budowanie Organizacji Wirtualnych opartych o heterogeniczne środowiska komputerowe.
Po pierwsze, zaproponowana zunifikowana struktura ontologii pozwala na utworzenie
warstwy abstrakcji pokrywającej różne aspekty infrastruktury informatycznej od komponentów warstwy pośredniej operujących na pojęciach abstrakcyjnych do domenowospecyficznych pojęć z poziomu konkretnych aplikacji.
Co więcej, opracowana architektura oraz implementacja rozproszonej bazy wiedzy
GOM, umożliwia efektywne przechowywanie i zarządzanie zunifikowanymi metadanymi
zgodnie z zaproponowaną strukturą ontologii.
Ostatecznie, opracowany system do dynamicznego tworzenia Organizacji Wirtualnych
o nazwie FiVO, wspiera wybór partnerów, negocjację kontraktu, oraz uruchomienie i nadzorowanie wykonania Organizacji Wirtualnej na podstawie wynegocjowanego kontraktu
reprezentowanego w sposób semantyczny przy wykorzystaniu zunifikowanego podejścia do
reprezentacji metadanych.
Wyniki zaprezentowane w tej pracy zostały sprawdzone w wielu krajowych i europejskich projektach badawczych, takich jak: EU-IST FP6 K-Wf Grid (Knowledge-based
Workflow System for Grid Applications, numer kontraktu 511385), EU-IST FP6 Gredia (GRid enabled access to rich mEDIA content, numer kontraktu 34363), POIG ITSOA (numer kontraktu POIG.01.03.01-00-008/08) oraz POIG PL-Grid (numer kontraktu
POIG.02.03.00-00-007/08-00).
W zakresie przyszłego rozwoju zaprezentowanej pracy, pojawia się szereg możliwości.
Po pierwsze, proces negocjacji może być zautomatyzowany, np. poprzez implementację
sytemu agentowego, gdzie poszczególne agenty reprezentują daną organizację oraz posługują się konceptualizacją domeny według ontologii przechowywanych w ramach inkubatora
Organizacji Wirtualnych dając w wyniku zapisany formalnie kontrakt zgodny z zaproponowaną ontologia kontraktu. Kluczowym czynnikiem w tym przypadku jest opracowanie
sposobu reprezentacji funkcji celu poszczególnych agentów, tak aby możliwe było automatyczne negocjowanie nie tylko aspektów niefunkcjonalnych kontraktu (takich jak koszt czy
17
czas), ale również funkcjonalnych (np. jak jakie usługi są potrzebne aby zrealizować cele
stawiane przed daną Organizacją Wirtualną?).
Po drugie, rozwinąć można samą bazę wiedzy GOM o nowe silniki wnioskujące lub
standardy reprezentacji metadanych takie jak OWL 2.
Dodatkowo, rozwinąć można narzędzie X2R o dodatkowe mechanizmy przechowywania
danych takie jak bazy NoSQL czy bazy obiektowe.
18
Literatura
[1] Roberto Alfieri, Roberto Cecchini, Vincenzo Ciaschini, Luca dell’Agnello, Ákos Frohner, Alberto Gianoli, Károly Lörentey, and Fabio Spataro. Voms, an authorization system for virtual organizations. In
European Across Grids Conference, pages 33–40, 2003.
[2] S. Andreozzi, S. Burke, L. Field, S. Fisher, B. Kónya, M. Mambelli, J.M. Schopf, M. Viljoen, and
A. Wilson. GLUE Schema Specification - Version 1.2. http://glueschema.forge.cnaf.infn.it/
Spec/V12, Accessed on 15/10/2012, December 2005.
[3] Krzysztof Benedyczak, Marcin Lewandowski, Aleksander Nowinski, and Piotr Bala. Unicore virtual organizations system. In Roman Wyrzykowski, Jack Dongarra, Konrad Karczewski, and Jerzy
Wasniewski, editors, Parallel Processing and Applied Mathematics, volume 6068 of Lecture Notes in
Computer Science, pages 155–164. Springer Berlin / Heidelberg, 2010.
[4] Bartosz Bosak, Jan Konczak, Krzysztof Kurowski, Mariusz Mamonski, and Tomasz Piontek. Highly
integrated environment for parallel application development using qoscosgrid middleware. In Marian
Bubak, Tomasz Szepieniec, and Kazimierz Wiatr, editors, PL-Grid, volume 7136 of Lecture Notes in
Computer Science, pages 182–190. Springer, 2012.
[5] Karen Coyle. MARC21 as Data: A Start. Code4lib journal, (14).
[6] Digital Library Federation. Metadata encoding and transmission standard: Primer and reference manual, September 2007.
[7] Jack Dongarra, Pete Beckman, Terry Moore, Patrick Aerts, Giovanni Aloisio, David Barkai, Taisuke
Boku, Barbara Chapman, Xuebin Chi, Alok Choudhary, Sudip Dosanjh, Thom Dunning, Ro Fiore,
Al Geist, Robert Harrison, Mark Hereld, Michael Heroux, Koh Hotta, Yutaka Ishikawa, Zhong Jin, Fred
Johnson, Sanjay Kale, Richard Kenway, David Keyes, Bill Kramer, Jesus Labarta, Alain Lichnewsky,
Bob Lucas, Satoshi Matsuoka, Paul Messina, Peter Michielse, Bernd Mohr, Matthias Mueller, John
Shalf, David Skinner, Marc Snir, Thomas Sterling, Rick Stevens, Fred Streitz, Bob Sugar, Aad Van Der
Steen, Jeffrey Vetter, Peg Williams, Robert Wisniewski, and Kathy Yelick. International Exascale
Software Project Roadmap 1.0. Technical report, May 2010.
[8] Ian T. Foster, Carl Kesselman, and Steven Tuecke. The anatomy of the grid - enabling scalable virtual
organizations. CoRR, cs.AR/0103025, 2001.
[9] John F. Gantz, Christopher Chute, Alex Manfrediz, Stephen Minton, David Reinsel, Wolfgang Schlichting, and Anna Toncheva. An updated forecast of worldwide information growth through 2011, May
2008.
[10] B. Grau, I. Horrocks, B. Motik, B. Parsia, P. Patelschneider, and U. Sattler. Owl 2: The next step for
owl. Web Semantics: Science, Services and Agents on the World Wide Web, 6(4):309–322, November
2008.
[11] D.C. Hay. Data Model Patterns: A Metadata Map. The Morgan Kaufmann Series in Data Management
Systems Series. Elsevier Morgan Kaufmann, 2006.
[12] Jeff Heflin. Web ontology language (owl) use cases and requirements. World Wide Web Consortium,
Recommendation REC-webont-req-20040210, February 2004.
[13] Martin Hilbert and Priscila Lopez. The world’s technological capacity to store, communicate, and
compute information. Science, 332(6025):60–65, April 2011.
[14] Brigitte Jörg. CERIF: The common european research information format model. Data Science
Journal, 9:CRIS24–CRIS31, 2010.
[15] Carl Kesselman and Ian Foster. The Grid: Blueprint for a New Computing Infrastructure. Morgan
Kaufmann Publishers, November 1998.
[16] E. Laure, C. Gr, S. Fisher, A. Frohner, P. Kunszt, A. Krenek, O. Mulmo, F. Pacini, F. Prelz, J. White, M. Barroso, P. Buncic, R. Byrom, L. Cornwall, M. Craig, A. Di Meglio, A. Djaoui, F. Giacomini,
J. Hahkala, F. Hemmer, S. Hicks, A. Edlund, A. Maraschini, R. Middleton, M. Sgaravatto, M. Steenbakkers, J. Walk, and A. Wilson. Programming the grid with glite. In Computational Methods in
Science and Technology, 2006.
19
[17] Holger Lausen and Axel Polleres.
Web service modeling ontology (wsmo).
http://www.w3.org/Submission/WSMO/, June 2005.
available at:
[18] Peter Mell and Timothy Grace. The NIST definition of cloud computing, 2011.
[19] Alistair Miles and Sean Bechhofer. SKOS Simple Knowledge Organization System reference. http:
//www.w3.org/TR/2009/REC-skos-reference-20090818/, Accessed on 15/09/12, August 2009.
[20] Robin Podmore, David Becker, Rob Fairchild, and Marck Robinson. Common information model: A
developer’s perspective. In HICSS, 1999.
[21] Shelley Powers. Practical RDF: Solving Problems with the Resource Description Framework. O’Reilly,
Beijing, 2003.
[22] Spencer Reiss. Cloud Computing. Available at Amazon.com Today, 2008.
[23] Achim Streit, Piotr Bala, Alexander Beck-Ratzka, Krzysztof Benedyczak, Sandra Bergmann, Rebecca
Breu, Jason Daivandy, Bastian Demuth, Anastasia Eifer, André Giesler, Björn Hagemeier, Sonja Holl,
Valentina Huber, Nadine Lamla, Daniel Mallmann, Ahmed Memon, Mohammad Memon, Michael
Rambadt, Morris Riedel, Mathilde Romberg, Bernd Schuller, Tobias Schlauch, Andreas Schreiber,
Thomas Soddemann, and Wolfgang Ziegler. Unicore 6 — recent and future advancements. Annals of
Telecommunications, 65:757–762, 2010.
[24] Text Encoding Initiative.
18/09/2012.
P5 guidelines.
http://www.tei-c.org/Guidelines/P5/, Retrieved
20
Lista publikacji autora rozprawy
[1] Witold Alda, Krzysztof Boryczko, Jacek Kitowski, Bartosz Kryza, and Renata Słota. Parallel and
distributed calculations based on multicore computer architecture and service paradigm (in polish).
In Kierunki działanośći i współpraca naukowa Wydziału Elektrotechniki, Automatyki, Informatyki i
Elektroniki, materiały konferencji zorganizowanej z okazji Jubileuszu 90-lecia AGH, Kraków, 28-29
May, 2009, pages 171–174. Delta, Kraków, 2009.
[2] Marian Babik, Ladislav Hluchy, Jacek Kitowski, and Bartosz Kryza. WSRF2OWL-S: A framework
for generating semantic descriptions of web and grid services. In Marian Bubak, Michal Turała, and
Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’05, November 20-23 2005,
pages 49–56. ACC Cyfronet AGH, 2006.
[3] Marian Babik, Ladislav Hluchy, Jacek Kitowski, and Bartosz Kryza. Generating semantic descriptions
of web and grid services. In Péter Kacsuk, Thomas Fahringer, and Zsolt Németh, editors, Proc. of 6th
Biannual Austrian-Hungarian Workshop on Distributed and Parallel Systems, DAPSYS 2006, pages
93–102. Springer US, 2007.
[4] Łukasz Dutka, Bartosz Kryza, Renata Słota, Marta Majewska, Ladislav Hluchy, and Jacek Kitowski. Component-expert architecture for supporting grid workflow construction based on knowledge.
In P. Cunningham and M. Cunningham, editors, Innovation and the Knowledge Economy. Issues,
Applications, Case Studies, eChallenges, pages 239–246. IOS Press, 2005.
[5] Jakub Fibinger, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Automatic XACML-based authorization rules deployment in Virtual Organizations. In Marian Bubak, Michal Turała, and Kazimierz
Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’10, October 11-13 2010, Cracow, Poland,
[6] Jakub Fibinger, Bartłomiej Puzoń, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Virtual Organization security layer deployment assistance. In Marian Bubak, Michal Turała, and Kazimierz Wiatr,
editors, Proceedings of Cracow Grid Workshop CGW’09, October 12-14 2009, Cracow, Poland, pages
88–95. ACC Cyfronet AGH, 2010.
[7] Włodzimierz Funika, Bartosz Kryza, Renata Słota, Jacek Kitowski, Kornel Skałkowski, Jakub Sendor,
and Dariusz Król. Monitoring of SLA parameters within VO for the SOA paradigm. In Roman
Wyrzykowski, Jack Dongarra, Konrad Karczewski, and Jerzy Wasniewski, editors, Proc. of Intl Conf.
on Parallel Processing and Applied Mathematics, PPAM, volume 6068 of Lecture Notes in Computer
Science, pages 115–124. Springer Berlin / Heidelberg, 2010.
[8] Emil Gatial, Branislav Simo, G. Nguyen, Michal Laclavik, Thomas Linden, and Bartosz Kryza. K-Wf
Grid portal: a web interface to semantic workflows. In Marian Bubak and Steffen Unger, editors,
Proceedings of Cracow Grid Workshop CGW’06, October 15-18 2006, The Knowledge-based Workflow
System for Grid Applications, pages 131–137. ACC Cyfronet AGH, 2007.
[9] Ladislav Hluchy, Marcel Kvassay, Stefan Dlugolinsky, Bernhard Schneider, Holger Bracker, Bartosz
Kryza, and Jacek Kitowski. Handling internal complexity in highly realistic agent-based models
of human behaviour. In Proc. of 6th IEEE International Symposium on Applied Computational
Intelligence and Informatics (SACI), 2011, pages 11–16. May 2011.
[10] Ladislav Hluchy, Marcel Kvassay, S̆tefan Dlugolinský, Bernhard Schneider, Holger Bracker, Bartosz
Kryza, and Jacek Kitowski. Towards more realistic human behaviour simulation: Modelling concept,
deriving ontology and semantic framework. In Radu-Emil Precup, Szilveszter Kovács, Stefan Preitl,
and Emil M. Petriu, editors, Applied Computational Intelligence in Engineering and Information
Technology, volume 1 of Topics in Intelligent Engineering and Informatics, pages 1–17. Springer
Berlin Heidelberg, 2012.
[11] Jacek Kitowski and Bartosz Kryza. Dynamic Virtual Organization management framework supporting
distributed industrial collaborations. Computer Methods in Materials Science, 11(4):514–523, 2011.
[12] Krzysztof Krawczyk, Renata Słota, Marta Majewska, Bartosz Kryza, and Jacek Kitowski. Grid
Organization Memory for knowledge management for grid environment. In Marian Bubak, Michal
Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’04, December
13-15 2004, pages 109–115. ACK Cyfronet AGH, 2005.
21
[13] Dariusz Król, Bartosz Kryza, Kornel Skałkowski, Darin Nikolow, Renata Słota, and Jacek Kitowski. QoS provisioning for data-oriented applications in PL-Grid. In Marian Bubak, Michal Turała,
and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’10, October 11-13 2010,
Cracow, Poland, pages 142–150. ACC Cyfronet AGH, 2011.
[14] Dariusz Król, Bartosz Kryza, Michał Wrzeszcz, Łukasz Dutka, and Jacek Kitowski. Elastic infrastructure for interactive data farming experiments. Procedia Computer Science, 9(0):206 – 215, 2012.
[15] Dariusz Król, Renata Słota, Bartosz Kryza, Darin Nikolow, Włodzimierz Funika, and Jacek Kitowski.
Policy driven data management in pl-grid virtual organizations. In Franco Davoli, Marcin Lawenda,
Norbert Meyer, Roberto Pugliese, Jan Węglarz, and Sandro Zappatore, editors, Remote Instrumentation for eScience and Related Aspects, pages 257–266. Springer New York, 2012.
[16] Dariusz Król, Michał Wrzesz, Bartosz Kryza, Łukasz Dutka, and Jacek Kitowski. Massively scalable
platform for data farming supporting heterogeneous infrastructure. In The Fourth International
Conference on Cloud Computing, GRIDs, and Virtualization, IARIA Cloud Computing 2013, pages
144–149, Valencia, Spain, 2013.
[17] Dariusz Król, Michał Wrzeszcz, Bartosz Kryza, Łukasz Dutka, and Jacek Kitowski. Scalarm: massively
self-scalable platform for data farming. In Marian Bubak, Michał Turała, and Kazimierz Wiatr,
editors, Cracow’12 Grid Workshop : October 22–24, 2012, Krakow, Poland, pages 53—-54. Academic
Computer Centre CYFRONET AGH, 2012.
[18] Dariusz Król, Michal Wrzeszcz, Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski.
Scalarm: scalable platform for data farming. In KU KDM 2013 : sixth ACC Cyfronet AGH user’s
conference : Zakopane, 28 February – 1 March 2013, page 48, 2013.
[19] Bartosz Kryza. Mono i DotGNU. Technologie .NET na zasadach Open Source (in polish). Magazyn
Software 2.0 Extra, 2:60–64, 2002.
[20] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Supporting knowledge-based dynamic virtual organizations with contracts. In P. Cunningham and M. Cunningham, editors, Innovation
and the Knowledge Economy. Issues, Applications, Case Studies, eChallenges, pages 937–944. IOS
Press, 2007.
[21] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Security focused dynamic Virtual
Organizations in the grid based on contracts. In P. Cunningham and M. Cunningham, editors,
Innovation and the Knowledge Economy. Issues, Applications, Case Studies, volume 5 of eChallenges,
pages 1153–1160. IOS Press, 2008.
[22] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Supporting management of dynamic
Virtual Organizations in the grid through contracts. In Marian Bubak, Michal Turała, and Kazimierz
Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-17 2007, Cracow, Poland,
[23] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Dynamic VO establishment in
distributed heterogeneous business environments. In Gabrielle Allen, Jaroslaw Nabrzyski, Edward
Seidel, Geert van Albada, Jack Dongarra, and Peter Sloot, editors, Proc. of Intl Conf. on Computational Science, ICCS 2009, volume 5545 of Lecture Notes in Computer Science, pages 709–718.
Springer Berlin / Heidelberg, 2009.
[24] Bartosz Kryza, Łukasz Dutka, Renata Słota, Jan Pieczykolan, and Jacek Kitowski. GVOSF: Grid
Virtual Organization Semantic Framework for knowledge support. In Marian Bubak, Michal Turała,
[25] Bartosz Kryza and Jacek Kitowski. Comparison of information representation formalisms for scalable
file agnostic information infrastructures. Computing and Informatics, Accepted for print. Impact
Factor: 0.254.
[26] Bartosz Kryza, Dariusz Król, Michał Wrzeszcz, Łukasz Dutka, and Jacek Kitowski. Interactive cloud
data farming environment for military mission planning support. Computer Science : kwartalnik
Akademii Górniczo-Hutniczej imienia Stanisława Staszica w Krakowie, 13(3):89—-100, 2012.
22
[27] Bartosz Kryza, Marta Majewska, Renata Słota, and Jacek Kitowski. Unifying grid metadata representations through ontologies. In Roman Wyrzykowski, Jack Dongarra, Norbert Meyer, and Jerzy
Wasniewski, editors, Proc. of Intl Conf. on Parallel Processing and Applied Mathematics, PPAM,
volume 3911 of Lecture Notes in Computer Science, pages 683–690. Springer Berlin / Heidelberg,
2006.
[28] Bartosz Kryza, Antoni Myłka, Alina Świderska Myłka, and Jacek Kitowski. Application of unified
metadata grid framework supporting resource discovery and matchmaking. In Proceedings of 3rd ACC
Cyfronet AGH users’ conference, Zakopane, March 18-19 2010, page 36. ACC Cyfronet AGH, 2010.
[29] Bartosz Kryza, Jan Pieczykolan, Marian Babik, Marta Majewska, Renata Słota, Ladislav Hluchy, and
Jacek Kitowski. Managing semantic metadata in K-Wf Grid with Grid Organizational Memory. In
Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop
CGW’05, November 20-23 2005, pages 66–73. ACC Cyfronet AGH, 2006.
[30] Bartosz Kryza, Jan Pieczykolan, and Jacek Kitowski. Grid Organizational Memory: A versatile
solution for ontology management in the grid. Proc. of Second IEEE International Conference on
e-Science and Grid Computing, e-Science’06, page 16, 2006.
[31] Bartosz Kryza, Jan Pieczykolan, Marta Majewska, Renata Słota, Marian Babik, Adrian Toth, Jacek
Kitowski, and Ladislav Hluchy. Grid Organizational Memory - semantic framework for metadata
management in the grid. In Marian Bubak and Steffen Unger, editors, Proceedings of Cracow Grid
Workshop CGW’06, October 15-18 2006, The Knowledge-based Workflow System for Grid Applications, pages 74–81. ACC Cyfronet AGH, 2007.
[32] Bartosz Kryza, Jan Pieczykolan, Jakub Wach, Mikołaj Zuzek, and Jacek Kitowski. Peer-to-peer
distribution model for Grid Organizational Memory knowledge base. In Marian Bubak and Steffen
Unger, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-18 2006, The Knowledgebased Workflow System for Grid Applications, pages 90–97. ACC Cyfronet AGH, 2007.
[33] Bartosz Kryza, Łukasz Skitał, Jacek Kitowski, Maozhen Li, and Takebumi Itagaki. Analysis of interoperability issues between EGEE and VEGA grid infrastructures. In Michael Gerndt and Dieter
Kranzlmuller, editors, Proc. of Intl Conf. on High Performance Computing and Communications,
volume 4208 of Lecture Notes in Computer Science, pages 793–802. Springer Berlin / Heidelberg,
2006.
[34] Bartosz Kryza, Renata Słota, Marta Majewska, Jan Pieczykolan, and Jacek Kitowski. Grid Organizational Memory - provision of a high-level grid abstraction layer supported by ontology alignment.
Future Gener. Comput. Syst., 23:348–358, March 2007. Impact Factor: 2.033.
[35] Marcel Kvassay, Ladislav Hluchy, Bartosz Kryza, Jacek Kitowski, Martin Seleng, Stefan Dlugolinsky,
and Michal Laclavik. Combining object-oriented and ontology-based approaches in human behaviour
modelling. In Proc. of 9th IEEE International Symposium on Applied Machine Intelligence and
Informatics, SAMI 2011, pages 177–182. Jan 2011.
[36] Marta Majewska, Bartosz Kryza, and Jacek Kitowski. On translation Common Information Model to
OWL ontology. In Marian Bubak and Steffen Unger, editors, Proceedings of Cracow Grid Workshop
CGW’06, October 15-18 2006, The Knowledge-based Workflow System for Grid Applications, pages
82–89. ACC Cyfronet AGH, 2007.
[37] Marta Majewska, Bartosz Kryza, and Jacek Kitowski. Translation of Common Information Model to
Web Ontology Language. In Yong Shi, Geert van Albada, Jack Dongarra, and Peter Sloot, editors,
Proc. of Intl Conf. on Computational Science, ICCS 2007, volume 4487 of Lecture Notes in Computer
Science, pages 414–417. Springer Berlin / Heidelberg, 2007.
[38] Antoni Myłka, Alina Myłka, Bartosz Kryza, and Jacek Kitowski. Integration of heterogeneous data
sources into an ontological knowledge base. Computing and Informatics, 31(1):189–223, 2012. Impact
Factor: 0.254.
[39] Mikołaj Pastuszko, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Processing and negotiation
of natural language based contracts for Virtual Organizations. In Marian Bubak, Michal Turała,
23
[40] Mikołaj Pastuszko, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Natural language based processing of multilingual contracts for Virtual Organizations constitution. In Marian Bubak, Michal Turała,
[41] Jan Pieczykolan, Łukasz Dutka, Bartosz Kryza, Krzysztof Korcyl, and Jacek Kitowski. Data dispatcher for real time applications in grid environment. In Poster presented at 7th Int. Conf. Computational
Science, Beijing, China, volume Addnt’l CD, pages 47–54. 2007.
[42] Jan Pieczykolan, Bartosz Kryza, and Jacek Kitowski. Semi-automatic creation of adapters for legacy
application migration to integration platform using knowledge. In Vassil Alexandrov, Geert van
Albada, Peter Sloot, and Jack Dongarra, editors, Proc. of Intl Conf. on Computational Science, ICCS
2006, volume 3994 of Lecture Notes in Computer Science, pages 252–259. Springer Berlin / Heidelberg,
2006.
[43] Kornel Skałkowski, Jakub Sendor, Mikołaj Pastuszko, Bartłomiej Puzoń, Jakub Fibinger, Dariusz
Król, Włodzimierz Funika, Bartosz Kryza, Renata Słota, and Jacek Kitowski. SOA-based support
for dynamic creation and monitoring of Virtual Organization. In S. Ambroszkiewicz, J. Brzezinski,
W. Cellary, A. Grzech, and K. Zielinski, editors, SOA Infrastructures Tools Concepts and Methods,
pages 345–374. Poznan University of Economics Press, Poznan, 2010.
[44] Kornel Skałkowski, Renata Słota, Dariusz Król, Michał Orzechowski, Bartosz Kryza, and Jacek Kitowski. Towards scalable, semantic-based virtualized storage resources provisioning. In Kazimierz
Wiatr, Jacek Kitowski, and Marian Bubak, editors, KU KDM 2012 : fifth ACC Cyfronet AGH user’s
conference : Zakopane, March 07–09, 2012, pages 76––77. ACC Cyfronet AGH, 2012.
[45] Renata Słota, Dariusz Król, Kornel Skalkowski, Bartosz Kryza, Darin Nikolow, and Jacek Kitowski.
FiVO/QStorMan: toolkit for supporting data-oriented applications in PL-Grid. In KU KDM 2011 :
fourth ACC Cyfronet AGH users’ conference : Zakopane, March 09–11, 2011, page 6. ACK Cyfronet
AGH, 2011.
[46] Renata Słota, Dariusz Król, Kornel Skałkowski, Bartosz Kryza, Darin Nikolow, Michał Orzechowski, and Jacek Kitowski. A toolkit for storage QoS provisioning for data-intensive applications. In
Marian Bubak, Tomasz Szepieniec, and Kazimierz Wiatr, editors, Building a National Distributed eInfrastructure–PL-Grid, volume 7136 of Lecture Notes in Computer Science, pages 157–170. Springer
Berlin / Heidelberg, 2012.
[47] Renata Słota, Dariusz Król, Kornel Skałkowski, Bartosz Kryza, Darin Nikolow, Michał Orzechowski,
and Jacek Kitowski. A toolkit for storage QoS provisioning for data-intensive applications. Computer
Science : kwartalnik Akademii Górniczo-Hutniczej imienia Stanislawa Staszica w Krakowie, 13(1):63–
73, 2012.
[48] Renata Słota, Darin Nikolow, Jacek Kitowski, Dariusz Król, and Bartosz Kryza. FiVO/QStorMan
semantic toolkit for supporting data-intensive applications in distributed environments. Computing
and Informatics, 31(5):1003–1024, 2012. Impact Factor: 0.254.
[49] Renata Słota, Joanna Ziȩba, Bartosz Kryza, and Jacek Kitowski. Knowledge evolution supporting
automatic workflow composition. Proc. of Second IEEE International Conference on e-Science and
Grid Computing, e-Science’06, 0:37, 2006.
[50] Renata Słota, Joanna Ziȩba, Marta Majewska, Bartosz Kryza, and Jacek Kitowski. Ontology alignment and ontology similarity for extension of service ontology in grid environment. In Marian Bubak,
Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’05, November 20-23 2005, pages 41–48. ACC Cyfronet AGH, 2006.
[51] Marcin Stelmach, Bartosz Kryza, and Jacek Kitowski. Application of highly scalable hybrid architecture for sharing ontological information in heterogeneous environments. In Miriam Cunningham
Paul Cunningham, editor, eChallenges e-2012: conference and exhibition, 17–19 October 2012, Lisbon,
Portugal. IIMC International Information Management Corporation, 2012.
[52] Marcin Stelmach, Bartosz Kryza, and Jacek Kitowski. P2P approach to knowledge-based dynamic
Virtual Organizations inception and management. In Roman Wyrzykowski, Jack Dongarra, Konrad
Karczewski, and Jerzy Wasniewski, editors, Proc. of Intl Conf. on Parallel Processing and Applied
Mathematics, PPAM, volume 7204 of Lecture Notes in Computer Science, pages 201–210. Springer
Berlin / Heidelberg, 2012.
24
[53] Marcin Stelmach, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Distributed contract negotiation
system for Virtual Organizations. Proceedings of the International Conference on Computational
Science, ICCS 2011, Procedia Computer Science, 4:2206–2215, 2011.
[54] Joanna Ziȩba, Bartosz Kryza, Renata Słota, Łukasz Dutka, and Jacek Kitowski. Ontology alignment
for contract based Virtual Organizations negotiation and operation. In Roman Wyrzykowski, Jack
Dongarra, Konrad Karczewski, and Jerzy Waśniewski, editors, Proc. of Intl Conf. on Parallel Processing and Applied Mathematics, PPAM, volume 4967 of Lecture Notes in Computer Science, pages
835–842. Springer Berlin / Heidelberg, 2008.
[55] Mikołaj Zuzek, Marek Talik, Tomasz Świerczynski, Cezary Wiśniewski, Bartosz Kryza, Łukasz Dutka,
and Jacek Kitowski. Formal model for contract negotiation in knowledge-based Virtual Organizations.
In Marian Bubak, Geert van Albada, Jack Dongarra, and Peter Sloot, editors, Proc. of Intl. Conf.
on Computational Science, ICCS 2008, volume 5103 of Lecture Notes in Computer Science, pages
409–418. Springer Berlin / Heidelberg, 2008.
A
A.1
Dane bibliometryczne
Web of Science
Cytowania (całkowita liczba) : 39
Cytowania (bez autocytowań) : 29
h-index: 4
A.2
Google Scholar
Cytowania (całkowita liczba): 254
h-index: 9
i10-index: 8
25

Zarządzanie Zunifikowanymi Metadanymi w Rozproszonych

Transkrypt

Podobne dokumenty