Zarządzanie Zunifikowanymi Metadanymi w Rozproszonych
Transkrypt
Zarządzanie Zunifikowanymi Metadanymi w Rozproszonych
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Informatyki Autoreferat rozprawy doktorskiej Zarządzanie Zunifikowanymi Metadanymi w Rozproszonych Infrastrukturach Komputerowych Dużej Skali Autor: mgr inż. Bartosz Kryza Promotor: Prof. dr hab. inż. Jacek Kitowski Promotor pomocniczy: dr inż. Renata Słota Kraków, Poland 27 czerwca 2014 1 Wprowadzenie Pierwsza dekada XXI wieku przyniosła znaczące uzależnienie praktycznie każdego aspektu ludzkiego życia od dostępności i efektywności systemów informatycznych. Niestety ilość oraz stopień różnorodności zasobów dostępnych w sieci powoduje coraz większe problemy z dostępem do informacji i zasobów odpowiadających konkretnemu żądaniu. Większość narzędzi do wyszukiwania informacji opiera się na porównywaniu ciągów znaków oraz nie pozwala na uzyskanie zagregowanej odpowiedzi. Jedną z głównych przyczyn takiego stanu rzeczy jest fakt, że większość danych i zasobów dostępnych w sieci nie posiada odpowiednich adnotacji, czyli metadanych. Według raportu IDC [9], już w roku 2007 ilość danych jaka została wytworzona przekroczyła światowe zasoby pamięci trwałej, która wówczas była szacowana na 281 eksabajtów. W [13] pokazano, że w roku 2007 wszystkie komputery na świecie były w stanie wykonać 6.4 Tera MIPS czyli ok. 1018 operacji na sekundę, przetransmitowały 2.1 zeta bitów danych (1021 ) oraz przechowywały 295 eksabajtów danych. Pod koniec 2013 roku na świecie istniało już ponad 30 maszyn o wydajności powyżej jednego peta FLOP, z czego najszybsza Tianhe-2 ma ponad 33 petaFLOP’y. Obecnie naukowcy planują już kolejne generacje superkomputerów o wydajności eksaFLOP [7]. Zdaniem wielu ekspertów, taki przyrost ilości informacji i mocy obliczeniowej wprowadza konieczność zmiany paradygmatu w jaki prowadzi się badania naukowe wykorzystujące technologie informatyczne. Przede wszystkim konieczne jest zapewnienie systemom informatycznych większego stopnia autonomii, poprzez realizację następujących wymagań: • wszystkie elementy związane z komunikacją między zasobami i usługami takie jak identyfikatory, wiadomości, pliki, urządzenia oraz ich atrybuty powinny być oparte o ustrukturyzowane typy danych (w przeciwieństwie do zwykłych ciągów znaków), które można łatwo analizować z poziomu maszynowego, • implementacja usług musi zapewniać łatwe wyszukiwanie i dopasowywanie zasobów do siebie, pozwalając na automatyczne odnajdywanie pojedynczych usług lub ciągów usług będących w stanie zrealizować konkretne żądanie, • same infrastruktury informatyczne powinny być dynamiczne i adaptować się do aktualnego stanu środowiska. 2 Teza i cele rozprawy Celem tej pracy jest opracowanie nowego podejścia do zarządzania metadanymi w rozproszonych infrastrukturach komputerowych dużej skali z wykorzystaniem technologii Sieci Semantycznej. Jednym z założeń tej pracy jest rozumienie pojęcia metadanych w takich 1 infrastrukturach w szerszym kontekście, mianowicie metadanych rozumianych jako dodatkowe informacje nie tylko o danych, ale również zasobach, usługach, procesach czy użytkownikach. Aby zapewnić efektywne zastosowanie tak rozumianych metadanych konieczne są odpowiednie formalizmy do ich reprezentowania oraz platforma zarządzająca nimi, czyli przechowująca metadane w sposób skalowalny, bezpieczny oraz umożliwiający kontrolowaną ewolucję tak gromadzonej wiedzy. Jest to szczególnie istotne w infrastrukturach informatycznych dużej skali składających się z heterogenicznych platform obsługujących różne aspekty infrastruktury. Obecne rozwijane technologie informatyczne mają potencjał aby znacząco poprawić sposób w jaki infrastruktury informatyczne dużej skali są zorganizowane, zarządzane oraz monitorowane. Środowiska typu Grid i Cloud, wraz z technologiami wirtualizacji pozwalają na wprowadzenie abstrakcji sprzętowej infrastruktury w aspektach obliczeniowych, sieciowych oraz przechowywania danych. Paradygmat usług sieciowych (SOA) pozwala na wirtualizację dostępu do oprogramowania, umożliwiając tworzenie złożonych usług i aplikacji z dostępnych usług sieciowych. Technologie Sieci Semantycznej umożliwiają abstrakcję metadanych do postaci sformalizowanej oraz wnioskowania po ich zawartości. Teza niniejszej rozprawy jest zatem następująca: Unification of metadata in large distributed computing infrastructures using Semantic Web technologies can significantly improve resource discovery and management aspects of Grid and Cloud environments, and in particular enable dynamic establishment of Virtual Organizations over heterogeneous IT platforms. oraz w tłumaczeniu na język polski: Unifikacja metadanych w rozproszonych infrastrukturach informatycznych dużej skali przy wykorzystaniu technologii Sieci Semantycznej może znacząco poprawić aspekty wyszukiwania zasobów oraz zarządzania infrastrukturą środowisk typu Grid i Cloud, a w szczególności umożliwić dynamiczne tworzenie Organizacji Wirtualnych w heterogenicznych środowiskach IT. Teza jest dowiedziona poprzez zaproponowanie oraz stworzenie nowego podejścia do unifikacji metadanych przy użyciu technologii Sieci Semantycznej, co znacząco usprawnia wyszukiwanie zasobów takich jak dane, usługi oraz dopasowywanie usług. W celu pokazania jak zarządzać tego rodzaju metadanymi stworzona została rozproszona baza wiedzy posiadająca takie cechy jak model rozproszenia metadanych, wsparcie dla ewolucji wiedzy oraz umożliwienie migracji metadanych z klasycznych systemów przechowywania danych. Na końcu, pokazano jak przy wykorzystaniu takiego podejścia do metadanych można tworzyć dynamicznie Organizacje Wirtualne oparte o wynegocjowany kontrakt. 2 2.1 Osiągnięcia rozprawy W skrócie, główne osiągnięcia tej rozprawy to: • Specyfikacja, opracowanie oraz ewaluacja modułowej architektury zunifikowanych metadanych, wspierającej zarządzanie metadanymi w infrastrukturach informatycznych dużej skali, pozwalającą adresować takie aspekty jak zarządzanie danymi, wyszukiwanie usług oraz kompozycja aplikacji typu workflow, • Projekt i implementacja rozproszonej semantycznej bazy wiedzy działającej w paradygmacie SOA, wspierającej wnioskowanie oraz ewolucję wiedzy, • Projekt i implementacja metody do konwertowania danych przechowywanych w standardzie MOF (Managed Object Format) do standardu OWL (Web Ontology Language) na przykładzie standardu CIM (Common Information Model), • Projekt narzędzia do pół-automatycznego tłumaczenia metadanych przechowywanych w bazach relacyjnych, katalogach LDAP oraz plikach XML do postaci semantycznej, • Projekt i implementacja platformy do budowania i zarządzania Organizacjami Wirtualnymi wspierającej takie aspekty jak wyszukiwanie partnerów, definicja celu, negocjacja kontraktu, zarządzanie użytkownikami, zarządzanie danymi, dynamiczne utworzenie Organizacji Wirtualnej na podstawie kontraktu, w tym konfiguracji warstwy bezpieczeństwa i monitorowania, • Projekt i implementacja środowiska do rozproszonej negocjacji kontraktu dla potrzeb Organizacji Wirtualnych w postaci formalnej, specyfikacja procesu negocjacji, ontologii kontraktu oraz narzędzi umożliwiających prowadzenie negocjacji w sposób rozproszony. 3 Stan wiedzy Zarządzanie zunifikowanymi metadanymi w infrastrukturach komputerowych dużej skali, dyskutowane w niniejszej pracy, jest związane z tematyką zarówno dotyczącą infrastruktur komputerowych jak i technologii semantycznych. Główne trendy w dziedzinie systemów komputerowych dużej skali to środowiska Grid [15] oraz Cloud [18]. Systemy typu Grid są reprezentowane przez takie platformy jak Globus [8], gLite [16], UNICORE [23] czy QosCosGrid [4]. Istotnym aspektem tych środowisk jest pojęcie Organizacji Wirtualnej, pozwalające na dzielenie użytkowników w grupy zainteresowań oraz przydzielanie zasobów obliczeniowych oraz przechowywania danych według tych grup. 3 Każde środowisko typu Grid posiada własne rozwiązanie pozwalające na zarządzanie tymi grupami takie jak VOMS [1] czy UVOS [3]. Kolejnym krokiem w rozwoju systemów rozproszonych dużej skali było pojawienie się środowisk typu Cloud [22], umożliwiających budowanie wirtualnych infrastruktur obliczeniowych oraz przechowywania danych w oparciu o zasoby sprzętowe dostarczane przez zewnętrznych dostawców. Zasoby typu Cloud mogą być udostępniane w oparciu o różne modele, takie jak: • Infrastruktura jako usługa (IaaS - ang. Infrastructure as a Service) • Platforma jako usługa (PaaS - ang. Platform as a Service) • Oprogramowanie jako usługa (SaaS - ang. Software as a Service) • Dane jako usługa (DaaS - ang. Data as a Service) • Komunikacja jako usługa (CaaS - ang. Communication as a Service) gdzie w zależności od wybranego modelu usługobiorca może operować na poziomie systemu operacyjnego maszyn wirtualnych (IaaS) lub korzystać bezpośrednio z oprogramowania wysokiego poziomu uruchomionego na zdalnych maszynach (SaaS). Ze względu na brak jednoznacznych standardów wśród dostawców platform typu Cloud, użytkownicy stoją przed poważnych problemem uzależnienia się od pierwotnie wybranego dostawcy i utrudnionym korzystaniem z wielu dostawców jednocześnie w ramach jednej aplikacji (ang. vendor lock-in). Jednym z głównych problemów zarówno dotyczących środowisk Grid oraz Cloud, jest problem heterogeniczności opisów wszelkiego rodzaju zasobów, takich jak użytkownicy, sprzęt, dane, usługi czy procesy. Heterogeniczność ma charakter zarówno syntaktyczny, czyli różne aspekty systemów są opisane przy użyciu różnych standardów (np. XML, LDAP, JSON) oraz charakter semantyczny, mianowicie są opisane przy użyciu niekompatybilnych konceptualizacji. Powoduje to konieczność tłumaczenia metadanych pomiędzy tymi standardami w przypadku gdy konieczne jest np. uzyskanie odpowiedzi na pytanie dotyczące zasobów z różnych kategorii. W szczególności powoduje to, że tworzenie dynamicznych Organizacji Wirtualnych opartych o formalny kontrakt, mogący zawierać stwierdzenia dotyczące różnych zasobów jest bardzo utrudnione. W zakresie badań nad metadanymi istnieje wiele definicji oraz sposobów ich interpretacji. Jedna z bardziej uniwersalnych [11] proponuje traktować metadane jako: . . . dane, które opisują strukturę i procesy organizacji używających informacji, oraz które opisują systemy używane do zarządzania informacją. Definicja ta przyjmuje, że metadane nie muszą być tylko ”danymi o danych”, ale można je traktować również szerzej, jako dane o wszelakich zasobach będących istotną częścią 4 działania danej organizacji. Obecnie istnieje kilka standardów reprezentowania metadanych, wykorzystywanych w profesjonalnych systemach katalogowania informacji, takie jak: Text Encoding Initiative [24], Metadata Encoding and Transmission Standard [6], Machine Readable Cataloguing [5] czy CERIF [14]. W dziedzinie zarządzania zasobami informatycznymi również istnieją już standardy pozwalające na opisywanie całych infrastruktur jak i wybranych aspektów, takie jak Simple Knowledge Organization System (SKOS) [19], GLUE Schema [2] czy Common Information Model (CIM) [20]. Jednakże najczęściej w ramach jednej infrastruktury komputerowej wykorzystywanych jest wiele standardów jednocześnie do opisania różnych aspektów. Powoduje to utrudnione wyszukiwanie zasobów z różnych systemów (np. planowania wykonania zadania w środowisku Grid wymaga informacji o zasobach sprzętowych, ich aktualnym obciążeniu, praw dostępu do zasobów oraz lokalizacji danych wejściowych i wyjściowych). Z drugiej strony, istnieje obecnie wiele rozwiązań pozwalających na zaadresowanie heterogeniczności metadanych poprzez wykorzystanie technologii związanych z Siecią Semantyczną, takich jak RDF [21], OWL [12], OWL 2 [10], WSMO [17]. 4 Unifikacja metadanych w rozproszonych infrastrukturach komputerowych z zastosowaniem semantyki Złożoność istniejących środowisk komputerowych doprowadziła do współistnienia wielu niekompatybilnych standardów reprezentacji metadanych opisujących te środowiska. Wiodącą ideą tej pracy jest próba usprawnienia wielu scenariuszy użycia poprzez umożliwienie unifikacji metadanych przy użyciu technologi Sieci Semantycznej. Przykładem takiej heterogeniczności jest infrastruktura Grid oparta o środowisko Globus, co przedstawiono na Rysunku 1: Rysunek 1: Przykład współistnienia wielu standardów metadanych w ramach jednego środowiska Grid. W celu zaadresowania tego problemu w ramach tej pracy została opracowana specjalna 5 struktura ontologii umożliwiająca budowanie opisów semantycznych dotyczących różnych aspektów infrastruktur komputerowych (Rysunek 2). Ontology Generic Data Ontology Generic Service Ontology Generic Workflow Ontology Domain Application Ontology Domain Resource Ontology Domain Data Ontology Domain Service Ontology Domain Workflow Ontology Application Registry Resource Registry Data Registry Service Registry Workflow Registry Generic Application Ontology Generic Resource Rysunek 2: Zaproponowana struktura ontologii. Struktura zbudowana jest w oparciu o 2 wymiary. Pierwszy wymiar (poziomu) określa poziom ogólności danej ontologii, domyślnie przyjmuje się 3 poziomy: • Ogólny (ang. Generic) - zawiera pojęcia wspólne dla danej infrastruktury komputerowej, bez pojęć specyficznych dla konkretnych aplikacji czy dziedzin zastosowania. Pojęcia z tego poziomu są ’rozumiane’ przez komponenty warstwy pośredniej infrastruktury, • Domenowo-specyficzny (ang. Domain) - zawiera pojęcia dotyczące danej dziedziny aplikacyjnej (np. w ramach konkretnej Organizacji Wirtualnej). Pojęcia tworzone na tym poziomie powinny w miarę możliwości korzystać z bardziej ogólnych pojęć warstwy ogólnej (takich jak np. usługa, plik, zadanie), dzięki czemu będą rozpoznawalne przez komponenty warstwy pośredniej, • Rejestr (ang. Registry) - na tym poziomie znajdują się instancje pojęć z warstw wyższych reprezentujące instancje rzeczywistych lub wirtualnych obiektów z danej dziedziny (np. pliki, zasoby sprzętowy, usługi, procesy, itp.) Przykład wykorzystania tego podejścia na przykładzie aplikacji monitorowania i optymalizacji ruchu drogowego w mieście jest przedstawiony na Rysunku 3. W ramach pracy zostały opracowane szczegółowe ontologie poziomu ogólnego, w zależności od możliwości wykorzystujące istniejące ontologie. 6 Application Data Resource Resource Service Storage Object Data Registry Domain specific Generic Location DataObject Transform Format Urban Location Profile Format Conversion Output BinaryFormat Worklfow RLSFile RealWorld Resource Service Input DataObject AVI Surveillance Camera Workflow parameterType OnewayStreet Surveillance Video hasFormat lfn:scv001.avi ViaGaribaldi SC0004 MPEGOutput hasOutput SCV001 AVIInput hasInput isStoredIn atLocation fromCamera contains SCV001.avi AVI2MPEGProfile - class - subClassOf - individual - instanceOf Wf001 AVI2MPEGService presentedBy contains - property Rysunek 3: Przykład złożonej ontologii zgodnej z zaproponowaną strukturą. W przypadku ontologii zasobów opracowano i zaimplementowano w ramach pracy odwzorowanie standardu Common Information Model (CIM) do postaci semantycznej (OWL) (patrz Tabela 1). Standard CIM jest modelem pozwalającym modelować złożone infrastruktury komputerowe opartym o Managed Object Format. W oparciu o opracowane mapowanie zaimplementowano również narzędzie CIM2OWL pozwalające na dynamiczną konwersję zasobów opisanych w standardzie CIM do postaci semantycznej. 5 Zarządzanie semantycznymi metadanymi przy użyciu bazy wiedzy W celu umożliwienia zastosowania zaproponowanej w poprzednim rozdziale struktury ontologii, konieczne jest odpowiednie wsparcie ze strony bazy wiedzy wykorzystywanej do zarządzania taką ontologią. W ramach tej rozprawy opracowano rozproszoną bazę wiedzy o nazwie GOM, cechującą się m.in.: • rozproszeniem wspierającym zaproponowaną strukturę zależności pomiędzy poszczególnymi ontologiami, • możliwość wsparcia dla różnych mechanizmów przechowywania danych oraz silników wnioskujących, • wsparcie dla ewolucji wiedzy. 7 Tabela 1: Definicja mapowania ze standardu CIM do OWL. CIM Artifact OWL Construct Class <owl:Class> Generalization Association (Aggregation, Composition) <rdfs:subClassOf> <owl:Class rdf:ID="..."> <rdfs:subClassOf rdf:resource="cim-meta:CIM_Association/> </owl:Class> Property <owl:DatatypeProperty> REF Property <owl:ObjectProperty> Method <cim-meta:hasMethod> Default Value <cim-meta:defaultValue> Override <rdfs:subPropertyOf> Key <owl:InverseFunctionalProperty> Min, Max <owl:minCardinality>, <owl:maxCardinality> <cim-meta:CIM_Value> composed of <cim-meta:value> and <cim-meta:valueMap> ValueMap, Values Deprecated Required Experimental Alias <owl:deprecatedClass> or <owl:deprecatedProperty> <owl:minCardinality rdf:datatype="&xsd;int">1 </owl:minCardinality> <cim-meta:Experimental> <owl:equivalentClass>, <owl:equivalentProperty> or <owl:sameAs> ModelCorrespondence <rdfs:seeAlso> Read, Write <cim-meta:readable>, <cim-meta:writeable> Version <cim-meta:cimVersion> Abstract <cim-meta:Abstract> Units <rdfs:comment> Vectors <rdfs:comment> 8 Architektura bazy wiedzy GOM jest przedstawiona na Rysunku 4. GOM Clients GOM Infrastructure WS Proxy WSRF Proxy GOM Engine Admin Manager GOM Engine In Memory GOM GOM Engine Engine Apache In Derby Memory GOM Engine GOM Berkeley Engine DB MySQL Rysunek 4: Ogólna architektura bazy wiedzy GOM. Baza wiedzy jest podzielona na kilka komponentów funkcjonalnych: • Engine Manager - komponent odpowiedzialny za rejestrowanie i monitorowanie poszczególnych instancji komponentów, • GOM Engine - pojedynczy komponent bazy wiedzy zarządzający jedną ontologią (na poziomie taksonomii) lub rejestrem semantycznym (na poziomie instancji pojęć z ontologii), • GOM Admin - interfejs administratora, • Proxy - interfejs umożliwiający dostęp poprzez protokół SOAP, Najważniejszy komponent to GOM Engine, który w przypadku prostych systemów może działać samodzielnie przechowując całość informacji semantycznych. Jego budowa jest przedstawiona na Rysunku 5. Interfejs pojedynczego komponentu GOM Engine posiada 2 zasadnicze kanały: do modyfikacji bazy wiedzy oraz przeszukiwania bazy wiedzy. Wszystkie operacje modyfikacji 9 Query Event knowledge provision knowledge consumption Query Dispatcher Event Dispatcher Event handlers Create RDQL Change SPARQL Remove RDQL2OWL store State Event Model extract recover Model GOM Engine modify Rysunek 5: Budowa komponentu GOM Engine bazy wiedzy. pojedynczego komponentu są zapisywane w rejestrze Event Model, co pozwala na odtworzenie stanu bazy wiedzy z dowolnego momentu w przeszłości. State Model przechowuje aktualny stan danego komponentu ontologii i po każdej modyfikacji wykonuje wnioskowanie przy użyciu silnika wnioskującego w zależności od konfiguracji. Oprócz wymagań funkcjonalnych nie bez znaczenia pozostaje wydajność bazy wiedzy. W celu oszacowania możliwości bazy wiedzy GOM zostały przeprowadzone szczegółowe testy wydajnościowe w wielu różnych konfiguracjach. Wykresy 6 oraz 7 przedstawiają odpowiednio czasy potrzebne na dodanie 100 nowych obiektów do bazy wiedzy oraz czasy wnioskowania po modyfikacji bazy wiedzy w zależności od aktualnego rozmiaru bazy wiedzy. 10 30 25 Time [s] 20 15 10 5 0 00 700 InMemory-Jena InMemory-Pellet MySQL-Jena MySQL-Pellet 0 0 600 00 500 00 400 00 300 0 00 0 200 100 0 100 Knowledge base size (resource descriptions) ApacheDerby-Jena ApacheDerby-Pellet BerkeleyDB-Jena BerkeleyDB-Pellet Rysunek 6: Czas dodania 100 instancji dla różnych konfiguracji 600 500 Time [s] 400 300 200 100 0 0 600 0 700 0 0 0 00 500 0 400 00 300 0 00 0 200 100 0 100 Knowledge base size (resource descriptions) InMemory-Jena InMemory-Pellet MySQL-Jena MySQL-Pellet ApacheDerby-Jena ApacheDerby-Pellet BerkeleyDB-Jena BerkeleyDB-Pellet Rysunek 7: Czasy wnioskowania dla różnych konfiguracji Z testów wynika jasno, że w przypadku danych semantycznych bardzo ważne jest zachowanie odpowiedniego kompromisu pomiędzy persystencją danych, złożonością wnioskowania oraz wydajnością zapytań i modyfikacji wiedzy. Jednym z przykładów zastosowania opisywanej bazy wiedzy oraz zaproponowanej struktury ontologii jest umożliwienie interoperabilności heterogenicznych infrastruktur typu Grid. W ramach tej pracy zaproponowano szczegółowe rozwiązanie polegające na stworzeniu w oparciu o bazę wiedzy GOM warstwy pośredniczącej o nazwie Grid Abstraction Layer pomiędzy infrastrukturą europejską (EGEE) oraz chińską (VEGA) (patrz Rysunek 8). 11 VEGA EGEE MyProxy C WMS B D GRAM H CLI E T F CE S L L&B U RC M N O SE P Input File W Grid Abstraction Layer A I G Grip Mngmnt J K gLite proxy Job R V Output File SE Rysunek 8: Przykład interoperabilności pomiędzy EGEE oraz VEGA podczas wykonywania zadania obliczeniowego. Istotnym problemem w przypadku zastosowania technologii semantycznych w istniejących systemach, jest konwersja i transfer metadanych, istniejących w typowych standardach bazodanowych takich jak bazy relacyjne, katalogi LDAP czy dokumenty XML do postaci semantycznej. W celu usprawnienia tego procesu w ramach tej pracy zostało zaprojektowane oraz zintegrowane z bazą wiedzy GOM narzędzie o nazwie X2R pozwalające na integrację danych przechowywanych w wyżej wymienionych źródłach danych do postaci semantycznej. Architektura narzędzia jest zaprezentowana na Rysunku 9. Rysunek 9: Ogólna architektura narzędzia X2R. 6 Semantyczna platforma dla Organizacji Wirtualnych Zaproponowane w poprzednich rozdziałach podejście polegające na unifikacji opisów semantycznych otwiera drogę do nowych podejść do wykorzystania infrastruktur kompute12 rowych dużej skali. Jedną z takich możliwości jest umożliwienie budowy dynamicznych Organizacji Wirtualnych na heterogenicznych infrastrukturach komputerowych typu Grid czy Cloud. Dzięki zunifikowaniu opisów zasobów i procesów tych infrastruktur i organizacji możliwe jest opracowanie standardu opisu zasad współpracy partnerów w ramach takie organizacji poprzez utworzenie formalnego kontraktu. W ramach tej pracy opracowane zostało środowisko o nazwie FiVO (Framework for Intelligent Virtual Organizations), oparte na bazie wiedzy GOM, umożliwiające wsparcie dla wszystkich elementów cyklu Organizacji Wirtualnej takich jak incepcja, wykonanie, ewolucja i rozwiązanie, w szczególności: • Grupowanie organizacji w zależności od ich zainteresowań (Virtual Breeding Environments - VBE) • Wsparcie dla wyszukiwania organizacji spełniających określone kryteria • Możliwość budowy Organizacji Wirtualnych w sposób dynamiczny • Wsparcie dla procesu negocjacji kontraktu Organizacji Wirtualnej w sposób rozproszony • Automatyzacja procesu uruchomienia Organizacji Wirtualnej w zakresie infrastruktury bezpieczeństwa oraz monitorowania • Weryfikacja i monitorowanie procesu wykonania Organizacji Wirtualnej w sensie zgodności z wynegocjowanym kontraktem Architektura FiVO jest przedstawiona na Rysunku 10. Środowisko jest stworzone w architekturze SOA, co zapewnia dużą interoperabilność w różnorodnych aplikacjach. Komunikacja pomiędzy poszczególnymi komponentami platformy opiera się na szynie ESB (Enterprise Service Bus). Każda organizacja może posiadać własną instancję FiVO, dzięki czemu ma pełną kontrolę nad własnymi danymi i metadanymi. Poszczególne komponenty FiVO to: • Negotiations GUI - interfejs do negocjacji zaimplementowany w środowisku Eclipse, • NLPN - komponent wspierający negocjacje w języku naturalnym, • DCNS - komponent pozwalający na rozproszone negocjacje pomiędzy organizacjami, • VBE Registry - instancja bazy wiedzy GOM zawierająca rejestr danego inkubatora organizacji wirtualnych, 13 FiVO Negotiations GUI translate Sentence NLPN query GOM add OWL contract query GOM (send, accept) invitation (join, leave) VBE (add, modify, reject) contract statement VO Management and Deployment new VO Contract Organization Registry query GOM add OWL contract (add, modify, reject) contract statement SECE VO Contract convert (LDAP, XML, RDBMS) to OWL VBE Registry SLAM query GOM query GOM query GOM (join, leave) VBE DCNS GOM X2R Rysunek 10: Architektura systemu FiVO. • Organization Registry - instancja bazy wiedzy GOM przechowująca rejestr zasobów organizacji, • VO Contract - instancja bazy wiedzy GOM przechowująca kontrakt VO, • X2R - wtyczka do bazy wiedzy GOM pozwalająca na pozyskiwanie, semantycznych metadanych z niesemantycznych źródeł danych takich jak bazy relacyjne, katalogi LDAP czy dokumenty XML, • SECE - komponent pozwalający na automatyczną konfigurację warstwy bezpieczeństwa w zakresie autoryzacji dostępu do zasobów na podstawie wynegocjowanego kontraktu, • SLAM - komponent monitorujący wykonywanie Organizacji Wirtualnej w sensie zgodności z wynegocjowanym kontraktem. Proces negocjacji odbywa się w sposób asynchroniczny, poprzez tworzenie i modyfikowanie stwierdzeń kontraktów. Każde stwierdzenie jest zdefiniowane formalnie w postaci odpowiedniej instancji ontologi kontraktu. Ontologia kontraktu posiada zbiór pojęć i relacji określających możliwe stwierdzenia (patrz Rysunek 11). Poszczególne stany procesu negocjacji przedstawione są na Rysunku 12. Przykład stwierdzenia kontraktu dotyczącego autoryzacji jest przedstawiony poniżej. <ContractOntology:SecurityStatement rdf:about="#SEC_S_01"> <ContractOntology:hasAuthorizationPolicy rdf:resource="#SEC_A_01"/> </ContractOntology:SecurityStatement> <SecurityOntology:AuthorizationPolicy rdf:about="#SEC_A_01"> <SecurityOntology:appliesToResource rdf:resource="#SEC_O_01"/> <SecurityOntology:hasRule rdf:resource="#SEC_R_01"/> <SecurityOntology:hasRule rdf:resource="#SEC_R_02"/> 14 Contract Ontology Contract statements Contract ApplicationDeployment ResourceProvision hasStatement ContractStatement hasSignature VOLifetime AuthorizationPolicy RoleAssignment DefinitionStatement ContractSignature PenaltyClause KnowledgeSource StatementCondition SecurityRequirement RoleDefinition QoSStatement Rysunek 11: Struktura ontologii kontraktu define VO Goal (VO Administrator) invite Partners (VO Administrator) Negotiations Initiated Participants Accepted invite Partners (VO Administrator) start Negotiations (VO Administrator) statement Created (VO Participant) insufficient Participants (VO Administrator) statement Modified (VO Participant) cancel Negotiations (VO Administrator) Negotiations Paused Negotiations Ongoing statement Accepted (VO Participant) participant Resigned (VO Participant) statement Rejected (VO Participant) statement Rejected (VO Participant) [ all Statements Accepted ] statement Created (VO Participant) [ all Partners Accepted ] Negotiations Accepted Contract Accepted deploy VO (VO Administrator) Rysunek 12: Możliwe stany procesu negocjacji </SecurityOntology:AuthorizationPolicy> <SecurityOntology:AuthorizationObject rdf:about="#SEC_O_01"> <rdf:type rdf:resource="&TravelCNO;AccomodationManagingApplication"/> </SecurityOntology:AuthorizationObject> 15 <owl:Thing rdf:about="#SEC_R_01"> <rdf:type rdf:resource="&SecurityOntology;Rule"/> <SecurityOntology:appliesToAction rdf:resource="&TravelCNO;checkFreeVacancies "/> <SecurityOntology:hasCondition rdf:resource="#SEC_C_02"/> </owl:Thing> <owl:Thing rdf:about="#SEC_R_02"> <rdf:type rdf:resource="&SecurityOntology;Rule"/> <SecurityOntology:appliesToAction rdf:resource="&TravelCNO;bookVacancies"/> <SecurityOntology:appliesToAction rdf:resource="&TravelCNO;checkFreeVacancies "/> <SecurityOntology:hasCondition rdf:resource="#SEC_C_01"/> </owl:Thing> <owl:Thing rdf:about="#SEC_C_01"> <rdf:type rdf:resource="&SecurityOntology;Condition"/> <SecurityOntology:appliesToSubject rdf:resource="#TourManager"/> </owl:Thing> <owl:Thing rdf:about="#SEC_C_02"> <SecurityOntology:appliesToSubject rdf:resource="#Client"/> </owl:Thing> Stwierdzenia kontraktu mogą odwoływać się do zasobów opisanych w ramach zunifikowanej warstwy metadanych, dzięki czemu dalsze kroki przetwarzania kontraktu mające na celu automatyczne utworzenie i uruchomienie Organizacji Wirtualnej potrafią dobrze zinterpretować znaczenie poszczególnych elementów kontraktu. 7 Podsumowanie Podsumowując, główne osiągnięcia przedstawionej pracy doktorskiej to: • Specyfikacja oraz implementacja modularnej architektury unifikacji metadanych przy użyciu technologii Sieci Semantycznej, wspierającą zarządzanie informacjami o zasobach, umożliwiając lepsze zarządzanie danymi, wyszukiwanie usług czy koordynowanie procesów. • Projekt oraz implementacja rozproszonej bazy wiedzy wspierającej zaproponowaną strukturą metadanych. • Projekt i implementacja metody konwersji standardu Common Information Model do języka Web Ontology Language (OWL). • Projekt narzędzia do pół-automatycznej translacji informacji z postaci relacyjnej, LDAP oraz XML to postaci semantycznej. 16 • Projekt i implementacja środowiska do zarządzania Organizacjami Wirtualnymi wspierającego dynamiczne budowanie kolaboracji opartych na rozproszonych infrastrukturach komputerowych. • Projekt i rozwój środowiska do negocjacji kontraktu dla potrzeb dynamicznych Organizacji Wirtualnych. • Projekt systemu autentykacji i autoryzacji opartego na wynegocjowanym kontrakcie w ramach Organizacji Wirtualnych. Niniejsza praca pokazuje, że zaproponowane w tezie zunifikowane podejście do zarządzania metadanymi w rozproszonych infrastrukturach informatycznych dużej skali może znacznie usprawnić zarządzanie zasobami oraz budowanie Organizacji Wirtualnych opartych o heterogeniczne środowiska komputerowe. Po pierwsze, zaproponowana zunifikowana struktura ontologii pozwala na utworzenie warstwy abstrakcji pokrywającej różne aspekty infrastruktury informatycznej od komponentów warstwy pośredniej operujących na pojęciach abstrakcyjnych do domenowospecyficznych pojęć z poziomu konkretnych aplikacji. Co więcej, opracowana architektura oraz implementacja rozproszonej bazy wiedzy GOM, umożliwia efektywne przechowywanie i zarządzanie zunifikowanymi metadanymi zgodnie z zaproponowaną strukturą ontologii. Ostatecznie, opracowany system do dynamicznego tworzenia Organizacji Wirtualnych o nazwie FiVO, wspiera wybór partnerów, negocjację kontraktu, oraz uruchomienie i nadzorowanie wykonania Organizacji Wirtualnej na podstawie wynegocjowanego kontraktu reprezentowanego w sposób semantyczny przy wykorzystaniu zunifikowanego podejścia do reprezentacji metadanych. Wyniki zaprezentowane w tej pracy zostały sprawdzone w wielu krajowych i europejskich projektach badawczych, takich jak: EU-IST FP6 K-Wf Grid (Knowledge-based Workflow System for Grid Applications, numer kontraktu 511385), EU-IST FP6 Gredia (GRid enabled access to rich mEDIA content, numer kontraktu 34363), POIG ITSOA (numer kontraktu POIG.01.03.01-00-008/08) oraz POIG PL-Grid (numer kontraktu POIG.02.03.00-00-007/08-00). W zakresie przyszłego rozwoju zaprezentowanej pracy, pojawia się szereg możliwości. Po pierwsze, proces negocjacji może być zautomatyzowany, np. poprzez implementację sytemu agentowego, gdzie poszczególne agenty reprezentują daną organizację oraz posługują się konceptualizacją domeny według ontologii przechowywanych w ramach inkubatora Organizacji Wirtualnych dając w wyniku zapisany formalnie kontrakt zgodny z zaproponowaną ontologia kontraktu. Kluczowym czynnikiem w tym przypadku jest opracowanie sposobu reprezentacji funkcji celu poszczególnych agentów, tak aby możliwe było automatyczne negocjowanie nie tylko aspektów niefunkcjonalnych kontraktu (takich jak koszt czy 17 czas), ale również funkcjonalnych (np. jak jakie usługi są potrzebne aby zrealizować cele stawiane przed daną Organizacją Wirtualną?). Po drugie, rozwinąć można samą bazę wiedzy GOM o nowe silniki wnioskujące lub standardy reprezentacji metadanych takie jak OWL 2. Dodatkowo, rozwinąć można narzędzie X2R o dodatkowe mechanizmy przechowywania danych takie jak bazy NoSQL czy bazy obiektowe. 18 Literatura [1] Roberto Alfieri, Roberto Cecchini, Vincenzo Ciaschini, Luca dell’Agnello, Ákos Frohner, Alberto Gianoli, Károly Lörentey, and Fabio Spataro. Voms, an authorization system for virtual organizations. In European Across Grids Conference, pages 33–40, 2003. [2] S. Andreozzi, S. Burke, L. Field, S. Fisher, B. Kónya, M. Mambelli, J.M. Schopf, M. Viljoen, and A. Wilson. GLUE Schema Specification - Version 1.2. http://glueschema.forge.cnaf.infn.it/ Spec/V12, Accessed on 15/10/2012, December 2005. [3] Krzysztof Benedyczak, Marcin Lewandowski, Aleksander Nowinski, and Piotr Bala. Unicore virtual organizations system. In Roman Wyrzykowski, Jack Dongarra, Konrad Karczewski, and Jerzy Wasniewski, editors, Parallel Processing and Applied Mathematics, volume 6068 of Lecture Notes in Computer Science, pages 155–164. Springer Berlin / Heidelberg, 2010. [4] Bartosz Bosak, Jan Konczak, Krzysztof Kurowski, Mariusz Mamonski, and Tomasz Piontek. Highly integrated environment for parallel application development using qoscosgrid middleware. In Marian Bubak, Tomasz Szepieniec, and Kazimierz Wiatr, editors, PL-Grid, volume 7136 of Lecture Notes in Computer Science, pages 182–190. Springer, 2012. [5] Karen Coyle. MARC21 as Data: A Start. Code4lib journal, (14). [6] Digital Library Federation. Metadata encoding and transmission standard: Primer and reference manual, September 2007. [7] Jack Dongarra, Pete Beckman, Terry Moore, Patrick Aerts, Giovanni Aloisio, David Barkai, Taisuke Boku, Barbara Chapman, Xuebin Chi, Alok Choudhary, Sudip Dosanjh, Thom Dunning, Ro Fiore, Al Geist, Robert Harrison, Mark Hereld, Michael Heroux, Koh Hotta, Yutaka Ishikawa, Zhong Jin, Fred Johnson, Sanjay Kale, Richard Kenway, David Keyes, Bill Kramer, Jesus Labarta, Alain Lichnewsky, Bob Lucas, Satoshi Matsuoka, Paul Messina, Peter Michielse, Bernd Mohr, Matthias Mueller, John Shalf, David Skinner, Marc Snir, Thomas Sterling, Rick Stevens, Fred Streitz, Bob Sugar, Aad Van Der Steen, Jeffrey Vetter, Peg Williams, Robert Wisniewski, and Kathy Yelick. International Exascale Software Project Roadmap 1.0. Technical report, May 2010. [8] Ian T. Foster, Carl Kesselman, and Steven Tuecke. The anatomy of the grid - enabling scalable virtual organizations. CoRR, cs.AR/0103025, 2001. [9] John F. Gantz, Christopher Chute, Alex Manfrediz, Stephen Minton, David Reinsel, Wolfgang Schlichting, and Anna Toncheva. An updated forecast of worldwide information growth through 2011, May 2008. [10] B. Grau, I. Horrocks, B. Motik, B. Parsia, P. Patelschneider, and U. Sattler. Owl 2: The next step for owl. Web Semantics: Science, Services and Agents on the World Wide Web, 6(4):309–322, November 2008. [11] D.C. Hay. Data Model Patterns: A Metadata Map. The Morgan Kaufmann Series in Data Management Systems Series. Elsevier Morgan Kaufmann, 2006. [12] Jeff Heflin. Web ontology language (owl) use cases and requirements. World Wide Web Consortium, Recommendation REC-webont-req-20040210, February 2004. [13] Martin Hilbert and Priscila Lopez. The world’s technological capacity to store, communicate, and compute information. Science, 332(6025):60–65, April 2011. [14] Brigitte Jörg. CERIF: The common european research information format model. Data Science Journal, 9:CRIS24–CRIS31, 2010. [15] Carl Kesselman and Ian Foster. The Grid: Blueprint for a New Computing Infrastructure. Morgan Kaufmann Publishers, November 1998. [16] E. Laure, C. Gr, S. Fisher, A. Frohner, P. Kunszt, A. Krenek, O. Mulmo, F. Pacini, F. Prelz, J. White, M. Barroso, P. Buncic, R. Byrom, L. Cornwall, M. Craig, A. Di Meglio, A. Djaoui, F. Giacomini, J. Hahkala, F. Hemmer, S. Hicks, A. Edlund, A. Maraschini, R. Middleton, M. Sgaravatto, M. Steenbakkers, J. Walk, and A. Wilson. Programming the grid with glite. In Computational Methods in Science and Technology, 2006. 19 [17] Holger Lausen and Axel Polleres. Web service modeling ontology (wsmo). http://www.w3.org/Submission/WSMO/, June 2005. available at: [18] Peter Mell and Timothy Grace. The NIST definition of cloud computing, 2011. [19] Alistair Miles and Sean Bechhofer. SKOS Simple Knowledge Organization System reference. http: //www.w3.org/TR/2009/REC-skos-reference-20090818/, Accessed on 15/09/12, August 2009. [20] Robin Podmore, David Becker, Rob Fairchild, and Marck Robinson. Common information model: A developer’s perspective. In HICSS, 1999. [21] Shelley Powers. Practical RDF: Solving Problems with the Resource Description Framework. O’Reilly, Beijing, 2003. [22] Spencer Reiss. Cloud Computing. Available at Amazon.com Today, 2008. [23] Achim Streit, Piotr Bala, Alexander Beck-Ratzka, Krzysztof Benedyczak, Sandra Bergmann, Rebecca Breu, Jason Daivandy, Bastian Demuth, Anastasia Eifer, André Giesler, Björn Hagemeier, Sonja Holl, Valentina Huber, Nadine Lamla, Daniel Mallmann, Ahmed Memon, Mohammad Memon, Michael Rambadt, Morris Riedel, Mathilde Romberg, Bernd Schuller, Tobias Schlauch, Andreas Schreiber, Thomas Soddemann, and Wolfgang Ziegler. Unicore 6 — recent and future advancements. Annals of Telecommunications, 65:757–762, 2010. [24] Text Encoding Initiative. 18/09/2012. P5 guidelines. http://www.tei-c.org/Guidelines/P5/, Retrieved 20 Lista publikacji autora rozprawy [1] Witold Alda, Krzysztof Boryczko, Jacek Kitowski, Bartosz Kryza, and Renata Słota. Parallel and distributed calculations based on multicore computer architecture and service paradigm (in polish). In Kierunki działanośći i współpraca naukowa Wydziału Elektrotechniki, Automatyki, Informatyki i Elektroniki, materiały konferencji zorganizowanej z okazji Jubileuszu 90-lecia AGH, Kraków, 28-29 May, 2009, pages 171–174. Delta, Kraków, 2009. [2] Marian Babik, Ladislav Hluchy, Jacek Kitowski, and Bartosz Kryza. WSRF2OWL-S: A framework for generating semantic descriptions of web and grid services. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’05, November 20-23 2005, pages 49–56. ACC Cyfronet AGH, 2006. [3] Marian Babik, Ladislav Hluchy, Jacek Kitowski, and Bartosz Kryza. Generating semantic descriptions of web and grid services. In Péter Kacsuk, Thomas Fahringer, and Zsolt Németh, editors, Proc. of 6th Biannual Austrian-Hungarian Workshop on Distributed and Parallel Systems, DAPSYS 2006, pages 93–102. Springer US, 2007. [4] Łukasz Dutka, Bartosz Kryza, Renata Słota, Marta Majewska, Ladislav Hluchy, and Jacek Kitowski. Component-expert architecture for supporting grid workflow construction based on knowledge. In P. Cunningham and M. Cunningham, editors, Innovation and the Knowledge Economy. Issues, Applications, Case Studies, eChallenges, pages 239–246. IOS Press, 2005. [5] Jakub Fibinger, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Automatic XACML-based authorization rules deployment in Virtual Organizations. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’10, October 11-13 2010, Cracow, Poland, pages 151–158. ACC Cyfronet AGH, 2011. [6] Jakub Fibinger, Bartłomiej Puzoń, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Virtual Organization security layer deployment assistance. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’09, October 12-14 2009, Cracow, Poland, pages 88–95. ACC Cyfronet AGH, 2010. [7] Włodzimierz Funika, Bartosz Kryza, Renata Słota, Jacek Kitowski, Kornel Skałkowski, Jakub Sendor, and Dariusz Król. Monitoring of SLA parameters within VO for the SOA paradigm. In Roman Wyrzykowski, Jack Dongarra, Konrad Karczewski, and Jerzy Wasniewski, editors, Proc. of Intl Conf. on Parallel Processing and Applied Mathematics, PPAM, volume 6068 of Lecture Notes in Computer Science, pages 115–124. Springer Berlin / Heidelberg, 2010. [8] Emil Gatial, Branislav Simo, G. Nguyen, Michal Laclavik, Thomas Linden, and Bartosz Kryza. K-Wf Grid portal: a web interface to semantic workflows. In Marian Bubak and Steffen Unger, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-18 2006, The Knowledge-based Workflow System for Grid Applications, pages 131–137. ACC Cyfronet AGH, 2007. [9] Ladislav Hluchy, Marcel Kvassay, Stefan Dlugolinsky, Bernhard Schneider, Holger Bracker, Bartosz Kryza, and Jacek Kitowski. Handling internal complexity in highly realistic agent-based models of human behaviour. In Proc. of 6th IEEE International Symposium on Applied Computational Intelligence and Informatics (SACI), 2011, pages 11–16. May 2011. [10] Ladislav Hluchy, Marcel Kvassay, S̆tefan Dlugolinský, Bernhard Schneider, Holger Bracker, Bartosz Kryza, and Jacek Kitowski. Towards more realistic human behaviour simulation: Modelling concept, deriving ontology and semantic framework. In Radu-Emil Precup, Szilveszter Kovács, Stefan Preitl, and Emil M. Petriu, editors, Applied Computational Intelligence in Engineering and Information Technology, volume 1 of Topics in Intelligent Engineering and Informatics, pages 1–17. Springer Berlin Heidelberg, 2012. [11] Jacek Kitowski and Bartosz Kryza. Dynamic Virtual Organization management framework supporting distributed industrial collaborations. Computer Methods in Materials Science, 11(4):514–523, 2011. [12] Krzysztof Krawczyk, Renata Słota, Marta Majewska, Bartosz Kryza, and Jacek Kitowski. Grid Organization Memory for knowledge management for grid environment. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’04, December 13-15 2004, pages 109–115. ACK Cyfronet AGH, 2005. 21 [13] Dariusz Król, Bartosz Kryza, Kornel Skałkowski, Darin Nikolow, Renata Słota, and Jacek Kitowski. QoS provisioning for data-oriented applications in PL-Grid. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’10, October 11-13 2010, Cracow, Poland, pages 142–150. ACC Cyfronet AGH, 2011. [14] Dariusz Król, Bartosz Kryza, Michał Wrzeszcz, Łukasz Dutka, and Jacek Kitowski. Elastic infrastructure for interactive data farming experiments. Procedia Computer Science, 9(0):206 – 215, 2012. [15] Dariusz Król, Renata Słota, Bartosz Kryza, Darin Nikolow, Włodzimierz Funika, and Jacek Kitowski. Policy driven data management in pl-grid virtual organizations. In Franco Davoli, Marcin Lawenda, Norbert Meyer, Roberto Pugliese, Jan Węglarz, and Sandro Zappatore, editors, Remote Instrumentation for eScience and Related Aspects, pages 257–266. Springer New York, 2012. [16] Dariusz Król, Michał Wrzesz, Bartosz Kryza, Łukasz Dutka, and Jacek Kitowski. Massively scalable platform for data farming supporting heterogeneous infrastructure. In The Fourth International Conference on Cloud Computing, GRIDs, and Virtualization, IARIA Cloud Computing 2013, pages 144–149, Valencia, Spain, 2013. [17] Dariusz Król, Michał Wrzeszcz, Bartosz Kryza, Łukasz Dutka, and Jacek Kitowski. Scalarm: massively self-scalable platform for data farming. In Marian Bubak, Michał Turała, and Kazimierz Wiatr, editors, Cracow’12 Grid Workshop : October 22–24, 2012, Krakow, Poland, pages 53—-54. Academic Computer Centre CYFRONET AGH, 2012. [18] Dariusz Król, Michal Wrzeszcz, Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Scalarm: scalable platform for data farming. In KU KDM 2013 : sixth ACC Cyfronet AGH user’s conference : Zakopane, 28 February – 1 March 2013, page 48, 2013. [19] Bartosz Kryza. Mono i DotGNU. Technologie .NET na zasadach Open Source (in polish). Magazyn Software 2.0 Extra, 2:60–64, 2002. [20] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Supporting knowledge-based dynamic virtual organizations with contracts. In P. Cunningham and M. Cunningham, editors, Innovation and the Knowledge Economy. Issues, Applications, Case Studies, eChallenges, pages 937–944. IOS Press, 2007. [21] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Security focused dynamic Virtual Organizations in the grid based on contracts. In P. Cunningham and M. Cunningham, editors, Innovation and the Knowledge Economy. Issues, Applications, Case Studies, volume 5 of eChallenges, pages 1153–1160. IOS Press, 2008. [22] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Supporting management of dynamic Virtual Organizations in the grid through contracts. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-17 2007, Cracow, Poland, pages 140–147. ACC Cyfronet AGH, 2008. [23] Bartosz Kryza, Łukasz Dutka, Renata Słota, and Jacek Kitowski. Dynamic VO establishment in distributed heterogeneous business environments. In Gabrielle Allen, Jaroslaw Nabrzyski, Edward Seidel, Geert van Albada, Jack Dongarra, and Peter Sloot, editors, Proc. of Intl Conf. on Computational Science, ICCS 2009, volume 5545 of Lecture Notes in Computer Science, pages 709–718. Springer Berlin / Heidelberg, 2009. [24] Bartosz Kryza, Łukasz Dutka, Renata Słota, Jan Pieczykolan, and Jacek Kitowski. GVOSF: Grid Virtual Organization Semantic Framework for knowledge support. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-18 2006, Cracow, Poland, pages 104–110. ACC Cyfronet AGH, 2007. [25] Bartosz Kryza and Jacek Kitowski. Comparison of information representation formalisms for scalable file agnostic information infrastructures. Computing and Informatics, Accepted for print. Impact Factor: 0.254. [26] Bartosz Kryza, Dariusz Król, Michał Wrzeszcz, Łukasz Dutka, and Jacek Kitowski. Interactive cloud data farming environment for military mission planning support. Computer Science : kwartalnik Akademii Górniczo-Hutniczej imienia Stanisława Staszica w Krakowie, 13(3):89—-100, 2012. 22 [27] Bartosz Kryza, Marta Majewska, Renata Słota, and Jacek Kitowski. Unifying grid metadata representations through ontologies. In Roman Wyrzykowski, Jack Dongarra, Norbert Meyer, and Jerzy Wasniewski, editors, Proc. of Intl Conf. on Parallel Processing and Applied Mathematics, PPAM, volume 3911 of Lecture Notes in Computer Science, pages 683–690. Springer Berlin / Heidelberg, 2006. [28] Bartosz Kryza, Antoni Myłka, Alina Świderska Myłka, and Jacek Kitowski. Application of unified metadata grid framework supporting resource discovery and matchmaking. In Proceedings of 3rd ACC Cyfronet AGH users’ conference, Zakopane, March 18-19 2010, page 36. ACC Cyfronet AGH, 2010. [29] Bartosz Kryza, Jan Pieczykolan, Marian Babik, Marta Majewska, Renata Słota, Ladislav Hluchy, and Jacek Kitowski. Managing semantic metadata in K-Wf Grid with Grid Organizational Memory. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’05, November 20-23 2005, pages 66–73. ACC Cyfronet AGH, 2006. [30] Bartosz Kryza, Jan Pieczykolan, and Jacek Kitowski. Grid Organizational Memory: A versatile solution for ontology management in the grid. Proc. of Second IEEE International Conference on e-Science and Grid Computing, e-Science’06, page 16, 2006. [31] Bartosz Kryza, Jan Pieczykolan, Marta Majewska, Renata Słota, Marian Babik, Adrian Toth, Jacek Kitowski, and Ladislav Hluchy. Grid Organizational Memory - semantic framework for metadata management in the grid. In Marian Bubak and Steffen Unger, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-18 2006, The Knowledge-based Workflow System for Grid Applications, pages 74–81. ACC Cyfronet AGH, 2007. [32] Bartosz Kryza, Jan Pieczykolan, Jakub Wach, Mikołaj Zuzek, and Jacek Kitowski. Peer-to-peer distribution model for Grid Organizational Memory knowledge base. In Marian Bubak and Steffen Unger, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-18 2006, The Knowledgebased Workflow System for Grid Applications, pages 90–97. ACC Cyfronet AGH, 2007. [33] Bartosz Kryza, Łukasz Skitał, Jacek Kitowski, Maozhen Li, and Takebumi Itagaki. Analysis of interoperability issues between EGEE and VEGA grid infrastructures. In Michael Gerndt and Dieter Kranzlmuller, editors, Proc. of Intl Conf. on High Performance Computing and Communications, volume 4208 of Lecture Notes in Computer Science, pages 793–802. Springer Berlin / Heidelberg, 2006. [34] Bartosz Kryza, Renata Słota, Marta Majewska, Jan Pieczykolan, and Jacek Kitowski. Grid Organizational Memory - provision of a high-level grid abstraction layer supported by ontology alignment. Future Gener. Comput. Syst., 23:348–358, March 2007. Impact Factor: 2.033. [35] Marcel Kvassay, Ladislav Hluchy, Bartosz Kryza, Jacek Kitowski, Martin Seleng, Stefan Dlugolinsky, and Michal Laclavik. Combining object-oriented and ontology-based approaches in human behaviour modelling. In Proc. of 9th IEEE International Symposium on Applied Machine Intelligence and Informatics, SAMI 2011, pages 177–182. Jan 2011. [36] Marta Majewska, Bartosz Kryza, and Jacek Kitowski. On translation Common Information Model to OWL ontology. In Marian Bubak and Steffen Unger, editors, Proceedings of Cracow Grid Workshop CGW’06, October 15-18 2006, The Knowledge-based Workflow System for Grid Applications, pages 82–89. ACC Cyfronet AGH, 2007. [37] Marta Majewska, Bartosz Kryza, and Jacek Kitowski. Translation of Common Information Model to Web Ontology Language. In Yong Shi, Geert van Albada, Jack Dongarra, and Peter Sloot, editors, Proc. of Intl Conf. on Computational Science, ICCS 2007, volume 4487 of Lecture Notes in Computer Science, pages 414–417. Springer Berlin / Heidelberg, 2007. [38] Antoni Myłka, Alina Myłka, Bartosz Kryza, and Jacek Kitowski. Integration of heterogeneous data sources into an ontological knowledge base. Computing and Informatics, 31(1):189–223, 2012. Impact Factor: 0.254. [39] Mikołaj Pastuszko, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Processing and negotiation of natural language based contracts for Virtual Organizations. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’09, October 12-14 2009, Cracow, Poland, pages 104–111. ACC Cyfronet AGH, 2010. 23 [40] Mikołaj Pastuszko, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Natural language based processing of multilingual contracts for Virtual Organizations constitution. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’10, October 11-13 2010, Cracow, Poland, pages 117–125. ACC Cyfronet AGH, 2011. [41] Jan Pieczykolan, Łukasz Dutka, Bartosz Kryza, Krzysztof Korcyl, and Jacek Kitowski. Data dispatcher for real time applications in grid environment. In Poster presented at 7th Int. Conf. Computational Science, Beijing, China, volume Addnt’l CD, pages 47–54. 2007. [42] Jan Pieczykolan, Bartosz Kryza, and Jacek Kitowski. Semi-automatic creation of adapters for legacy application migration to integration platform using knowledge. In Vassil Alexandrov, Geert van Albada, Peter Sloot, and Jack Dongarra, editors, Proc. of Intl Conf. on Computational Science, ICCS 2006, volume 3994 of Lecture Notes in Computer Science, pages 252–259. Springer Berlin / Heidelberg, 2006. [43] Kornel Skałkowski, Jakub Sendor, Mikołaj Pastuszko, Bartłomiej Puzoń, Jakub Fibinger, Dariusz Król, Włodzimierz Funika, Bartosz Kryza, Renata Słota, and Jacek Kitowski. SOA-based support for dynamic creation and monitoring of Virtual Organization. In S. Ambroszkiewicz, J. Brzezinski, W. Cellary, A. Grzech, and K. Zielinski, editors, SOA Infrastructures Tools Concepts and Methods, pages 345–374. Poznan University of Economics Press, Poznan, 2010. [44] Kornel Skałkowski, Renata Słota, Dariusz Król, Michał Orzechowski, Bartosz Kryza, and Jacek Kitowski. Towards scalable, semantic-based virtualized storage resources provisioning. In Kazimierz Wiatr, Jacek Kitowski, and Marian Bubak, editors, KU KDM 2012 : fifth ACC Cyfronet AGH user’s conference : Zakopane, March 07–09, 2012, pages 76––77. ACC Cyfronet AGH, 2012. [45] Renata Słota, Dariusz Król, Kornel Skalkowski, Bartosz Kryza, Darin Nikolow, and Jacek Kitowski. FiVO/QStorMan: toolkit for supporting data-oriented applications in PL-Grid. In KU KDM 2011 : fourth ACC Cyfronet AGH users’ conference : Zakopane, March 09–11, 2011, page 6. ACK Cyfronet AGH, 2011. [46] Renata Słota, Dariusz Król, Kornel Skałkowski, Bartosz Kryza, Darin Nikolow, Michał Orzechowski, and Jacek Kitowski. A toolkit for storage QoS provisioning for data-intensive applications. In Marian Bubak, Tomasz Szepieniec, and Kazimierz Wiatr, editors, Building a National Distributed eInfrastructure–PL-Grid, volume 7136 of Lecture Notes in Computer Science, pages 157–170. Springer Berlin / Heidelberg, 2012. [47] Renata Słota, Dariusz Król, Kornel Skałkowski, Bartosz Kryza, Darin Nikolow, Michał Orzechowski, and Jacek Kitowski. A toolkit for storage QoS provisioning for data-intensive applications. Computer Science : kwartalnik Akademii Górniczo-Hutniczej imienia Stanislawa Staszica w Krakowie, 13(1):63– 73, 2012. [48] Renata Słota, Darin Nikolow, Jacek Kitowski, Dariusz Król, and Bartosz Kryza. FiVO/QStorMan semantic toolkit for supporting data-intensive applications in distributed environments. Computing and Informatics, 31(5):1003–1024, 2012. Impact Factor: 0.254. [49] Renata Słota, Joanna Ziȩba, Bartosz Kryza, and Jacek Kitowski. Knowledge evolution supporting automatic workflow composition. Proc. of Second IEEE International Conference on e-Science and Grid Computing, e-Science’06, 0:37, 2006. [50] Renata Słota, Joanna Ziȩba, Marta Majewska, Bartosz Kryza, and Jacek Kitowski. Ontology alignment and ontology similarity for extension of service ontology in grid environment. In Marian Bubak, Michal Turała, and Kazimierz Wiatr, editors, Proceedings of Cracow Grid Workshop CGW’05, November 20-23 2005, pages 41–48. ACC Cyfronet AGH, 2006. [51] Marcin Stelmach, Bartosz Kryza, and Jacek Kitowski. Application of highly scalable hybrid architecture for sharing ontological information in heterogeneous environments. In Miriam Cunningham Paul Cunningham, editor, eChallenges e-2012: conference and exhibition, 17–19 October 2012, Lisbon, Portugal. IIMC International Information Management Corporation, 2012. [52] Marcin Stelmach, Bartosz Kryza, and Jacek Kitowski. P2P approach to knowledge-based dynamic Virtual Organizations inception and management. In Roman Wyrzykowski, Jack Dongarra, Konrad Karczewski, and Jerzy Wasniewski, editors, Proc. of Intl Conf. on Parallel Processing and Applied Mathematics, PPAM, volume 7204 of Lecture Notes in Computer Science, pages 201–210. Springer Berlin / Heidelberg, 2012. 24 [53] Marcin Stelmach, Bartosz Kryza, Renata Słota, and Jacek Kitowski. Distributed contract negotiation system for Virtual Organizations. Proceedings of the International Conference on Computational Science, ICCS 2011, Procedia Computer Science, 4:2206–2215, 2011. [54] Joanna Ziȩba, Bartosz Kryza, Renata Słota, Łukasz Dutka, and Jacek Kitowski. Ontology alignment for contract based Virtual Organizations negotiation and operation. In Roman Wyrzykowski, Jack Dongarra, Konrad Karczewski, and Jerzy Waśniewski, editors, Proc. of Intl Conf. on Parallel Processing and Applied Mathematics, PPAM, volume 4967 of Lecture Notes in Computer Science, pages 835–842. Springer Berlin / Heidelberg, 2008. [55] Mikołaj Zuzek, Marek Talik, Tomasz Świerczynski, Cezary Wiśniewski, Bartosz Kryza, Łukasz Dutka, and Jacek Kitowski. Formal model for contract negotiation in knowledge-based Virtual Organizations. In Marian Bubak, Geert van Albada, Jack Dongarra, and Peter Sloot, editors, Proc. of Intl. Conf. on Computational Science, ICCS 2008, volume 5103 of Lecture Notes in Computer Science, pages 409–418. Springer Berlin / Heidelberg, 2008. A A.1 Dane bibliometryczne Web of Science Cytowania (całkowita liczba) : 39 Cytowania (bez autocytowań) : 29 h-index: 4 A.2 Google Scholar Cytowania (całkowita liczba): 254 h-index: 9 i10-index: 8 25