Rozdział monografii: `Bazy Danych: Struktury, Algorytmy, Metody

Transkrypt

Rozdział monografii: `Bazy Danych: Struktury, Algorytmy, Metody
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
Rozdział 13
w
w
Wymagania stawiane bazom danych w przetwarzaniu
danych w siatkach obliczeniowych (gridach) na potrzeby przedsiębiorstw
1 Wstęp
da
.b
w
Streszczenie. W rozdziale przeprowadzono analizę porównawczą podstawowych wymagań w stosunku do baz danych w kontekście przetwarzania danych w siatkach obliczeniowych. W tym celu dokonano przeglądu cech systemu zarządzania bazą danych Oracle 10g wersja 2 w zestawieniu z systemem IBM DB2 UDB wersja 8.2.
pl
s.
We współczesnych systemach przetwarzania danych najważniejsze znaczenie ma ograniczanie kosztów. Firmy starają się obniżać koszty oraz zwiększać efektywność procesów
i systemów – a to właśnie może umożliwić omawiana technologia przetwarzania danych
w siatkach obliczeniowych. Firmy takie jak np. Sun, HP, IBM, Oracle promują rozwój tej
technologii, nie tylko dla uczelni i instytutów badawczych, ale także dla użytkowników
w przedsiębiorstwach [2], [15], [16], [18].
Według technologicznego przeglądu przeprowadzonego przez firmę Gartner w 2005 roku badana technologia jest technologią rozwijającą się i znajduje się obecnie w fazie wzmożonych oczekiwań, ale przewiduje się, że w ciągu najbliższych 2 do 5 lat osiągnie fazę
ciągłości produkcyjnej, w której korzyści płynące z zastosowania tej technologii zostaną
dostrzeżone i zaakceptowane, a liczba organizacji decydujących się na wdrożenie tej technologii u siebie będzie stale wzrastać [11].
Jeśli coraz więcej przedsiębiorstw będzie stosować przetwarzanie danych w siatkach obliczeniowych, aby zwiększyć efektywność i łatwość przystosowania się do zmieniających
się warunków biznesowych, staną one wobec różnych decyzji technologicznych. Leżąca
u podłoża technologia bazy danych powinna być oceniana ze względu na jej zdolność osiągnięcia korzyści z omawianej technologii [12]. Stąd zasadne jest przeprowadzenie w rozdziale przeglądu najbardziej znaczących różnic między wiodącym na rynku systemem
zarządzania bazą danych Oracle 10g wersja 2 i jego konkurencyjnym systemem IBM DB2
UDB wersja 8.2, w odniesieniu do sformułowanych, również w rozdziale, wymagań stawianych bazom danych w omawianej technologii [8].
Jolanta Joszczuk-Januszewska: Akademia Morska, Katedra. Podstaw Informatyki
i Sieci Komputerowych,
ul. Morska 83, 81-225 Gdynia, Polska
email: [email protected]
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
J. Joszczuk-Januszewska
2 Przetwarzanie danych w siatkach obliczeniowych
w
Siatka obliczeniowa (ang. grid) to rozproszone środowisko obliczeniowe składające się
z autonomicznych zasobów (serwerów, komputerów PC, baz danych, pamięci masowych
itd.). Przetwarzanie danych w owych siatkach (ang. grid computing) to nowa technologia
stanowiąca kolejny etap rozwoju przetwarzania rozproszonego. Technologia ta pozwala lepiej wykorzystywać zasoby przedsiębiorstwa poprzez konsolidację sprzętu komputerowego
oraz eliminowanie obszarów, w których komputery nie są w pełni obciążone. Przedsiębiorstwa mogą tworzyć scentralizowane pule przetwarzania i przydzielać odpowiednie zasoby komputerowe do realizacji zadań priorytetowych [7], [10], [16].
Na najwyższym poziomie główną koncepcją tej technologii jest traktowanie przetwarzania danych jak usługi użyteczności publicznej. Klient powinien mieć możliwość zamówienia informacji lub obliczeń oraz otrzymania wyników w żądanym zakresie i terminie. Można to porównać do dostaw energii elektrycznej. Odbiorca nie wie, gdzie znajduje się generator ani jak jest zbudowana sieć – po prostu zamawia energię elektryczną i ją otrzymuje.
W koncepcji tej chodzi o to, aby przetwarzanie danych stało się powszechnie dostępnym
artykułem handlowym.
Natomiast omawiana technologia widziana od strony usługodawcy oznacza alokację zasobów, współużytkowanie informacji oraz konieczność zapewnienia wysokiej dostępności.
Alokacja zasobów gwarantuje, że każdy, kto potrzebuje lub żąda mocy obliczeniowej,
otrzymuje to, co mu jest potrzebne, a ponadto pozwala ona uniknąć sytuacji, w której zasoby pozostają nie wykorzystane, a zlecenia czekają na realizację. Dzięki współużytkowaniu
informacji, użytkownicy i aplikacje mają do nich dostęp we właściwym miejscu i czasie.
Wysoka dostępność jest niezbędna, ponieważ wszystkie dane i środki przetwarzania muszą
być zawsze do dyspozycji, podobnie jak zakład energetyczny musi stale zapewniać dostawę
energii elektrycznej.
da
.b
w
w
3 Architektury klastrowe
pl
s.
Istotna jest możliwość uruchamiania rzeczywistych aplikacji na sprzęcie i w systemach
operacyjnych typu usługowego. Łatwo dostępny sprzęt typu usługowego, taki jak serwery
kasetowe oraz system operacyjny Linux, zapewniają duże korzyści finansowe ze stosowania rozwiązań grid. Rozwiązania te wykorzystują komponenty usługowe w taki sposób, by
zoptymalizować obciążenie zasobów.
Technologia klastrów aplikacji (ang. Real Application Clusters – RAC) zastosowana
w Oracle 10g pozwala osiągnąć wysoki stopień wykorzystania zasobów w usługowych zespołach serwerów kasetowych. Aplikacje działające w takiej technologii mogą dynamicznie
zwiększać liczbę wykorzystywanych, udostępnionych im serwerów. Równie łatwo aplikacje te mogą zwolnić serwery niepotrzebne [1], [9].
Z drugiej strony pojedyncze bazy danych znacznie ograniczają wykorzystanie komponentów usługowych. W takich bazach trzeba przydzielać zasoby odpowiednio do maksymalnego obciążenia, uwzględniając rezerwę. Dlatego też w usługowych bazach danych nie
ma możliwości dodawania i zwalniania serwerów kasetowych wykorzystywanych przez bazę danych bez zatrzymania całego systemu.
Technologia RAC, oparta na architekturze współużytkowanego dysku, może rosnąć lub
kurczyć się w zależności od potrzeb (rys.1). Taka swoboda nie jest możliwa w przypadku
bazy danych DB2 UDB wersja 8.2, która jest oparta na architekturze wykluczającej tego
typu współużytkowanie. W systemach bez współużytkowania, dane podlegają sztucznemu
130
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
Wymagania stawiane bazom danych w przetwarzaniu danych w siatkach obliczeniowych (gridach)
podziałowi. Gdy zostaną dodane kolejne serwery kasetowe, całość danych musi zostać od
nowa rozdzielona. Podobnie, kiedy trzeba zmniejszyć liczbę serwerów kasetowych, dane
musza być uprzednio przypisane do innych serwerów.
w
da
.b
w
w
Rys. 1. Architektura RAC
4 Uproszczenie i automatyzacja pamięci masowej
pl
s.
Przetwarzanie danych przedsiębiorstwa w siatkach obliczeniowych wymaga znacznego
uproszczenia zarządzania pamięcią masową. Duże zmiany obciążenia aplikacji powodują
powstawanie „punktów zapalnych” (ang. hot spots), co wymaga ręcznego dostrajania i stałego monitorowania. Ponadto administratorzy muszą zarządzać wieloma obiektami związanymi z pamięcią masową (tabele, przestrzenie tabel, pliki, systemy plików, grupy dysków).
Baza danych Oracle Database 10g oferuje nowe podejście do zarządzania pamięcią masową, udostępniając funkcję automatycznego zarządzania składowaniem danych (ang.
Automatic Storage Management – ASM) [4],[17]. Funkcja ta pozwala bazie danych bezpośrednio zarządzać dyskami, eliminuje także konieczność zarządzania przez system plików
i menedżer woluminów zarówno plikami danych, jak i plikami dziennika.
ASM zapewnia wiele tych samych korzyści, co niektóre technologie pamięci masowej,
np. tablica dysków (ang. Redundant Array of Independent (Inexpensive) Disks – RAID) –
nadmiarowa tablica niezależnych (tanich) dysków przyspieszająca działanie dysków i zwiększająca ich niezawodność. Podobnie jak te technologie, ASM umożliwia tworzenie pul
pamięci masowej (tzw. grupy dysków). W przeciwieństwie do technologii RAID, w ASM
wdrożono striping (zapisywanie bloków pliku na różne dyski) i zapis lustrzany na poziomie
plików.
ASM automatycznie realizuje striping danych z bazy na wszystkie dostępne dyski, zapewniając maksymalną przepustowość operacji wejścia–wyjścia bez jakichkolwiek związa131
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
J. Joszczuk-Januszewska
w
nych z tym kosztów zarządzania. Automatyczny striping jest również realizowany w przypadku dodawania i usuwania dysków. Dzięki opcjonalnej funkcji tworzenia kopii lustrzanych zapewniono większą dostępność danych, a dyski można dodawać i usuwać podczas
pracy systemu.
Wyeliminowano też ryzyko utraty danych na skutek błędu człowieka, gdyż funkcja
ASM obsługuje proces usuwania plików, które nie wchodzą już w skład bazy danych. Co
więcej, ASM automatycznie wykrywa „punkty zapalne” i, aby zlikwidować związane
z nimi niebezpieczeństwo, odpowiednio zmienia rozmieszczenie danych.
ASM wprowadzone w Oracle Database 10g wersja 1 upraszcza konfigurację, zmniejszając tym samym nakład pracy administratorów i umożliwiając klientom dalszą redukcję
kosztów infrastruktury. Nowe wydanie w wersji 2 zawiera jeszcze więcej możliwości zautomatyzowanych operacji zarządzania pamięcią masową, a także rozbudowaną możliwość
jej wirtualizacji, która ułatwia współużytkowanie zasobów pamięci w środowisku przetwarzania klasy grid.
IBM DB2 UDB, w przeciwieństwie do Oracle 10g, nie ma możliwości zarządzania pamięcią masową.
w
w
5 Wymiana informacji
da
.b
Celem przetwarzania danych w siatkach obliczeniowych należy mieć dostęp do niezbędnych informacji w żądanym czasie, niezależnie od miejsca ich przechowywania. Aby można było przetwarzać informacje z wykorzystaniem dowolnego z dostępnych zasobów, rozwiązanie grid musi zapewniać efektywną wymianę danych między wieloma systemami.
Musi też umożliwiać dostęp do danych przechowywanych w systemach heterogenicznych –
w bazach danych pochodzących od różnych dostawców oraz w różnych systemach plików.
5.1 Oracle Streams
pl
s.
Niektóre dane muszą być współużytkowane w czasie ich tworzenia lub modyfikowania,
a nie tylko sporadycznie dostępne w całości. Mechanizm Oracle Streams pozwala przesyłać
dane strumieniowo między bazami danych, węzłami lub zespołami serwerów kasetowych
w obrębie siatki [4]. Tworzy on jednolitą platformę współużytkowania informacji, która
w ramach jednej technologii zapewnia kolejkowanie komunikatów, replikację, obsługę zdarzeń, ładowanie hurtowni danych, a także funkcje powiadamiania oraz publikacji i subskrypcji. Oracle Streams może w czasie aktualizacji zapewniać synchronizację dwóch lub
więcej kopii. Mechanizm ten automatycznie wychwytuje zmiany w bazie danych, przesyła
je do węzłów będących subskrybentami, wprowadza zmiany oraz wykrywa i usuwa wszelkie konflikty. Może być również wykorzystywany bezpośrednio przez aplikacje jako funkcja kolejkowania komunikatów, umożliwiając komunikację miedzy aplikacjami w obrębie
systemu typu grid.
System IBM nie może podzielić informacji, w taki sposób jak Oracle, bez konieczności
połączenia wielu różnych produktów, napisania wielu kodów i zarządzania wieloma różnymi komponentami.
132
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
Wymagania stawiane bazom danych w przetwarzaniu danych w siatkach obliczeniowych (gridach)
5.2 Przenośne przestrzenie tabel
w
Narzędzie przenośne przestrzenie tabel (ang. Transportable Tablespaces) oferuje użytkownikom rozwiązań grid wyjątkowo szybki mechanizm przenoszenia podzbiorów danych
z jednej bazy do drugiej [4]. Przenośne przestrzenie tabel pozwalają odłączyć pliki danych
Oracle od bazy danych, przenieść je lub skopiować do innej lokalizacji, a następnie podłączyć do innej bazy. Takie podłączanie i odłączanie plików danych wymaga jedynie wczytania lub załadowania niewielkiej liczby metadanych. Oracle 10g pozwala obecnie na
transportowanie przenośnych przestrzeni tabel miedzy różnymi platformami systemowymi.
5.3 Rozproszone funkcje SQL i transakcje rozproszone
w
da
.b
w
Oferowane przez Oracle rozproszone funkcje SQL zapewniają użytkownikom systemów
grid łatwy dostęp do danych oraz umożliwiają integrację danych przechowywanych w wielu bazach Oracle i innych firm [4],[6]. Funkcje te zapewniają przezroczysty zdalny dostęp
do danych, co umożliwia uruchamianie aplikacji z dowolną inną bazą danych, bez konieczności wprowadzania zmian w kodzie aplikacji. Integrując dane z wielu źródeł¸ baza danych
Oracle w sposób inteligentny optymalizuje harmonogram dostępu do danych.
IBM wymaga zakupu narzędzia DataJoiner, jeżeli zachodzi potrzeba uaktualniania bazy
danych innej niż DB2.
5.4 Heterogeniczny dostęp dzięki połączeniom standardowym i przezroczystym
bramom
pl
s.
Funkcje heterogenicznego dostępu bazy danych Oracle pozwalają użytkownikom technologii typu grid w przezroczysty sposób korzystać z aplikacji Oracle we współpracy z bazami
danych innych dostawców, bez wprowadzania zmian w kodzie tych aplikacji. Aplikacje te
mają taki sam dostęp do baz danych innych dostawców, jak i do baz Oracle. Dzięki odpowiednim interfejsom aplikacja Oracle uzyskuje dostęp do obcej bazy danych przy użyciu
sterowników ODBC i OLEDB. Przezroczyste bramy (ang. Transparent Gateways) pozwalają aplikacji Oracle rozpoznać możliwości baz danych innych dostawców oraz dokonać
niezbędnej konwersji i optymalizacji dostępu.
6 Szeregowanie zadań i zarządzanie zasobami
Celem przetwarzania danych w siatkach obliczeniowych konieczny jest kontrolowany dostęp do tych danych i ich alokacja. Dostęp do zasobów systemu grid ma zmienna grupa pracowników przedsiębiorstwa i użytkowników zewnętrznych. W takim środowisku konieczne jest szeregowanie zadań oraz odpowiednie przydzielanie zasobów.
Baza danych Oracle 10g zawiera aplikację Oracle Scheduler, ułatwiającą zarządzanie
działalnością przedsiębiorstwa oraz wykonywanie i planowanie zadań informatycznych,
a wszystko to w ramach siatki.
Mimo, iż Oracle Database 10g jest w większości samozarządzającą bazą danych, administratorzy muszą mieć pieczę nad sposobem wykorzystania zasobów. Jednym z kluczowych narzędzi służących do zarządzania zasobami w ramach bazy danych Oracle jest Da-
133
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
J. Joszczuk-Januszewska
tabase Resource Manager, który umożliwia administratorom wpływanie na sposób przydzielania zasobów bazy danych Oracle użytkownikom siatki.
7 Parametry operacyjne baz danych
w
Grid musi być niezawodny. Do siatek nie można się włamać. Dane, obliczenia i zasoby
w siatce muszą być całkowicie bezpieczne. Siatek nie można też zniszczyć. Muszą być
powszechnie dostępne.
w
7.1 Funkcje wydajności, dostępności i ułatwień zarządzania bazą danych
da
.b
w
W przeciwieństwie do systemu IBM UDB, Oracle Database 10g w wersji 2 udostępnia
funkcje obsługi siatek obliczeniowych zapewniające lepszą wydajność, wyższą dostępność
aplikacji oraz jeszcze większą łatwość zarządzania.
Oracle Database 10g wersja 2 udostępnia nowe funkcje zapewniające zwiększoną wydajność i dostępność, w tym [13],[14]:
− nowe techniki sortowania, które znacznie zwiększają wydajność wszystkich operacji
takich, jak zapytania i tworzenie indeksów, oraz eliminują konieczność stosowania
kosztownych operacji sortowania z ładowaniem wstępnym i odnośnego oprogramowania niezależnych producentów;
− nowe automatyczne funkcje infrastruktury Oracle Data Guard, które umożliwiają
przełączenie na rezerwową bazę danych w ciągu kilku sekund od awarii, nawet
w środowiskach bezobsługowych.
Baza danych Oracle Database 10g zajmuje czołową pozycję pod względem wydajności.
Oracle podtrzymuje między innymi rekord wydajności TPC-H na bazie o rozmiarze 3 TB
i 100 TB ustanawiając odpowiednio wskaźnik wydajności 100,512 OphH@3000GB
i 108,099 OphH@10000G.
W Oracle Database 10g wersja 2 ulepszono funkcje administracji bazą danych, w tym
[17]:
− gromadzenie statystyk wydajności bezpośrednio z pamięci, co umożliwia diagnozowanie wolno działających środowisk;
− lepsze rozpoznanie ogólnej wydajności systemów dzięki modułowi automatycznego
diagnozowania bazy danych (ang. Automatic Database Diagnostic Monitor), który
umożliwia wykrywanie i diagnostykę szerszego zakresu problemów związanych
z wydajnością;
− raporty porównawcze w automatycznym repozytorium obciążenia (ang. Automatic
Workload Repository), które dostarczają informacje w celu stosunkowo szybkiego
rozwiązywania problemów z wydajnością.
pl
s.
7.2 Bezpieczeństwo
Oracle 10g udostępnia sprawdzone zabezpieczenia na potrzeby systemów grid. Oracle oferuje wszechstronne funkcje zaspokajające potrzeby całego przedsiębiorstwa w zakresie mechanizmów zabezpieczeń. W omawianym zestawie funkcji znajdują się zabezpieczenia
transmisji danych oraz mechanizmy uwierzytelniania, autoryzacji i audytu.
134
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
Wymagania stawiane bazom danych w przetwarzaniu danych w siatkach obliczeniowych (gridach)
w
W Oracle Database 10g Release 2 rozbudowano dotychczasowe, zaawansowane mechanizmy bezpieczeństwa o nowe sposoby szyfrowania danych, zapewniając jeszcze lepszą
ochronę danych przed kradzieżą [17]. Funkcja przezroczystego szyfrowania danych (ang.
Transparent Data Encryption) pozwala klientom zaszyfrować na dysku kluczowe dane
z bazy, takie jak numery kart kredytowych, bez konieczności modyfikowania aplikacji, które korzystają z tych danych.
IBM zapewnia bezpieczeństwo na zewnątrz bazy danych i zależy ono od systemu operacyjnego albo linii produktów Tivoli do zabezpieczenia DB2 i innych produktów firmy
IBM. IBM nie ma cech takich jak Wirtualne Prywatne Bazy danych (ang. Virtual Private
Database) i Oracle Label Security [3].
w
8 Przenośność
da
.b
w
Celem przetwarzania danych w siatkach obliczeniowych wymagana jest możliwość wykorzystania dowolnego dostępnego zasobu – sprzętu komputerowego i systemu operacyjnego
– na potrzeby konkretnego zadania. Aplikacje w środowisku grid muszą być przenośne.
Aby można było korzystać z istniejących zasobów, aplikacje muszą działać na dowolnym
sprzęcie i w każdym systemie operacyjnym, bez konieczności wprowadzania modyfikacji.
Przenośność Oracle, pozwalająca na stosowanie dowolnego sprzętu komputerowego
i systemu operacyjnego oznacza, że Oracle 10g może funkcjonować w heterogenicznych
siatkach [17]. Takie siatki pozwalają wykorzystywać cały dostępny sprzęt, a nie tylko pochodzący od jednego dostawcy. Oracle 10g można przenosić do i z konfiguracji grid. Tym
samym aplikację opracowaną na systemie SMP można z łatwością przenieść do infrastruktury grid. Oracle 10g działa na wszystkich głównych systemach operacyjnych, zachowując
w każdym z nich całość swoich cech i funkcji. Przenośność Oracle oznacza więc, że niezależnie od tego, w jakim kierunku rozwinie się technologia grid computing i który z systemów będzie dominować w sieci, baza danych Oracle będzie działać tak samo. Baza
danych IBM DB2 nie ma takich możliwości.
pl
s.
9 Obsługa bardzo dużych baz danych
W środowisku przetwarzania danych przedsiębiorstwa w siatce obliczeniowej istnieje rosnące zapotrzebowanie na obsługę coraz większych baz danych.
W bazie danych Oracle 10g wprowadzono istotną zmianę umożliwiającą obsługę bardzo
dużych baz danych (ang. Ultra Large Database – ULDB), dzięki której baza danych Oracle
może zawierać przestrzenie tabel składające się z pojedynczych dużych plików, zamiast
z wielu małych [4]. W ten sposób baza danych Oracle może wykorzystać możliwości systemów 64-bitowych w celu utworzenia plików o wyjątkowej wielkości. W konsekwencji
możliwe staje się skalowanie bazy Oracle 10g do 8 exabajtów (10 do 18 bajtów). Alternatywnie, maksymalny rozmiar dla DB2 UDB jest 8 petabajtów (10 do 15 bajtów).
135
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
J. Joszczuk-Januszewska
10 Standardowe środowiska siatki
w
Do przetwarzania danych w siatkach obliczeniowych zachodzi konieczność stosowania
standardowych środowisk grid. Zestaw narzędzi Globus stał się standardowym narzędziem do budowy rozwiązań grid z wykorzystaniem bazy danych Oracle 10g.
Zestaw narzędzi Globus zawiera zbiór komponentów przydatnych do budowy aplikacji
przetwarzania danych w siatkach obliczeniowych oraz narzędzia programistyczne. Zestaw
narzędzi Globus stał się de facto standardem w technologii typu grid [5]. Oracle Globus
Development Kit (OGDK) oferuje skrypty umożliwiające efektywne stosowanie technologii Oracle wraz z zestawem narzędzi Globus.
IBM wykorzystuje zestaw narzędzi Globus, ale nie stworzył wersji dostosowanej do ich
technologii, tak jak to zrobił Oracle. W przypadku potrzeby użycia oprogramowania Globus z technologią IBM konieczny jest zakup usługi z IBM, albo poświęcenie czasu i pieniędzy na integrację oprogramowania Globus z technologią IBM.
w
w
11 Podsumowanie
da
.b
W rozdziale sformułowano wymagania stawiane bazom danych w przetwarzaniu danych
w siatkach obliczeniowych na potrzeby przedsiębiorstw.
W odniesieniu do tych wymagań dokonano przeglądu najbardziej znaczących różnic
między wiodącym na rynku systemem zarządzania bazą danych Oracle 10g wersja 2 i jego
konkurencyjnym produktem IBM DB2 UDB wersja 8.2.
Przegląd praktycznych zastosowań bazy danych Oracle Database 10g wersja 2 do przetwarzania danych w siatkach obliczeniowych pozwala stwierdzić, że baza ta w zestawieniu
z systemem IBM, udostępnia funkcje obsługi siatek zapewniające lepszą wydajność, wyższą dostępność aplikacji oraz większą łatwość zarządzania. Wynika to głównie z różnych
zastosowanych w tych bazach technologii klastrowych. W Oracle jest to technologia oparta
na architekturze współużytkowanego dysku, a w bazie danych DB2 UDB wersja 8.2 oparta
jest na architekturze wykluczającej tego typu współużytkowanie.
Oracle RAC pozostaje jedyną dostępną na rynku technologią baz danych, która umożliwia przekształcenie klastra standardowych serwerów w skalowalną i odporną na awarie
platformę obsługującą bazy danych o dowolnym obciążeniu. W drugim wydaniu skalowalność technologii RAC została jeszcze zwiększona – jeden klaster RAC obsługuje teraz do
stu serwerów. Oprogramowanie Oracle Enterprise Manager Database Control zostało udoskonalone, aby uprościć monitorowanie wzajemnej komunikacji i topologii klastrów. Udoskonalone funkcje wyrównywania obciążenia umożliwiają szybsze reagowanie na zmieniające się poziomy obciążenia serwerów w klastrze.
Sformułowane wymagania powinny być brane pod uwagę przy wyborze technologii bazy danych leżącej u podłoża przetwarzania danych w siatkach obliczeniowych na potrzeby
przedsiębiorstw.
pl
s.
Literatura
1.
Afrookhten Z.: Technical Comparison of Oracle Real Application Clusters 10g vs. IBM DB2
UDB v.8.2. An Oracle White Paper, 2005.
136
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
Wymagania stawiane bazom danych w przetwarzaniu danych w siatkach obliczeniowych (gridach)
2.
3.
4.
5.
6.
w
7.
8.
9.
Berman F., Fox G., Hey T (eds.): Grid Computing: making the global infrastructure a reality.
Wiley & Sons, 2003.
Configure Grid Security in the IBM Grid Toolbox using the Globus Certificate Service. IBM
Technote, 2004.
Freeman R. G.: Oracle Database 10g. Nowe możliwości. Gliwice, Helion 2005.
Globus Toolkit 3.0 Quick Start. IBM Redpaper, 2003.
Goyal B., Thome B.: Oracle Database 10g: The Database for the Grid. An Oracle White Paper,
2005.
Grid Computing in Research and Education. IBM Redbook, 2005.
Grid Computing Products and Services. IBM Redbook, 2005.
Hletter R.: Oracle Real Application Clusters 10g – The Foundation for Enterprise Grid Computing. An Oracle White Paper, 2005.
Introduction to Grid Computing. IBM Redbook, 2005.
Jakubik K.: Technologiczny przegląd Gartnera. Networld nr.10, 2005.
Joszczuk-Januszewska J.: Aspekty przetwarzania danych biznesowych w siatce obliczeniowej
w systemach baz danych. W ramach pracy zbiorowej pod redakcją A. Grzywaka i A. Kwietnia:
Wysokowydajne Sieci Komputerowe. Zastosowanie i bezpieczeństwo, Wydawnictwa Komunikacji i Łączności 2005.
Lejeune H.: Technical Comparison of Oracle Database vs. IBM DB2 UDB. Focus on Performance. An Oracle White Paper, 2005.
Manageability Study. Comparative management cost study of Oracle Database 10g and IBM
UDB 8.2. Progressive Strategies, Inc. New York 2004.
Minoli D.: A networking approach to grid computing. John Wiley & Sons, 2005.
Shimp R., Anxolabehere V.: Oracle Grid Computing. An Oracle Business White Paper, 2005.
Smith G.C.: Oracle Database 10g Release 2: A Revolution in Database Technology. An Oracle
White Paper, 2005.
The Era of Grid Computing: Enabling new possibilities for your business. IBM Corporation
2004.
13.
14.
18.
da
.b
15.
16.
17.
w
w
10.
11.
12.
pl
s.
137
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006
Rozdział monografii: 'Bazy Danych: Struktury, Algorytmy, Metody', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2006
w
da
.b
w
w
pl
s.
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2006

Podobne dokumenty