Według definicji Williama H

Transkrypt

Według definicji Williama H
Hurtownie danych
Hurtownia danych — opis
Według definicji Williama H. Inmonna hurtownia danych to uporządkowany
tematycznie, zintegrowany, zawierający wymiar czasowy, nieulotny zbiór danych
wspomagający podejmowanie decyzji.
Hurtownia danych rodzaj bazy danych, która jest zorganizowana i zoptymalizowana pod
kątem pewnego wycinka rzeczywistości. Hurtownia danych jest wyższym szczeblem
abstrakcji niż zwykła relacyjna baza danych (choć do jej tworzenia używane są także podobne
technologie). W skład hurtowni wchodzą zbiory danych zorientowanych tematycznie
(np. hurtownia danych klientów). Dane te często pochodzą z wielu źródeł, są one
zintegrowane i przeznaczone wyłącznie do odczytu.
W praktyce hurtownie są bazami danych integrującymi dane z wszystkich pozostałych
systemów bazodanowych w firmie. Ta integracja polega na cyklicznym zasilaniu hurtowni
danymi systemów produkcyjnych (może być tych baz lub systemów dużo i mogą być
rozproszone).
Architektura
bazy
hurtowni
jest
zorientowana
na
optymalizację
szybkości
wyszukiwania i jak najefektywniejszą analizę zawartości. Stąd bywa, że hurtownie danych nie
są realizowane za pomocą relacyjnych baz danych, gdyż takie bazy ustępują szybkością
innym rozwiązaniom.
W zależności od rodzaju hurtowni dane w jej rekordach mogą być zagregowane lub zawierać
nawet informacje szczątkowe. W praktyce oznacza to, że pewne dane w hurtowni nie są
przechowywane w postaci rozdrobnionej a tylko jako ich suma. Przykładowo tak stać się
może, gdy mamy do czynienia z hurtownią danych sprzedaży, wtedy nie będą występowały
w niej poszczególne pozycje na fakturach a jedynie kwoty faktur, gdyż to jest podstawą
analizy (oczywiście to osoby korzystające z hurtowni określają, jakie dane są dla nich
użyteczne). W praktyce w ramach architektury hurtowni jest poziom danych detalicznych
oraz warstwa agregatów / kostek tematycznych.
Użytkownicy końcowi hurtowni, czyli najczęściej zarząd firmy, korzystają z danych
hurtowni poprzez różne systemy wyszukiwania danych (np. OLAP - Online Analytical
Processing).
Hurtownia danych stanowi zatem rozbudowaną bazę danych, przechowującą olbrzymią ilość
danych zbieranych w czasie. Dodatkowo zakłada się, że przeprowadzane na danych operacje
mają charakter analityczny (wyszukiwanie i analiza). Nie stosuje się więc typowych
Strona 1 z 4
Hurtownie danych
transakcji. Ze względu na ilość i tematykę danych przeprowadzane analizy mogą polegać na
szukaniu trendów, zależności, wzorców, itp. Stosowana tu eksploracja danych wyszukuje
ogólnych form wiedzy z olbrzymiej ilości danych. Przeprowadzane na hurtowniach danych
wyszukiwania mają najczęściej charakter wielowymiarowy nie ograniczają się bowiem tylko
do jednej tabeli, lecz korzystają z wielu relacji. Przechowywane dane w hurtowni są
tematycznie spójne (dotyczą konkretnego problemu, lub instytucji – np. szpitala) oraz
zintegrowane, co najczęściej cechuje się centralizacją przechowywania danych (wszelkie
dane są przechowywane w jednym miejscu). Istnieją również zawężone tematycznie
hurtownie danych (np. do jednego oddziału szpitala, lub kliniki) nazywane minihurtowniami
danych (z ang. data mart). Minihurtownie mogą istnieć jako oddzielne jednostki lub stanowić
element hurtowni danych. Większość firm tworzących systemy relacyjnych baz danych
tworzą również oprogramowanie hurtowni danych.1
Podstawowe elementy charakterystyczne dla architektury hurtowni danych (zbiór
reguł i struktur tworzący szkielet całego systemu) przedstawia rysunek 1. Jest to jedna
z możliwych postaci. Inną dość popularną formą jest hurtownia, w której dane zamiast do
jednej zcentralizowanej hurtowni są wprowadzane do oddzielnych hurtowni dla różnych
obszarów działalności przedsiębiorstwa. Chociaż ta architektura nie ma jednej dużej bazy
danych, to zawiera wszystkie elementy, które sprawiają, że jest prawdziwą hurtownią danych.
Rysunek. 1 Ogólna architektura hurtowni danych.
Źródłem danych dla hurtowni danych może być baza operacyjna, zewnętrzna baza danych,
pliki oraz dane dostarczone przez firmy zajmujące się tego typu działalnością. W części
1
Internet: www.wikipedia.pl (21-11-2007)
Strona 2 z 4
Hurtownie danych
źródłowej, integracji oraz w hurtowni danych znajdują się dane, nie przedstawiające większej
wartości bez odpowiedniego ich uporządkowania. Z wyżej wymienionych danych w wyniku
przekształcania powstaje informacja - będąca czytelnym dla odbiorcy obrazem bazy danych.
Rola hurtowni danych w przedsiębiorstwie
Każda firma zbiera i składuje informacje związane z ewidencją operacji gospodarczych. Dane
te można wykorzystać na dwa sposoby: w bazach transakcyjnych (operacyjnych) i bazach
analitycznych.
Bazy transakcyjne wspomagają codzienną pracę przedsiębiorstwa. Mają za zadanie
wspomagać funkcjonowanie przedsiębiorstwa przez dokładne i efektywne realizowanie
transakcji. Operacje wykonywane na tej bazie to odczyt, zapis, modyfikacja, usuwanie. Ma
ona krytyczne znaczenie w działalności przedsiębiorstwa, ponieważ to właśnie w niej odbywa
się ewidencjonowanie większości zdarzeń zachodzących w przedsiębiorstwie. Baza
operacyjna jest grupą aplikacji służącą do realizacji wyżej wymienionych celów. Rzadko jest
jednym systemem.
System analityczny jest aplikacją służącą do przetwarzania danych w celu wspomagania
decyzji strategicznych i decyzji związanych z zarządzaniem. Bazy analityczne w odróżnieniu
od operacyjnych są zazwyczaj stałe i nie pozwalają użytkownikom na modyfikację danych.
Operator może dokonywać na systemie analitycznym tylko operacje odczytu. Systemy te
przechowują całą historię działalności przedsiębiorstwa, podczas gdy bazy operacyjne tylko
ostatnie lata. Utrzymywanie danych jest optymalizowane pod kątem odpowiadania na złożone
zapytania pochodzące od zarządzających oraz analityków. Dane są pozyskiwane
z różnorodnych źródeł, przy czym zapewniona jest ich jednolitość.
Podstawą budowy hurtowni danych jest analityczna baza danych. Jest ona bazą systemu
wspomagania decyzji. Hurtownia jest projektowana dla dużej ilości stałych danych. Zapewnia
ona dostęp do dużej ilości danych użytkownikom podejmującym strategiczne z punktu
widzenia przedsiębiorstwa decyzje. Hurtownia danych jest stale rozwijającym się
przedsięwzięciem, zapewniającym użytkownikom odpowiednie dane w odpowiednim miejscu
i czasie.
Hurtownie danych są integralną częścią wzajemnie powiązanych nurtów, obejmujących:
Strona 3 z 4
Hurtownie danych
•
przetwarzanie analityczne na bieżąco,
•
wielowymiarowe bazy danych,
•
odkrywanie wiedzy.2
Hurtownie danych mają za zadanie zebrać dane z różnorodnych i często niezgodnych
systemów a w efekcie pozwolić na uzyskanie zintegrowanych danych i narzędzi do ich
sprawnej analizy. Bez względu na rozmiar przedsiębiorstwa oraz niezliczoną ilość źródeł
generowania danych , integracja z partnerami i kontrola łańcucha wartości jest obowiązkową
praktyką biznesu.3
Hurtownie danych w przedsiębiorstwie pełnią wiele różnorodnych funkcji. Przede
wszystkim wspierają procesy podejmowania decyzji na wszystkich szczeblach, a poprzez
różnorodne rodzaje dostępu są przyjazne dla użytkownika.
Rolą hurtowni danych w przedsiębiorstwie jest wspomaganie zarządzania poprzez
dostarczanie właściwych informacji, właściwym ludziom, we właściwym czasie przy niskim
koszcie.
2
3
Internet: www.gazeta-it.pl (21-11-2007)
„Hurtownie danych – współczesność”, B. Bawor, 2003
Strona 4 z 4

Podobne dokumenty