Według definicji Williama H
Transkrypt
Według definicji Williama H
Hurtownie danych Hurtownia danych — opis Według definicji Williama H. Inmonna hurtownia danych to uporządkowany tematycznie, zintegrowany, zawierający wymiar czasowy, nieulotny zbiór danych wspomagający podejmowanie decyzji. Hurtownia danych rodzaj bazy danych, która jest zorganizowana i zoptymalizowana pod kątem pewnego wycinka rzeczywistości. Hurtownia danych jest wyższym szczeblem abstrakcji niż zwykła relacyjna baza danych (choć do jej tworzenia używane są także podobne technologie). W skład hurtowni wchodzą zbiory danych zorientowanych tematycznie (np. hurtownia danych klientów). Dane te często pochodzą z wielu źródeł, są one zintegrowane i przeznaczone wyłącznie do odczytu. W praktyce hurtownie są bazami danych integrującymi dane z wszystkich pozostałych systemów bazodanowych w firmie. Ta integracja polega na cyklicznym zasilaniu hurtowni danymi systemów produkcyjnych (może być tych baz lub systemów dużo i mogą być rozproszone). Architektura bazy hurtowni jest zorientowana na optymalizację szybkości wyszukiwania i jak najefektywniejszą analizę zawartości. Stąd bywa, że hurtownie danych nie są realizowane za pomocą relacyjnych baz danych, gdyż takie bazy ustępują szybkością innym rozwiązaniom. W zależności od rodzaju hurtowni dane w jej rekordach mogą być zagregowane lub zawierać nawet informacje szczątkowe. W praktyce oznacza to, że pewne dane w hurtowni nie są przechowywane w postaci rozdrobnionej a tylko jako ich suma. Przykładowo tak stać się może, gdy mamy do czynienia z hurtownią danych sprzedaży, wtedy nie będą występowały w niej poszczególne pozycje na fakturach a jedynie kwoty faktur, gdyż to jest podstawą analizy (oczywiście to osoby korzystające z hurtowni określają, jakie dane są dla nich użyteczne). W praktyce w ramach architektury hurtowni jest poziom danych detalicznych oraz warstwa agregatów / kostek tematycznych. Użytkownicy końcowi hurtowni, czyli najczęściej zarząd firmy, korzystają z danych hurtowni poprzez różne systemy wyszukiwania danych (np. OLAP - Online Analytical Processing). Hurtownia danych stanowi zatem rozbudowaną bazę danych, przechowującą olbrzymią ilość danych zbieranych w czasie. Dodatkowo zakłada się, że przeprowadzane na danych operacje mają charakter analityczny (wyszukiwanie i analiza). Nie stosuje się więc typowych Strona 1 z 4 Hurtownie danych transakcji. Ze względu na ilość i tematykę danych przeprowadzane analizy mogą polegać na szukaniu trendów, zależności, wzorców, itp. Stosowana tu eksploracja danych wyszukuje ogólnych form wiedzy z olbrzymiej ilości danych. Przeprowadzane na hurtowniach danych wyszukiwania mają najczęściej charakter wielowymiarowy nie ograniczają się bowiem tylko do jednej tabeli, lecz korzystają z wielu relacji. Przechowywane dane w hurtowni są tematycznie spójne (dotyczą konkretnego problemu, lub instytucji – np. szpitala) oraz zintegrowane, co najczęściej cechuje się centralizacją przechowywania danych (wszelkie dane są przechowywane w jednym miejscu). Istnieją również zawężone tematycznie hurtownie danych (np. do jednego oddziału szpitala, lub kliniki) nazywane minihurtowniami danych (z ang. data mart). Minihurtownie mogą istnieć jako oddzielne jednostki lub stanowić element hurtowni danych. Większość firm tworzących systemy relacyjnych baz danych tworzą również oprogramowanie hurtowni danych.1 Podstawowe elementy charakterystyczne dla architektury hurtowni danych (zbiór reguł i struktur tworzący szkielet całego systemu) przedstawia rysunek 1. Jest to jedna z możliwych postaci. Inną dość popularną formą jest hurtownia, w której dane zamiast do jednej zcentralizowanej hurtowni są wprowadzane do oddzielnych hurtowni dla różnych obszarów działalności przedsiębiorstwa. Chociaż ta architektura nie ma jednej dużej bazy danych, to zawiera wszystkie elementy, które sprawiają, że jest prawdziwą hurtownią danych. Rysunek. 1 Ogólna architektura hurtowni danych. Źródłem danych dla hurtowni danych może być baza operacyjna, zewnętrzna baza danych, pliki oraz dane dostarczone przez firmy zajmujące się tego typu działalnością. W części 1 Internet: www.wikipedia.pl (21-11-2007) Strona 2 z 4 Hurtownie danych źródłowej, integracji oraz w hurtowni danych znajdują się dane, nie przedstawiające większej wartości bez odpowiedniego ich uporządkowania. Z wyżej wymienionych danych w wyniku przekształcania powstaje informacja - będąca czytelnym dla odbiorcy obrazem bazy danych. Rola hurtowni danych w przedsiębiorstwie Każda firma zbiera i składuje informacje związane z ewidencją operacji gospodarczych. Dane te można wykorzystać na dwa sposoby: w bazach transakcyjnych (operacyjnych) i bazach analitycznych. Bazy transakcyjne wspomagają codzienną pracę przedsiębiorstwa. Mają za zadanie wspomagać funkcjonowanie przedsiębiorstwa przez dokładne i efektywne realizowanie transakcji. Operacje wykonywane na tej bazie to odczyt, zapis, modyfikacja, usuwanie. Ma ona krytyczne znaczenie w działalności przedsiębiorstwa, ponieważ to właśnie w niej odbywa się ewidencjonowanie większości zdarzeń zachodzących w przedsiębiorstwie. Baza operacyjna jest grupą aplikacji służącą do realizacji wyżej wymienionych celów. Rzadko jest jednym systemem. System analityczny jest aplikacją służącą do przetwarzania danych w celu wspomagania decyzji strategicznych i decyzji związanych z zarządzaniem. Bazy analityczne w odróżnieniu od operacyjnych są zazwyczaj stałe i nie pozwalają użytkownikom na modyfikację danych. Operator może dokonywać na systemie analitycznym tylko operacje odczytu. Systemy te przechowują całą historię działalności przedsiębiorstwa, podczas gdy bazy operacyjne tylko ostatnie lata. Utrzymywanie danych jest optymalizowane pod kątem odpowiadania na złożone zapytania pochodzące od zarządzających oraz analityków. Dane są pozyskiwane z różnorodnych źródeł, przy czym zapewniona jest ich jednolitość. Podstawą budowy hurtowni danych jest analityczna baza danych. Jest ona bazą systemu wspomagania decyzji. Hurtownia jest projektowana dla dużej ilości stałych danych. Zapewnia ona dostęp do dużej ilości danych użytkownikom podejmującym strategiczne z punktu widzenia przedsiębiorstwa decyzje. Hurtownia danych jest stale rozwijającym się przedsięwzięciem, zapewniającym użytkownikom odpowiednie dane w odpowiednim miejscu i czasie. Hurtownie danych są integralną częścią wzajemnie powiązanych nurtów, obejmujących: Strona 3 z 4 Hurtownie danych • przetwarzanie analityczne na bieżąco, • wielowymiarowe bazy danych, • odkrywanie wiedzy.2 Hurtownie danych mają za zadanie zebrać dane z różnorodnych i często niezgodnych systemów a w efekcie pozwolić na uzyskanie zintegrowanych danych i narzędzi do ich sprawnej analizy. Bez względu na rozmiar przedsiębiorstwa oraz niezliczoną ilość źródeł generowania danych , integracja z partnerami i kontrola łańcucha wartości jest obowiązkową praktyką biznesu.3 Hurtownie danych w przedsiębiorstwie pełnią wiele różnorodnych funkcji. Przede wszystkim wspierają procesy podejmowania decyzji na wszystkich szczeblach, a poprzez różnorodne rodzaje dostępu są przyjazne dla użytkownika. Rolą hurtowni danych w przedsiębiorstwie jest wspomaganie zarządzania poprzez dostarczanie właściwych informacji, właściwym ludziom, we właściwym czasie przy niskim koszcie. 2 3 Internet: www.gazeta-it.pl (21-11-2007) „Hurtownie danych – współczesność”, B. Bawor, 2003 Strona 4 z 4