O bazach danych Co to jest baza danych System zarządzania bazą
Transkrypt
O bazach danych Co to jest baza danych System zarządzania bazą
Co to jest baza danych Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny. Zadania baz danych: O bazach danych R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski www.il.pw.edu.pl/~rg [email protected] ! ! ! Likwidacja lub znaczne ograniczenie redundancji (powtarzania się) danych Integracja danych Bezpieczeństwo danych 2•14 Rekord, pole, relacje... System zarządzania bazą System zarządzania bazą danych to zbiór programów umożliwiających zapamiętywanie, manipulowanie i przetwarzanie danych i zapewniający użytkownikom bezpieczeństwo, poufność i integralność danych. ! ! ! ! Podstawowy element bazy to rekord. Poszczególne jednostki informacji w rekordzie to pola. Dane w bazie są powiązane, co oznacza, że istnieją między nimi określone relacje, związki. Warunki integralności do zdefiniowane przez użytkownika reguły, pozwalające zachować poprawność danych. Tworzenie struktur do przechowywania danych Wprowadzanie i aktualizacja danych w bazie danych Zapewnienie możliwości korzystania z bazy przez wielu użytkowników Automatyzacja archiwizacji i odtwarzania zasobów 3•14 © 2004, R. Robert Gajewski ! ! ! 4•14 Obraz bazy ! © 2004, R. Robert Gajewski Administrowanie danymi polega na polega na ustanowieniu i kontrolowaniu ogólnej polityki i szczegółowych procedur dotyczących danych, zbierania, przechowywania i rozpowszechniania ! ! przez komunikację z bazą danych z wykorzystaniem systemu zarządzania bazą danych lub odpowiedniej aplikacji. ! ! ! ! 5•14 Warunki unikatowości Warunki typu sprawdź czy Warunki wskazujące na powiązania danych Administrowanie danymi Obraz bazy może być tworzony na żądanie użytkownika: ! © 2004, R. Robert Gajewski © 2004, R. Robert Gajewski 6•14 Modyfikowanie modelu logicznego Kontrola zgodności struktury bazy z modelem logicznym Szkolenie personelu Ustalanie standardów projektowania bazy Ustalanie praw dostępu dla poszczególnych użytkowników Kontrola operacji z uwzględnieniem integralności bazy © 2004, R. Robert Gajewski 1 Administrowanie bazą Organizacja bazy Logiczna organizacja bazy danych ! ! ! Administrowanie bazą danych to funkcja techniczna. ! ! Dla użytkownika końcowego fakt wyboru określonej organizacji nie jest dostrzegalny. Wybór sposobu organizacji zależy od projektanta bazy danych. Wybór typu powinien być podyktowany: Projektowanie fizycznego zapisu bazy Współpraca z zespołem odpowiedzialnym za sprzęt ! ! 7•14 © 2004, R. Robert Gajewski Bazy hierarchiczne nie są stosowane w przypadku zależności wiele do wielu (m:n) – klasycznym przykładem są przedmioty (oceny z nich) i studenci. Sieciowa baza danych pozwala także na odwzorowanie zależności n:1, co daje większe możliwości przy definiowaniu struktury. Schemat sieciowy można zamienić na jeden lub wiele schematów hierarchicznych. Struktura sieciowa pozwala na dostęp do danych począwszy od pewnego punktu startowego według określonej ścieżki. Jeden departament może zatrudniać wielu pracowników (1:n) Jeden pracownik może być zatrudniony w jednym departamencie (1:1) Przy takiej strukturze bazy łatwo jest na przykład uzyskać informacje o imionach i nazwiskach wszystkich pracowników poszczególnych departamentów. 9•14 © 2004, R. Robert Gajewski Bazy sieciowe W hierarchicznej strukturze bazy danych zapisuje się zwykle zależności jeden do wielu (1:n), bądź też (1:1) w których rozróżniane są dwa poziomy – wyższy i niższy. ! © 2004, R. Robert Gajewski 10•14 Bazy relacyjne © 2004, R. Robert Gajewski SQL Relacyjna baza danych pozwala na zapisywanie danych w dwuwymiarowej tablicy relacji. Model relacyjny został po raz pierwszy przedstawiony w 1970 przez E.F. Codd’a. Może być ona zbudowana z wielu relacji, między którymi istnieją związki 1:n lub 1:1. Większość obecnie istniejących baz to bazy relacyjne. Użytkownicy poszukujący informacji w bazie wykorzystują języki zgodne ze standardem SQL – Structured Query Language. SQL został zatwierdzony w 1986 przez organizacje ANSI i ISO. Pozwala on na: ! ! ! ! © 2004, R. Robert Gajewski Wykonywanie operacji na danych Tworzenie obiektów bazy – tablic Zarządzanie prawami dostępu do bazy Definiowanie warunków integralności Projektowanie baz danych odbywa się często z wykorzystaniem narzędzi CASE – Computer Aided Software Engineering, często stosujących podejście obiektowe – ! ! ! 11•14 Szybkim wykonywaniem operacji na bazie Elastycznością w przypadku dokonywania zmian 8•14 Struktura hierarchiczna ! Hierarchiczna Sieciowa Relacyjna 12•14 analizę, projektowanie programowanie. © 2004, R. Robert Gajewski 2 Strategia budowy bazy Hurtownie danych Podczas etapu tworzenia strategii budowy bazy zapadają decyzje dotyczące obszaru rozpatrywanych zagadnień, koszcie przedsięwzięcia. Etap analizy prowadzi do powstania modelu koncepcyjnego. Podczas etapu projektowania model koncepcyjny ulega transformacji w model logiczny, który umożliwia utworzenie fizycznych struktur danych. Tworzenie dokumentacji, wdrożenie i eksploatacja systemu nie są procesami statycznymi. 13•14 © 2004, R. Robert Gajewski Idea hurtowni danych powstałą w połowie lat ’80, stąd brak jest dokładnej definicji tego pojęcia. Hurtownia danych to zbiór danych zorientowanych tematycznie, zintegrowanych, statycznych, nie zmieniających się w czasie, dedykowanych dla potrzeb procesów zarządzania. Hurtownie budowane się w celu wspierania zarządzania organizacją gospodarczą. 14•14 Systemy transakcyjne Cechy hurtowni (1) Współczesne systemy transakcyjne mogą gromadzić zbiory mierzone w Gigabajtach, zasoby informacyjne hurtowni mierzone są w Terabajtach. Hurtownie danych gromadzą dane dotyczące otoczenia, w którym działa przedsiębiorstwo: ! ! ! ! Zorientowanie tematyczne – wszystkie dane dotyczące jednego tematu przechowywane są w tym samym miejscu, co umożliwia na łatwy dostęp do informacji Integracja – proces wspomagany jest narzędziami odwzorowania i migracji danych Wspieranie procesów zarządzania konkurencji, kosztów, zatrudnienia, udziału w rynku 15•14 © 2004, R. Robert Gajewski ! © 2004, R. Robert Gajewski Hurtownie są przeznaczone przede wszystkim dla osób zarządzających organizacjami gospodarczymi 16•14 Cechy hurtowni (2) © 2004, R. Robert Gajewski Cechy hurtowni (3) Minimalizacja redundancji Niezmienność danych w czasie – dane hurtowni obejmują okres 5-10 lat, mają one więc do pewnego stopnia charakter historyczny. Statyczność – dane aktualizowane są wsadowo w określonych odstępach czasu, wprowadzona porcja danych pozostaje w hurtowni bez zmian; użytkownik nie ma prawa do zmiany danych. 17•14 © 2004, R. Robert Gajewski ! ! ! ! 18•14 Wprowadzane są jedynie te dane, które są tam niezbędne Większość danych podlega obróbce i zmianom zanim zostaną wprowadzone do hurtowni Hurtownia zawiera dane sumaryczne i zbiorcze, które nie istnieją w systemach dostarczających danych „Dylatacja” czasowa powoduje, że dane w hurtowni są zawsze „starsze” od danych źródłowych © 2004, R. Robert Gajewski 3 Typy danych w hurtowni Hurtownia danych ma jednoznaczną strukturę, w skład której wchodzą różne typy danych: ! ! ! ! Dane operacyjne – aby zapewnić szybki dostęp do tych danych są one indeksowane. Dane referencyjne – zawierają informacje, które są szczegółowym opisem odpowiednich wartości, znajdujących się w hurtowni. Dane sumaryczne – stanowią zagregowane (np. zsumowane) dane operacyjne; ich odpowiednie zaprojektowanie wpływa na skrócenie czasu realizacji zapytania skierowanego do hurtowni. Metadane – zawierają informacje o innych typach danych, ich lokalizacji, strukturze i znaczeniu. 19•14 © 2004, R. Robert Gajewski 20•14 © 2004, R. Robert Gajewski 21•14 © 2004, R. Robert Gajewski 22•14 © 2004, R. Robert Gajewski 23•14 © 2004, R. Robert Gajewski 24•14 © 2004, R. Robert Gajewski 4