O bazach danych Co to jest baza danych System zarządzania bazą

Transkrypt

O bazach danych Co to jest baza danych System zarządzania bazą
Co to jest baza danych
Baza danych to zbiór wzajemnie powiązanych
ze sobą i zintegrowanych danych z pewnej
dziedziny.
Zadania baz danych:
O bazach danych
R. Robert Gajewski
omklnx.il.pw.edu.pl/~rgajewski
www.il.pw.edu.pl/~rg
[email protected]
!
!
!
Likwidacja lub znaczne ograniczenie redundancji
(powtarzania się) danych
Integracja danych
Bezpieczeństwo danych
2•14
Rekord, pole, relacje...
System zarządzania bazą
System zarządzania bazą danych to zbiór
programów umożliwiających zapamiętywanie,
manipulowanie i przetwarzanie danych i
zapewniający użytkownikom bezpieczeństwo,
poufność i integralność danych.
!
!
!
!
Podstawowy element bazy to rekord.
Poszczególne jednostki informacji w rekordzie to
pola.
Dane w bazie są powiązane, co oznacza, że
istnieją między nimi określone relacje, związki.
Warunki integralności do zdefiniowane przez
użytkownika reguły, pozwalające zachować
poprawność danych.
Tworzenie struktur do przechowywania danych
Wprowadzanie i aktualizacja danych w bazie
danych
Zapewnienie możliwości korzystania z bazy przez
wielu użytkowników
Automatyzacja archiwizacji i odtwarzania
zasobów
3•14
© 2004, R. Robert Gajewski
!
!
!
4•14
Obraz bazy
!
© 2004, R. Robert Gajewski
Administrowanie danymi polega na polega
na ustanowieniu i kontrolowaniu ogólnej polityki
i szczegółowych procedur dotyczących danych,
zbierania, przechowywania i rozpowszechniania
!
!
przez komunikację z bazą danych
z wykorzystaniem systemu zarządzania bazą danych
lub odpowiedniej aplikacji.
!
!
!
!
5•14
Warunki unikatowości
Warunki typu sprawdź czy
Warunki wskazujące na powiązania danych
Administrowanie danymi
Obraz bazy może być tworzony na żądanie
użytkownika:
!
© 2004, R. Robert Gajewski
© 2004, R. Robert Gajewski
6•14
Modyfikowanie modelu logicznego
Kontrola zgodności struktury bazy z modelem
logicznym
Szkolenie personelu
Ustalanie standardów projektowania bazy
Ustalanie praw dostępu dla poszczególnych
użytkowników
Kontrola operacji z uwzględnieniem integralności bazy
© 2004, R. Robert Gajewski
1
Administrowanie bazą
Organizacja bazy
Logiczna organizacja bazy danych
!
!
!
Administrowanie bazą danych to funkcja
techniczna.
!
!
Dla użytkownika końcowego fakt wyboru
określonej organizacji nie jest dostrzegalny.
Wybór sposobu organizacji zależy od projektanta
bazy danych.
Wybór typu powinien być podyktowany:
Projektowanie fizycznego zapisu bazy
Współpraca z zespołem odpowiedzialnym za sprzęt
!
!
7•14
© 2004, R. Robert Gajewski
Bazy hierarchiczne nie są stosowane w
przypadku zależności wiele do wielu (m:n) –
klasycznym przykładem są przedmioty (oceny z
nich) i studenci.
Sieciowa baza danych pozwala także na
odwzorowanie zależności n:1, co daje większe
możliwości przy definiowaniu struktury.
Schemat sieciowy można zamienić na jeden
lub wiele schematów hierarchicznych.
Struktura sieciowa pozwala na dostęp do danych
począwszy od pewnego punktu startowego
według określonej ścieżki.
Jeden departament może zatrudniać wielu
pracowników (1:n)
Jeden pracownik może być zatrudniony w jednym
departamencie (1:1)
Przy takiej strukturze bazy łatwo jest na
przykład uzyskać informacje o imionach i
nazwiskach wszystkich pracowników
poszczególnych departamentów.
9•14
© 2004, R. Robert Gajewski
Bazy sieciowe
W hierarchicznej strukturze bazy danych
zapisuje się zwykle zależności jeden do wielu
(1:n), bądź też (1:1) w których rozróżniane są
dwa poziomy – wyższy i niższy.
!
© 2004, R. Robert Gajewski
10•14
Bazy relacyjne
© 2004, R. Robert Gajewski
SQL
Relacyjna baza danych pozwala na
zapisywanie danych w dwuwymiarowej tablicy
relacji.
Model relacyjny został po raz pierwszy
przedstawiony w 1970 przez E.F. Codd’a.
Może być ona zbudowana z wielu relacji, między
którymi istnieją związki 1:n lub 1:1.
Większość obecnie istniejących baz to bazy
relacyjne.
Użytkownicy poszukujący informacji w bazie
wykorzystują języki zgodne ze standardem SQL
– Structured Query Language.
SQL został zatwierdzony w 1986 przez
organizacje ANSI i ISO. Pozwala on na:
!
!
!
!
© 2004, R. Robert Gajewski
Wykonywanie operacji na danych
Tworzenie obiektów bazy – tablic
Zarządzanie prawami dostępu do bazy
Definiowanie warunków integralności
Projektowanie baz danych odbywa się często
z wykorzystaniem narzędzi CASE – Computer
Aided Software Engineering, często stosujących
podejście obiektowe –
!
!
!
11•14
Szybkim wykonywaniem operacji na bazie
Elastycznością w przypadku dokonywania zmian
8•14
Struktura hierarchiczna
!
Hierarchiczna
Sieciowa
Relacyjna
12•14
analizę,
projektowanie
programowanie.
© 2004, R. Robert Gajewski
2
Strategia budowy bazy
Hurtownie danych
Podczas etapu tworzenia strategii budowy
bazy zapadają decyzje dotyczące obszaru
rozpatrywanych zagadnień, koszcie
przedsięwzięcia.
Etap analizy prowadzi do powstania modelu
koncepcyjnego.
Podczas etapu projektowania model koncepcyjny
ulega transformacji w model logiczny, który
umożliwia utworzenie fizycznych struktur
danych.
Tworzenie dokumentacji, wdrożenie i
eksploatacja systemu nie są procesami
statycznymi.
13•14
© 2004, R. Robert Gajewski
Idea hurtowni danych powstałą w połowie lat
’80, stąd brak jest dokładnej definicji tego
pojęcia.
Hurtownia danych to zbiór danych
zorientowanych tematycznie, zintegrowanych,
statycznych, nie zmieniających się w czasie,
dedykowanych dla potrzeb procesów
zarządzania.
Hurtownie budowane się w celu wspierania
zarządzania organizacją gospodarczą.
14•14
Systemy transakcyjne
Cechy hurtowni (1)
Współczesne systemy transakcyjne mogą
gromadzić zbiory mierzone w Gigabajtach,
zasoby informacyjne hurtowni mierzone są w
Terabajtach.
Hurtownie danych gromadzą dane dotyczące
otoczenia, w którym działa przedsiębiorstwo:
!
!
!
!
Zorientowanie tematyczne – wszystkie dane
dotyczące jednego tematu przechowywane są w
tym samym miejscu, co umożliwia na łatwy
dostęp do informacji
Integracja – proces wspomagany jest
narzędziami odwzorowania i migracji danych
Wspieranie procesów zarządzania
konkurencji,
kosztów,
zatrudnienia,
udziału w rynku
15•14
© 2004, R. Robert Gajewski
!
© 2004, R. Robert Gajewski
Hurtownie są przeznaczone przede wszystkim dla
osób zarządzających organizacjami gospodarczymi
16•14
Cechy hurtowni (2)
© 2004, R. Robert Gajewski
Cechy hurtowni (3)
Minimalizacja redundancji
Niezmienność danych w czasie – dane
hurtowni obejmują okres 5-10 lat, mają one
więc do pewnego stopnia charakter historyczny.
Statyczność – dane aktualizowane są wsadowo
w określonych odstępach czasu, wprowadzona
porcja danych pozostaje w hurtowni bez zmian;
użytkownik nie ma prawa do zmiany danych.
17•14
© 2004, R. Robert Gajewski
!
!
!
!
18•14
Wprowadzane są jedynie te dane, które są tam
niezbędne
Większość danych podlega obróbce i zmianom zanim
zostaną wprowadzone do hurtowni
Hurtownia zawiera dane sumaryczne i zbiorcze, które
nie istnieją w systemach dostarczających danych
„Dylatacja” czasowa powoduje, że dane w hurtowni
są zawsze „starsze” od danych źródłowych
© 2004, R. Robert Gajewski
3
Typy danych w hurtowni
Hurtownia danych ma jednoznaczną strukturę, w
skład której wchodzą różne typy danych:
!
!
!
!
Dane operacyjne – aby zapewnić szybki dostęp do
tych danych są one indeksowane.
Dane referencyjne – zawierają informacje, które są
szczegółowym opisem odpowiednich wartości,
znajdujących się w hurtowni.
Dane sumaryczne – stanowią zagregowane (np.
zsumowane) dane operacyjne; ich odpowiednie
zaprojektowanie wpływa na skrócenie czasu realizacji
zapytania skierowanego do hurtowni.
Metadane – zawierają informacje o innych typach
danych, ich lokalizacji, strukturze i znaczeniu.
19•14
© 2004, R. Robert Gajewski
20•14
© 2004, R. Robert Gajewski
21•14
© 2004, R. Robert Gajewski
22•14
© 2004, R. Robert Gajewski
23•14
© 2004, R. Robert Gajewski
24•14
© 2004, R. Robert Gajewski
4

Podobne dokumenty