Otoczenie SO PZ SI
Transkrypt
Otoczenie SO PZ SI
BAZY DANYCH Pojęcie systemu informacyjnego i informatycznego • DANE – wszelkie liczby, fakty, pojęcia zarejestrowane w celu uzyskania wiedzy o realnym świecie. INFORMACJA - znaczenie przypisywane danym. • SYSTEM INFORMACYJNY - całokształt przedsięwzięć organizacyjno sprzętowych związanych ze: - zbieraniem danych, - przechowywaniem danych, - przetwarzaniem danych, - udostępnieniem danych. • SYSTEM INFORMATYCZNY – system informacyjny zbudowany w oparciu o technikę komputerową. • BAZA DANYCH– zestaw danych powiązanych ze sobą wspólnym tematem lub celem, posiadających odpowiednią strukturę, przechowywanych na nośniku, tj. w komputerze. Obsługa BD realizowana jest przy pomocy specjalnego oprogramowania zwanego Systemem Zarządzania BD (DBMS – ang. Data Base Management System) SYSTEM ORGANIZACYJNY Udostępnianie danych Przetwarzanie danych SO Przechowywan ie danych Otoczenie D PZ SI Zbieranie danych PR SO- system organizacyjny, SI - system informatyczny PZ - podsystem zarządzania, D - element decyzyjny, PR- podsystem roboczy, dane, dane sterujące, strumień energii i materiałów Podstawowe pojęcia Baz Danych Podstawowymi pojęciami związanymi z BD są: - REKORD (ang. Record) – jest podstawowy zbiór danych traktowanych jako jednostka. Rekord jest więc kolekcją danych różnych typów opisujących jednostkowy element lub zdarzenie. Przykładem rekordu mogą być np. dane osobowe, obejmujące: nazwisko, imię, adres, datę urodzenia, identyfikator itp. Każda osoba stanowi wówczas jeden rekord, a ich zbiór stanowi prostą BD. Strukturę rekordu tj. zestaw par: nazwa atrybutu – typ atrybutu, określa się mianem typu rekordu. - POLE (ang. Field) – jest to element rekordu stanowiący wartość danej lub odniesienie (wskaźnik) do innego pola, inaczej, obszar tabeli lub formularza, w którym wpisujemy lub przeglądamy informacje nt. pojedynczego zadania lub źródła. Często Polem określa się też parę określającą nazwę i typ przechowywanej wartości. - KARTOTEKA (ang. File) – zbiór rekordów traktowanych jako jednostka. Kartoteka tworzona jest najczęściej jako zbiór rekordów tego samego typu (o tych samych typach atrybutów). Stanowi więc logiczną całość i reprezentowana jest często jako odrębny plik komputerowy. Stąd często kartoteka rozumiana jest jako plik. Podstawowe pojęcia Baz Danych Nowoczesne BD mają zdolność szybkiego wyszukiwania i łączenia informacji przy pomocy kwerend, formularzy, raportów. Aby to było możliwe w tabelach muszą być pola jednoznacznie identyfikujące rekord. - POLE KLUCZOWE albo KLUCZEM PODSTAWOWYM – pole jednoznacznie identyfikujące rekord; - KLUCZ ZŁOŻONY – kombinacja kilku pól identyfikująca rekord. - INDEKSOWANIE - stosuje się w celu skrócenia czasu wyszukiwania rekordów. Polega ono na zebraniu informacji o tym w jakiej kolejności powinny być podawane rekordy, aby były uporządkowane. - Indeksowanie może odbywać się według jednego lub kilku pól. Podstawowe pojęcia Baz Danych Systemy zarządzania BD wykorzystują różne obiekty ułatwiające te zadania. Należą do nich: - FORMULARZE – obiekt systemu BD służący do wprowadzania, uaktualniania i przeglądania danych. Ma przyjazny dla użytkownika interfejs. - RAPORTY – obiekt systemu BD umożliwiający pobieranie danych z BD w celu ich wyświetlenia na ekranie monitora albo wydrukowanie. - KWERENDY(zapytania) – narzędzie służące do wyszukiwania i wykonywania analiz i modyfikacji danych w BD; Podstawowe pojęcia Baz Danych Przeglądanie danych w bazach danych umożliwiają takie narzędzia jak: - FILTROWANIE – filtr - zestaw ograniczeń nakładanych na rekordy, które pozwalają je selekcjonować. Filtry nie zmieniają danych a jedynie pozwalają na przeglądanie informacji których potrzebujemy. - SORTOWANIE – proces układania rekordów według zadanej kolejności i zadanego sposobu ( np. alfabetycznie, rosnąco, malejąco) MODELE BAZ DANYCH Do najbardziej znanych modeli baz danych zalicza się : - proste (kartotekowe) bazy danych (arkusze, tabele), - hierarchiczne bazy danych, - sieciowe bazy danych, relacyjne bazy danych, - obiektowe bazy danych. Proste bazy danych Proste bazy danych obejmują uporządkowane dane w formie jednej lub wielu kartotek nie powiązanych ze sobą żadnymi relacjami. Najprostsze reprezentacje kartotek to arkusze (tabele) danych. Tabela określona przez zdefiniowaną wcześniej strukturę, a więc rodzaj i nazwę kolumn (typy pól/argumentów), gromadzi informacje w formie rosnącej liczby rekordów (wierszy tabeli). Gromadzenie danych w arkuszach polega przeważnie na dopisywaniu kolejnych rekordów w aktualnej tabeli. W przypadku dużej liczby danych lub różnej tematyce danych tworzy się zbiór tabel. Przykładowym zastosowaniem tego modelu może być zapis rozkładu dyżurów (kartoteka / tabela) obejmujący zestaw atrybutów (nazwisko i imię, data, godziny, oddział) dla każdego lekarza. Inne typowe zastosowania prostych baz danych to wszelkie listy substancji toksycznych, leków, spisu telefonów wewnętrznych w szpitalu, itp. Zaletą tego systemu gromadzenia danych jest prosta i popularna forma przechowywania danych. Hierarchiczne bazy danych Hierarchiczna forma przechowywania danych zakłada grupowanie danych w formie kolejnych poziomów drzewa danych. Począwszy od zbioru podstawowego, będącego korzeniem poprzez kolejne podzbiory - rozgałęzienia dochodzimy do ostatnich zbiorów danych korony drzewa. System hierarchiczny jest często przedstawiany poprzez model rodzic-potomek. Rodzic posiada pewną liczbę potomków, potomkowie ci mogą mieć swoich potomków, ci z kolei ... Zbiór danych w tym modelu (najczęściej w formie pojedynczej tabeli) jest powiązany (ma relacje) z innymi zbiorami w tym samym drzewie (w tej samej rodzinie). Wyszukiwanie danych polega więc na kolejnym zagłębianiu się w coraz to kolejne zbiory danych. Specyficzna budowa takiej bazy danych umożliwia tworzenie prostych kryteriów wyszukiwania danych i w miarę potrzeby uszczegółowiania tych kryteriów wraz ze znajdowaniem kolejnych partii danych. Hierarchiczne bazy danych cd Często wadą tego modelu jest brak możliwości budowania relacji pomiędzy rekordami różnych drzew. Hierarchiczna baza danych zakłada podstawowe warunki integralności danych: • każdy rekord (z wyjątkiem pierwszego rodzica - korzenia drzewa) musi posiadać własnego, jednego rodzica, • jeżeli dany rekord posiada więcej rodziców niż jeden, musi być skopiowany dla każdego rodzica oddzielnie tak, aby prawdziwa była powyższa zasada, • jeżeli usunięty zostaje dany rekord oznacza to, że usunięte zostają również wszystkie wywodzące się z niego rekordy - potomkowie. Podstawową relacją jaka występuje w tym modelu jest; jeden do wielu ( korzeń - gałęzie) i wielu do jednego (gałęzie - korzeń). Dobrym przykładem hierarchicznej organizacji kartotek jest praktycznie każdy komputerowy system plików. Sieciowe bazy danych Termin sieciowe bazy danych nie określa w tym przypadku baz danych pracujących w sieciach komputerowych. Pojęcie sieci odnosi się tutaj do formy relacji pomiędzy poszczególnymi zbiorami danych (rekordami). W modelu tym możliwe jest powiązanie dowolnego zbioru danych z każdym innym. Relacyjne bazy danych Najprostsza BD może składać się z jednej tabeli. W przypadku niewielkiej liczby danych jest to zupełnie wystarczające. Jednak gdy danych jest więcej i mają bardziej złożony charakter, wtedy BD oparta na 1 tabeli może nie sprostać naszym oczekiwaniom. Ponadto mogą w niej wystąpić błędy utrudniające a niekiedy wręcz uniemożliwiające jej funkcjonowanie. Najważniejsze wady takiej BD opartej na jednej tabeli to: - zjawisko redudancji – czyli powtarzania się informacji; - anomalie aktualizacji BD – w przypadku zmiany danych jednej osoby trzeba wyszukać i zmienić wszystkie rekordy dotyczące tej osoby; - anomalie przy usuwaniu – gdy osoba odda np. wszystkie książki, wszystkie dane o tej osobie są usuwane. Relacyjne bazy danych Model relacyjny jest opisywany poprzez trzy podstawowe elementy: • konstrukcję typów rekordów (tabele, zwane również relacjami), • reguły integralności danych (dopuszczalne wartości i ich kombinacje w tabelach), • operatory przetwarzania danych (algebra relacyjna). Wszystkie rekordy wchodzące w skład tabeli mają jednakową liczbę pól posiadających określony typ danych i zdefiniowanych na etapie projektowania BD. Relacyjne bazy danych Zależnie od przyjętego typu pola mogą w nim byś przechowywane różne dane. Pola mogą być typu: - znakowy (tekstowy) o określonej długości w znakach; - numeryczny (liczbowy) - typ daty – format zależ od przyjętych w systemie komputerowym ustawień; - typ logiczny; - typ Memo – do 255 znaków. BD nie może być zbiorem przypadkowych danych . Dlatego podział danych między tabele powinien być przeprowadzony w sposób przemyślany, podobnie jaki relacje między tabelami. Relacyjne bazy danych Relacyjna BD – baza, która umożliwia przechowywanie i wyszukiwanie informacji zgodnie z relacjami zdefiniowanymi przez użytkownika. Relacja – powiązanie, związek pomiędzy różnymi tabelami w BD za pomocą połączonych pól, które muszą być tego samego typu ! Relacje w BD mogą być następującego rodzaju: - 1 do 1 - 1 do n (jeden do wielu) - N do 1 (wiele do jednego); - N do n (wiele do wiele. Najczęściej występują relacje 1 do n. Nowoczesne BD mają zdolność szybkiego wyszukiwania i łączenia informacji przy pomocy kwerend, formularzy i raportów. Aby to było jednak możliwe, w tabelach muszą być pola jednoznacznie identyfikujące rekord. Pola takie noszą nazwę pól kluczowych albo klucz podstawowy.