Multimedialne bazy danych

Transkrypt

Multimedialne bazy danych
1
Multimedialne bazy danych
Andrzej Łachwa, WFAiIS UJ 2011
1. Hiperteksty
Hipertekst jest systemem informacyjnym, w
którym informacja jest wyrażona w postaci
niezależnych tekstów przechowywanych w
węzłach, na które nałożona jest sieć rozmaitych powiązań i który oferuje jakieś „urządzenia” wyszukiwania informacji.
Hiperteksty można podzielić na dwa typy:
► konwencjonalne i
► bazodanowe.
W hipertekście konwencjonalnym zbiór węzłów
jest zamknięty, zaczepienia powiązań umieszczone są na stałe w węzłach w czasie tworzenia
systemu, a urządzenia wyszukiwawcze działają
w oparciu o ustalone indeksy oraz ustalone
sieci powiązań węzłów.
Przykłady …
W hipertekstach drugiego typu (bazodanowych) oddziela się bazę węzłów od struktury
powiązań. Takie niezależne struktury są łatwe
do modyfikacji, a także pozwalają na tworzenie
różnych sieci powiązań dla jednej bazy węzłów.
Urządzenia wyszukiwawcze muszą wtedy
działać na modyfikowalnych zbiorach danych.
Przykłady …
Hipertekstu nie czytamy liniowo (jak powieść),
ale jak encyklopedię. Zaczynamy go przeglądać
od dowolnego wyszukanego węzła, po czym
przenosimy się do następnego albo poprzez
wiązania hipertekstowe, albo przez użycie
wyników wyszukania.
W zasadzie wiązania hipertekstowe mogą być
typu „jeden do wielu”. W praktyce spotykane są
one bardzo rzadko.
Możliwe jest nałożenie na węzły różnych sieci
powiązań.
Struktura tradycyjnej – atrybutowej (!) – bazy
danych reprezentowana jest w jej schemacie,
a wszystkie zapytania odwołują się do tej
sztywnej struktury: nazw tabel, nazw
atrybutów i zakresów wartości atrybutów.
Schemat hipertekstu możemy wyprowadzić
z siatek powiązań, ale jego znajomość ma
niewielki wpływ na proces tworzenia kwerend.
„Hipertekst to organizacja danych w postaci
niezależnych leksji połączonych hiperłączami.
Hipertekst cechuje nielinearność i niestrukturalność układu leksji. Oznacza to, że nie ma z
góry zdefiniowanej kolejności czytania leksji,
a nawigacja między nimi zależy wyłącznie od
użytkownika. Najbardziej znanym systemem
hipertekstowym jest sieć WWW, chociaż
posiada ona pewne ograniczenia w stosunku do
innych systemów, takich jak HyperCard czy
Storyspace (np. nie są przewidziane połączenia
leksji/stron jeden do wielu).”
[http://pl.wikipedia.org, 12.10.2011]
„Według Teda Nelsona, autora terminu
hipertekst, WWW jest mocno ograniczoną,
nieudaną próbą zastosowania idei hipertekstu …”
[http://pl.wikipedia.org, 12.10.2011]
Za prekursorów koncepcji hipertesktu uznaje
się Paula Otleta (Belg, twórca uniwersalnej
klasyfikacji dziesiętnej), Vannevara Busha
(MIT, idea sieci komputerowych i hipertekstu),
Teda Nelsona (transkluzja, koncepcja Xanadu),
Douglasa Engelbarta (Stanford, wynalazca
myszy i okien) i Tima Berners-Lee (twórca
Internetu).
2. Multimedia/Hipermedia
Multimedialne bazy danych to systemy informacyjne …
► … w których informacja przechowywana jest
w węzłach różnego rodzaju mediów (np. teksty,
dźwięki, filmy, obrazy) połączonych za pomocą
„wiązań asocjacyjnych” i
► … które oferują użytkownikom zarówno
możliwość nawigacji, jak i korzystanie z
„urządzeń wyszukiwawczych”.
Przykłady …
HyperCard (Apple, 1987). Aplikacja pozwalająca
na organizowanie własnych zasobów informacji
w postaci stosu fiszek, które mogły zawierać tekst,
grafikę, dźwięk, animacje i wideo. Użytkownik
mógł je odczytywać jak stronice książki, a co
istotne, karty mogły zawierać odsyłacze łączące
poszczególne karty zgodnie z logiką treści.
Język skryptowy HyperTalk pozwalał tworzyć
własne złożone aplikacje hipertekstowe na danych
z HyperCard.
HTML Help (1996) – format plików pomocy w
systemie Windows. Plik *chm zbudowany jest z
dokumentów HTML, odsyłaczy hipertekstowych,
spisu treści, skorowidza i systemu wyszukiwania
pełnotekstowego.
Przykłady:
► Microsoft HTML Help 1.4 SDK
► produkt firmy Adobe: RoboHelp
Microsoft Help Viewer 1.0
http://www.microsoft.com/download/en/confirmation.as
px?id=14923
Microsoft Help Viewer 1.1
http://msdn.microsoft.com/en-us/library/dd264827.aspx
MadCap Help Viewer V6
http://www.madcapsoftware.com/downloads/redistribut
ables.aspx
Według wielu autorów o multimedialnych bazach
danych możemy mówić wtedy, gdy mamy:
► obiekty medialne (dyskretne: tekst i obraz,
ciągłe: audio i wideo, oraz złożone) tworzące bazę
multimedialną,
► system multimedialny (system wspierający
wymianę informacji z użytkownikiem za pomocą
kilku różnych mediów),
► system zarządzania bazą, który wspiera i
obsługuje dane medialne w zakresie ich
składowania, wyszukiwania i przetwarzania
(czyli tak, jak SZRBD obsługują dane
alfanumeryczne).
Od multimedialnych baz danych odróżnia się bazy
danych z multimedialną zawartością, np.:
► katalogi zdjęć z miniaturami prowadzącymi do
obrazów w pełnej rozdzielczości,
► systemy „wideo na żądanie” z wyszukiwaniem
dotyczącym opisu „parametrów” filmu (aktor,
tytuł, streszczenie …),
► księgarnie internetowe ze zdjęciami okładek,
abstraktami, spisami treści i próbkami tekstów,
►… zdjęciami okładek płyt, spisami zawartości i
próbkami utworów
─ o ile tylko wyszukiwanie zorganizowane jest
tradycyjnie, tj. gdy obiektami przeszukiwanymi są
opisy zdjęć, filmów, książek czy płyt .
Multimedialną zawartość da się „upchnąć” do
popularnych relacyjnych bądź obiektoworelacyjnych baz danych, np:
► MySQL,
► PostgreSQL,
► MS SQL Server,
► Oracle,
► DB2 …
w postaci obiektów typu BLOB.
Wtedy do każdego takiego obiektu dodaje się
„nagłówek”, tj. pewien opis zawartości obiektu
binarnego i wszelkie operacje wyszukiwania
mogą uwzględniać wyłącznie zawartość tych
nagłówków.
Jednak można iść krok dalej. Na przykład w
strukturze nagłówka umieścić listę słów
kluczowych charakteryzujących treść obiektu
binarnego (załóżmy, że da się to zrobić w sposób
zautomatyzowany przy pomocy procedury X).
W takiej sytuacji da się już wyszukiwać obrazy,
filmy, nagrania dźwiękowe, teksty języka
naturalnego – według zawartych w nich treści!
Jeżeli teraz usuniemy z nagłówków opisy treści,
a procedurę X włączymy do procesu
wyszukiwania treści na żądanie, to taka baza
będzie z pewnością bazą multimedialną, a nie
zwykłą bazą relacyjną z multimedialną
zawartością.
Dodatki:
CitySimulator, SQL Compact i 2 narzędzia
- propozycja tematu podobnego do edytora
kwartałów
Help Viewer
- propozycja tematu
Słownik języka polskiego [www.sjp.pl]
- propozycja tematu
Transkluzja (dosł. przeniesienie i włączenie) - sposób
włączenia w systemie hipertekstowym fragmentów
innych dokumentów.
Przykładowo, artykuł o gospodarce jakiegoś kraju
mógłby zawierać wykres czy akapit opisujący eksport
produktów rolnych pochodzący z innego artykułu.
Zamiast kopiować dane z dokumentu źródłowego do
docelowego i utrzymywać w ten sposób dwie kopie,
można dokonać transkluzji, czyli odwołania się w
dokumencie docelowym do dokumentu źródłowego,
które spowoduje wyświetlenie fragmentu dokumentu
źródłowego w docelowym. Zaletą takiego rozwiązania
jest również aktualność tego fragmentu, którego
zawartość może się zmieniać, gdy jego autor dokona
poprawek. Odwołanie to służy też jako wzajemny
odsyłacz między oboma dokumentami.
[http://pl.wikipedia.org, 12.10.2011]
powrót