Multimedialne bazy danych
Transkrypt
Multimedialne bazy danych
1 Multimedialne bazy danych Andrzej Łachwa, WFAiIS UJ 2011 1. Hiperteksty Hipertekst jest systemem informacyjnym, w którym informacja jest wyrażona w postaci niezależnych tekstów przechowywanych w węzłach, na które nałożona jest sieć rozmaitych powiązań i który oferuje jakieś „urządzenia” wyszukiwania informacji. Hiperteksty można podzielić na dwa typy: ► konwencjonalne i ► bazodanowe. W hipertekście konwencjonalnym zbiór węzłów jest zamknięty, zaczepienia powiązań umieszczone są na stałe w węzłach w czasie tworzenia systemu, a urządzenia wyszukiwawcze działają w oparciu o ustalone indeksy oraz ustalone sieci powiązań węzłów. Przykłady … W hipertekstach drugiego typu (bazodanowych) oddziela się bazę węzłów od struktury powiązań. Takie niezależne struktury są łatwe do modyfikacji, a także pozwalają na tworzenie różnych sieci powiązań dla jednej bazy węzłów. Urządzenia wyszukiwawcze muszą wtedy działać na modyfikowalnych zbiorach danych. Przykłady … Hipertekstu nie czytamy liniowo (jak powieść), ale jak encyklopedię. Zaczynamy go przeglądać od dowolnego wyszukanego węzła, po czym przenosimy się do następnego albo poprzez wiązania hipertekstowe, albo przez użycie wyników wyszukania. W zasadzie wiązania hipertekstowe mogą być typu „jeden do wielu”. W praktyce spotykane są one bardzo rzadko. Możliwe jest nałożenie na węzły różnych sieci powiązań. Struktura tradycyjnej – atrybutowej (!) – bazy danych reprezentowana jest w jej schemacie, a wszystkie zapytania odwołują się do tej sztywnej struktury: nazw tabel, nazw atrybutów i zakresów wartości atrybutów. Schemat hipertekstu możemy wyprowadzić z siatek powiązań, ale jego znajomość ma niewielki wpływ na proces tworzenia kwerend. „Hipertekst to organizacja danych w postaci niezależnych leksji połączonych hiperłączami. Hipertekst cechuje nielinearność i niestrukturalność układu leksji. Oznacza to, że nie ma z góry zdefiniowanej kolejności czytania leksji, a nawigacja między nimi zależy wyłącznie od użytkownika. Najbardziej znanym systemem hipertekstowym jest sieć WWW, chociaż posiada ona pewne ograniczenia w stosunku do innych systemów, takich jak HyperCard czy Storyspace (np. nie są przewidziane połączenia leksji/stron jeden do wielu).” [http://pl.wikipedia.org, 12.10.2011] „Według Teda Nelsona, autora terminu hipertekst, WWW jest mocno ograniczoną, nieudaną próbą zastosowania idei hipertekstu …” [http://pl.wikipedia.org, 12.10.2011] Za prekursorów koncepcji hipertesktu uznaje się Paula Otleta (Belg, twórca uniwersalnej klasyfikacji dziesiętnej), Vannevara Busha (MIT, idea sieci komputerowych i hipertekstu), Teda Nelsona (transkluzja, koncepcja Xanadu), Douglasa Engelbarta (Stanford, wynalazca myszy i okien) i Tima Berners-Lee (twórca Internetu). 2. Multimedia/Hipermedia Multimedialne bazy danych to systemy informacyjne … ► … w których informacja przechowywana jest w węzłach różnego rodzaju mediów (np. teksty, dźwięki, filmy, obrazy) połączonych za pomocą „wiązań asocjacyjnych” i ► … które oferują użytkownikom zarówno możliwość nawigacji, jak i korzystanie z „urządzeń wyszukiwawczych”. Przykłady … HyperCard (Apple, 1987). Aplikacja pozwalająca na organizowanie własnych zasobów informacji w postaci stosu fiszek, które mogły zawierać tekst, grafikę, dźwięk, animacje i wideo. Użytkownik mógł je odczytywać jak stronice książki, a co istotne, karty mogły zawierać odsyłacze łączące poszczególne karty zgodnie z logiką treści. Język skryptowy HyperTalk pozwalał tworzyć własne złożone aplikacje hipertekstowe na danych z HyperCard. HTML Help (1996) – format plików pomocy w systemie Windows. Plik *chm zbudowany jest z dokumentów HTML, odsyłaczy hipertekstowych, spisu treści, skorowidza i systemu wyszukiwania pełnotekstowego. Przykłady: ► Microsoft HTML Help 1.4 SDK ► produkt firmy Adobe: RoboHelp Microsoft Help Viewer 1.0 http://www.microsoft.com/download/en/confirmation.as px?id=14923 Microsoft Help Viewer 1.1 http://msdn.microsoft.com/en-us/library/dd264827.aspx MadCap Help Viewer V6 http://www.madcapsoftware.com/downloads/redistribut ables.aspx Według wielu autorów o multimedialnych bazach danych możemy mówić wtedy, gdy mamy: ► obiekty medialne (dyskretne: tekst i obraz, ciągłe: audio i wideo, oraz złożone) tworzące bazę multimedialną, ► system multimedialny (system wspierający wymianę informacji z użytkownikiem za pomocą kilku różnych mediów), ► system zarządzania bazą, który wspiera i obsługuje dane medialne w zakresie ich składowania, wyszukiwania i przetwarzania (czyli tak, jak SZRBD obsługują dane alfanumeryczne). Od multimedialnych baz danych odróżnia się bazy danych z multimedialną zawartością, np.: ► katalogi zdjęć z miniaturami prowadzącymi do obrazów w pełnej rozdzielczości, ► systemy „wideo na żądanie” z wyszukiwaniem dotyczącym opisu „parametrów” filmu (aktor, tytuł, streszczenie …), ► księgarnie internetowe ze zdjęciami okładek, abstraktami, spisami treści i próbkami tekstów, ►… zdjęciami okładek płyt, spisami zawartości i próbkami utworów ─ o ile tylko wyszukiwanie zorganizowane jest tradycyjnie, tj. gdy obiektami przeszukiwanymi są opisy zdjęć, filmów, książek czy płyt . Multimedialną zawartość da się „upchnąć” do popularnych relacyjnych bądź obiektoworelacyjnych baz danych, np: ► MySQL, ► PostgreSQL, ► MS SQL Server, ► Oracle, ► DB2 … w postaci obiektów typu BLOB. Wtedy do każdego takiego obiektu dodaje się „nagłówek”, tj. pewien opis zawartości obiektu binarnego i wszelkie operacje wyszukiwania mogą uwzględniać wyłącznie zawartość tych nagłówków. Jednak można iść krok dalej. Na przykład w strukturze nagłówka umieścić listę słów kluczowych charakteryzujących treść obiektu binarnego (załóżmy, że da się to zrobić w sposób zautomatyzowany przy pomocy procedury X). W takiej sytuacji da się już wyszukiwać obrazy, filmy, nagrania dźwiękowe, teksty języka naturalnego – według zawartych w nich treści! Jeżeli teraz usuniemy z nagłówków opisy treści, a procedurę X włączymy do procesu wyszukiwania treści na żądanie, to taka baza będzie z pewnością bazą multimedialną, a nie zwykłą bazą relacyjną z multimedialną zawartością. Dodatki: CitySimulator, SQL Compact i 2 narzędzia - propozycja tematu podobnego do edytora kwartałów Help Viewer - propozycja tematu Słownik języka polskiego [www.sjp.pl] - propozycja tematu Transkluzja (dosł. przeniesienie i włączenie) - sposób włączenia w systemie hipertekstowym fragmentów innych dokumentów. Przykładowo, artykuł o gospodarce jakiegoś kraju mógłby zawierać wykres czy akapit opisujący eksport produktów rolnych pochodzący z innego artykułu. Zamiast kopiować dane z dokumentu źródłowego do docelowego i utrzymywać w ten sposób dwie kopie, można dokonać transkluzji, czyli odwołania się w dokumencie docelowym do dokumentu źródłowego, które spowoduje wyświetlenie fragmentu dokumentu źródłowego w docelowym. Zaletą takiego rozwiązania jest również aktualność tego fragmentu, którego zawartość może się zmieniać, gdy jego autor dokona poprawek. Odwołanie to służy też jako wzajemny odsyłacz między oboma dokumentami. [http://pl.wikipedia.org, 12.10.2011] powrót