pobierz plik referatu
Transkrypt
pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 Rozdział 14 w Wykorzystanie XML do reprezentacji cyfrowych dokumentów muzycznych w 1 Wstęp da .b w Streszczenie. W bibliotekach cyfrowych dokumentów muzycznych potrzebny jest format pozwalający na wymianę danych różnego typu związanych z dokumentem muzycznym. Otwarty format XML ma wiele zalet, które pozwalają na zastosowanie go w tej bibliotece. W rozdziale zwrócono uwagę na możliwość wykorzystania formatów MPEG-7, MARCXML oraz MusicXML do opisania różnorodnych aspektów muzyki. Połączenie wszystkich informacji związanych z dokumentem muzycznym zawartych w wymienionych formatach, pozwoli na wymianę danych z istniejącymi bazami danych o utworach muzycznych. Skorzystanie z transformacji da możliwość dalszej konwersji do baz np. SQL, oraz pozwoli np. na wizualizację dokumentów. pl s. Biblioteki cyfrowe należą obecnie do najbardziej złożonych i zaawansowanych zastosowań informatyki. Jednakże praktyczna ich realizacja napotyka na wiele problemów występujących w różnych dziedzinach informatyki [1]. Specyficzne problemy napotyka tworzenie w pełni funkcjonalnej biblioteki cyfrowej dokumentów muzycznych [3]. Dokumenty muzyczne są ważnym elementem kulturowego dorobku ludzkości. Są one jednakże specyficzne i złożone, w związku z czym istnieje wiele problemów z ich pozyskiwaniem i dalszym wykorzystaniem w bibliotekach cyfrowych. W tradycyjnych bibliotekach z utworem przechowywanym jako zapis nutowy, związany jest na ogół tylko jego opis bibliograficzny. Istniejące np. nagrania nie są w żaden sposób z partyturą powiązane. Przechowywanie dokumentów muzycznych jedynie w jednej postaci ogranicza możliwości ich praktycznego wykorzystania. W związku z tym w bazach danych należałoby umożliwić powiązanie z danym dokumentem muzycznym różnorodnych jego form prezentacji. Dokument muzyczny, przechowywany w bibliotece cyfrowej realizowanego projektu Moniuszko, może zawierać różnorodne postacie muzyki oraz jej opisy [1]. Z pojedynczym utworem możemy związać jego opis bibliograficzny (tekst), zeskanowane partytury (obraz), nagrania utworu, czyli różnorodne jego interpretacje (nagranie dźwiękowe), partyturę cyfrową, pliki wideo z nagranymi koncertami – czyli różnorodne dane multimedialne (rys. 1). Wioleta Szwoch Politechnika Gdańska, Wydział Elektroniki, Telekomunikacji i Informatyki, ul. Narutowicza 11/12, 80-952 Gdańsk, Polska email:[email protected] (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007 Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 W. Szwoch w da .b w w Rys. 1. Elementy składowe dokumentu muzycznego wraz z przykładami standardów zapisu poszczególnych postaci muzyki pl s. Dzięki tak rozumianemu cyfrowemu dokumentowi muzycznemu możliwe jest: − pokazanie pełnej informacji o wybranym utworze. Dla danego utworu dysponujemy nie tylko zapisem nutowym, ale również interpretacją utworu, ewentualnym cyfrowym zapisem partytury, nagraniami video z koncertów; − tworzenie multimedialnych zapytań do bazy w postaci tekstu, dźwięku, zapisu nutowego, czy obrazu. Istnienie związanych z utworem różnorodnych mediów pozwala na bardziej przyjazne użytkownikowi wyszukiwanie w bazie danych. Może się to odbywać nie tylko poprzez zapytania tekstowe, ale poprzez nucenie fragmentów melodii (query by humming), podawanie fragmentów zapisu nutowego. − wizualizowanie partytury w postaci wektorowej. Charakterystyczna jest tu wysoka jakość obrazu, możliwość skalowania, wykonywania przekształceń obrazu. − odtwarzanie brzmienia dokumentu muzycznego bezpośrednio z elektronicznej reprezentacji partytury. Pozwala to na zapoznanie się z utworem w dowolnej aranżacji instrumentalnej. − interaktywna praca z dokumentami muzycznymi. Umożliwia ona np. rozbijanie partytur na poszczególne głosy, zmianę aranżacji utworu itp. 148 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007 Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 Wykorzystanie XML do reprezentacji cyfrowych dokumentów muzycznych − przeprowadzenie analizy semantycznej przechowywanych dokumentów. Dzięki temu można wyszukać podobieństwa między utworami, czy wykryć plagiaty. Aby możliwe było przeniesienie danych z istniejących baz do tworzonej biblioteki cyfrowej, ich późniejsza wymiana z innymi bibliotekami oraz tworzenie zapytań, niezbędny jest format wiążący z dokumentem muzycznym wszystkie postaci jego zapisu. w 2 Formaty zapisu cyfrowych dokumentów muzycznych 2.1 MPEG-7 da .b w w Stworzono wiele standardów XML-owych, które pozwalają na zapisywanie różnorodnych dokumentów muzycznych [2]. Niestety, żaden z istniejących formatów zapisu informacji muzycznej nie spełnia całkowicie oczekiwań odnośnie uniwersalnego formatu opisu muzyki. Istniejące formaty zajmują się tylko określoną postacią przechowywania muzyki, pomijając pozostałe. Istnieje, więc uzasadniona potrzeba opracowania formatu pozwalającego na integrację wszystkich postaci muzyki. W realizowanym projekcie, idealnym do wykorzystania wydaje się być MPEG-7, który jest formatem zapisu metadanych. Mankamentem MPEG-7 dla zastosowań do projektu badawczego jest skupienie się głównie na sygnałowej, niskopoziomowej postaci zapisu muzyki. Brak jest możliwości zapisu oraz interpretacji partytury muzycznej. Nie istnieje też możliwość dołączenia do dokumentu jego opisu bibliograficznego (za wyjątkiem podstawowych informacji typu autor, tytuł). Dla cyfrowego zapisu partytury muzycznej istnieją standardy oparte na XML (MML, HyTime, MusicXML, SMDL) [2]. W projekcie postanowiono wykorzystać MusicXML. Niedawno ukazał się standard MARCXML do opisu bibliograficznego dokumentów. MPEG-7, MusicXML oraz MARCXML są językami znacznikowymi opartymi na XML. Połączenie ich w jednym dokumencie pozwoli na integrację wszystkich postaci dokumentu muzycznego. Istnienie XML Schema umożliwi walidację i kontrolę poprawności tworzonych dokumentów. pl s. MPEG-7 jest standardem definiującym język opisu zawartości obiektów multimedialnych [4], [5], [9]. Stanowi on ważną próbę integracji i ujednolicenia opisu heterogenicznych danych multimedialnych, w tym dźwięku. Bazując na notacji XML wprowadza on narzędzia opisu składni i semantyki danych multimedialnych, ich cech oraz relacji pomiędzy tymi danymi. Poprzednie standardy grupy MPEG zajmowały się normowaniem reprezentacji samej zawartości obiektów multimedialnych, natomiast standard MPEG-7 normuje opisy tej zawartości. Opisami tymi są tzw. deskryptory, które opisują cechy przechowywanych w plikach MPEG-7 danych. Danymi w MPEG-7 mogą być: grafika, wideo, muzyka, mowa, tekst itp. Deskryptory, mogą być tworzone przez człowieka lub mogą być ekstrahowane automatycznie. Możliwe jest ich wykorzystanie do tworzenia indeksów w celu ułatwienia wyszukiwania materiałów multimedialnych. Na tworzenie nowych schematów deskryptorów oraz deskryptorów, rozszerzanie i modyfikację istniejących pozwala DDL (Description Definition Language), czyli język definiowania deskryptorów [6]. DDL jest rozszerzeniem języka XML Schema, więc schematy deskryptorów i same deskryptory są dokumentami języka XML. Ważny dla dokumentów muzycznych jest np. deskryptor opisujący kontur melodyczny (MelodyContour), gdyż dzięki niemu można wyszukiwać w bazie utwory podobne do utworu zapytania. 149 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007 Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 W. Szwoch w Standard MPEG-7 (ISO/IEC 15938-1÷8) został opisany w 8 częściach. Nie pozwala on na zapisanie praktycznie tylko dwóch postaci danych związanych z dokumentem muzycznym – pełnego opisu bibliograficznego i cyfrowej partytury. Jednak dzięki temu, że użytkownik może rozszerzać standard wg własnych potrzeb, używając DDL, możliwe jest dodanie brakujących deskryptorów, aby w pełni opisać dokument. Poniżej przedstawiono fragment pliku w standardzie MPEG-7 opisujący kontur melodyczny wydobyty z pliku dźwiękowego. w <?xml version="1.0" encoding="utf-8"?> <Mpeg7 xmlns="urn:mpeg:mpeg7:schema:2001" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:mpeg7="urn:mpeg:mpeg7:schema:2001" xmlns:xml="http://www.w3.org/XML/1998/namespace" xsi:schemaLocation="urn:mpeg:mpeg7:schema:2001 Mpeg7-2001.xsd"> 2.2 MARCXML da .b w <Description xsi:type="ContentEntityType"> <MultimediaContent xsi:type="AudioType"> <Audio xsi:type="AudioSegmentType"> <AudioDescriptionScheme xsi:type="MelodyType"> <MelodyContour> <Contour> 0 1 2 -1 -1 -1 1 1 -1 0 0 0 -1 2</Contour> <Beat>3 2 2 4</Beat> </MelodyContour> </AudioDescriptionScheme> </Audio> </MultimediaContent> </Description> </Mpeg7> pl s. MARC jest zaakceptowanym, międzynarodowym formatem opisu danych bibliograficznych, wykorzystywanym w środowisku bibliotekarzy na całym świecie. Pojawiły się prace zmierzające do umożliwienia zapisu danych zawartych w tym formacie w strukturach XML [8]. The Library of Congress' Network Development and MARC Standards Office tworzy aktualnie strukturę do pracy ze standardem MARC w środowisku XML. W 2006 roku stworzono schemat XML (MARC21slim.xsd), pozwalający opisać strukturę rekordów. Rekordy te zawierają dane zgodne ze standardem MARC. Aby pozwolić użytkownikowi na pracę ze standardem MARC w sposób najbardziej dla niego użyteczny, MARCXML będzie zawierał dodatkowo komponenty takie jak arkusze stylów (transformacje i obiekty formatujące), aplikacje. Wszystkie istotne dane charakterystyczne dla rekordu MARC zostały przekonwertowane i wyrażone w XML. Dzięki temu mamy możliwość pełnej konwersji z MARC do XML oraz konwersji odwrotnej - rekordy w standardzie MARC mogą być tworzone z rekordów zapisanych w MARCXML. Zapis standardu MARC w formacie XML, umożliwia prezentację danych przy wykorzystaniu transformacji. Transformacje pozwalają wybrać znaczniki i wyświetlić je w odpowiedniej formie, wykonać niektóre proste operacje jak dodawanie, uaktualnianie czy kasowanie pól w rekordach. Większość konwersji danych może być zapisana jako transformacje XML. Poniżej przedstawiono fragment pliku XML w standardzie MARCXML zawierający część opisu bibliograficznego. 150 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007 Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 Wykorzystanie XML do reprezentacji cyfrowych dokumentów muzycznych w w w <?xml version="1.0" encoding="UTF-8" ?> <collection xmlns="http://www.loc.gov/MARC21/slim"> <record> <leader>01142cam 2200301 a 4500</leader> <controlfield tag="001">92005291</controlfield> …….. <datafield tag="010" ind1="" ind2=""> <subfield code="a">92005291</subfield> </datafield> <datafield tag="020" ind1="" ind2=""> <subfield code="a">0152038655 :</subfield> <subfield code="c">20.00</subfield> </datafield> <datafield tag="040" ind1=" " ind2=" "> <subfield code="a">AMG</subfield> <subfield code="c">AMG</subfield> <subfield code="d">AMG</subfield> </datafield> …………. </record> </collection> 2.3 MusicXML pl s. da .b MusicXML jest znacznikowym formatem do wymiany danych muzycznych pomiędzy programami muzycznymi. Został on stworzony jako uniwersalny translator dla współczesnej notacji muzycznej CWMN (Common Western Musical Notation), jako format służący do wymiany danych muzycznych pomiędzy programami muzycznymi różnego typu oraz publikacji partytur muzycznych w Internecie [7]. Składnia MusicXML zapewnia możliwość przechowywania opisu notacji muzycznej. Nazewnictwo znaczników oraz ich atrybutów zostało zaczerpnięte z terminologii muzycznej, dzięki czemu język jest czytelny i zrozumiały dla muzyków, oraz programistów znających podstawy teorii muzyki. Format ten umożliwia zapisanie notacji muzycznej zarówno dla pojedynczej partii instrumentalnej czy wokalnej, jak również dla wielu partii. Do zapisu nutowego mogą być dołączone słowa piosenki. Istnieje cała grupa znaczników przechowująca informacje potrzebne do generowania plików formacie MIDI. MusicXML jest najpopularniejszym obecnie formatem znacznikowym opisującym notację muzyczną. Informacja muzyczna w nim zawarta została tak zaprojektowana, by była użyteczna dla całej gamy programów, począwszy od programów do notacji muzycznej, poprzez aplikacje odtwarzające muzykę, aż po specjalistyczne aplikacje służące do analizy muzykologicznej. Spośród innych formatów, MusicXML wydaje się być najodpowiedniejszy do zapisu cyfrowej partytury muzycznej, pliki zapisane w tym formacie są plikami wejściowymi tworzonej biblioteki [2]. Rys. 2. Prosty przykład graficznego przedstawienia notacji muzycznej Poniżej przedstawiono fragment pliku MusicXML opisującego takt z kluczem wiolinowym, metrum 4/4 i nutą C widoczny na rys.2. 151 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007 Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 W. Szwoch w da .b w w <?xml version="1.0" encoding="UTF-8" standalone="no"?> <!DOCTYPE score-partwise PUBLIC "-//Recordare//DTD MusicXML 1.1 Partwise//EN" "http://www.musicxml.org/dtds/partwise.dtd"> <score-partwise version="1.1"> <part-list> <score-part id="P1"> <part-name>Music</part-name> </score-part> </part-list> <part id="P1"> <measure number="1"> <attributes> <divisions>1</divisions> <key> <fifths>0</fifths> </key> <time> <beats>4</beats> <beat-type>4</beat-type> </time> <clef> <sign>G</sign> <line>2</line> </clef> </attributes> <note> <pitch> <step>C</step> <octave>4</octave> </pitch> <duration>4</duration> <type>whole</type> </note> </measure> </part> </score-partwise> 3 Zapis cyfrowych dokumentów muzycznych pl s. Przedstawione powyżej formaty nie pozwalają zapisać w postaci jednego dokumentu pełnej informacji dotyczącej utworu muzycznego. Jednakże istniejące w tych formatach znaczniki w sposób wystarczający umożliwiają przedstawienie każdej postaci utworu muzycznego. Format MARCXML, ponieważ jest zgodny ze światowym standardem MARC, jest idealny do opisu danych bibliograficznych związanych z utworem. Format MusicXML jest najbardziej rozpowszechnionym formatem zapisu cyfrowej partytury. Pozwala na zapisanie różnego rodzaju partytur i związanych z nimi dodatkowych informacji. MPEG-7 jako standard opisu danych multimedialnych pozwala na przechowanie obrazów, dźwięków, wydobytych cech, które pozwalają np. na wyszukiwanie w bazie (kontur muzyczny, niskopoziomowe opisy dźwięku). Połączenie opisów z tych formatów w jednym dokumencie pozwoli na przedstawienie pełnej informacji o utworze muzycznym. Dane w powstającej bibliotece dokumentów muzycznych przechowywane będą w różnorodnej postaci. Format integrujący te dane jest niezbędny jako format wymiany danych między istniejącymi bazami przechowującymi nuty, opisy bibliograficzne, nagrania, filmy video, tekst, itp. Istnienie takiego formatu pozwoli na wykorzystanie istniejących baz danych i przetransformowanie ich do tworzonej biblioteki cyfrowych dokumentów muzycznych. Ponadto stworzony format będzie przydatny podczas formułowania zapytań do bazy biblioteki dokumentów muzycznych. Aby zintegrować wszystkie postacie zapisu muzyki w jeden dokument wykorzystane zostaną przedstawione formaty. Podstawą będzie format MPEG-7, który zostanie rozszerzony o MusicXML i MARCXML. 152 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007 Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 Wykorzystanie XML do reprezentacji cyfrowych dokumentów muzycznych 4 Wizualizacja dokumentu cyfrowego w Ponieważ dane o dokumencie muzycznym prezentowane są w formacie XML-owym, możliwe jest wykorzystanie transformacji XML do ich wizualizacji. Zastosowanie XSLT pozwala na przedstawienie informacji pobieranych z bazy w sposób najwygodniejszy dla użytkownika. Mimo, iż XML jako format tekstowy jest czytelny dla człowieka, prostsze jest oglądanie danych w bardziej przejrzystej postaci. Na rys. 3 przedstawiono przetransformowany do HTML plik standardu MARCXML (punkt 2.2). da .b w w Rys. 3. Prosta wizualizacja pliku w standardzie MARCXML O ile stosunkowo łatwo można zorientować się w treści pliku standardu MARCXML, o tyle duże trudności napotkalibyśmy, przy próbie odczytania partytury muzycznej bezpośrednio z pliku MusicXML. Dla użytkownika niezbędna jest jej wizualizacja w ogólnie przyjętej notacji CWMN (rys.2). W dokumencie XML obrazy przedstawiane są tylko jako nazwy plików. Aby obejrzeć związane z dokumentem obrazy skanowanych druków partytur należy skorzystać z transformacji dokumentu, która umożliwia wizualizację obrazów. pl s. 5 Zakończenie W rozdziale przedstawiono cyfrowe dokumenty muzyczne. Wskazano na potrzebę logicznego powiązania ze sobą w jednym dokumencie różnorodnych postaci prezentacji muzyki. Na potrzeby realizowanego projektu Moniuszko niezbędne jest zintegrowanie formatów ich przechowywania. W rozdziale pokazano wybrane formaty: MPEG-7, MUSICXML oraz MARCXML. Oferowane przez nie znaczniki pozwalają na pełne pokazanie wszystkich składowych dokumentu muzycznego. Istotne jest, że wszystkie wybrane formaty należą do standardu XML: są one tekstowe, czytelne i zrozumiałe dla człowieka, rozszerzalne. Wykorzystanie XML Schema pozwala na walidację dokumentu. Zastosowanie transformacji umożliwia praktycznie dowolne konwersje do innych formatów. Możliwa jest również wizualizacja poszczególnych elementów składowych muzycznego dokumentu: czy będzie to skan partytury, opis bibliograficzny czy też partytura cyfrowa. Wizualizacja ta może przyjąć postać np. strony internetowej lub wysokiej jakości wydruku (z zastosowaniem 153 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007 Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007 W. Szwoch XSL FO). Dalsze prace będą zmierzały do przeniesienia danych z istniejących baz do tworzonej biblioteki cyfrowej przy użyciu formatu integrującego wskazane w rozdziale formaty oraz wykorzystaniu go do tworzenia zapytań do tej bazy. Praca naukowa finansowana w części ze środków budżetowych na naukę w latach 2005– 2008 jako projekt badawczy nr 3 T11C 027 28 w Literatura Szwoch M.: Cyfrowa biblioteka dokumentów muzycznych. Zeszyty naukowe WETI PG, Konferencja Technologie Informacyjne, Gdańsk 2006. Szwoch M., Szwoch W.: Formaty zapisu cyfrowych dokumentów muzycznych. Zeszyty naukowe WETI PG, Konferencja Technologie Informacyjne, Gdańsk 2005. Szwoch M., Michalska A.: Interaktywna biblioteka cyfrowa dokumentów muzycznych. Infobazy´05. Bazy danych dla nauki. Red. A. Nowakowski., Warszawa: SIMP 2005. Nack F., Lindsay A.T.: Everything You Wanted to know about MPEG-7:Part 1., s. 65-77. Multimedia, IEEE, Volume 6, Issue 3, p. 65 – 77, 1999. Nack F., Lindsay A.T.: Everything You Wanted to know about MPEG-7:Part 2., s. 65-77. Multimedia, IEEE, Volume 6, Issue 4, p. 64 – 73, 1999. Hunter J.: An overview of the MPEG-7 Description Definition Language (DDL). IEEE Transactions on Circuits and Systems for Video Technology, vol. 11, No. 6, s. 765-772, 2001. Standard MusicXML: http://www.musicxml.org/xml.html Standard MARCXML: http://www.loc.gov/standards/marcxml/// Standard MPEG-7: http://www.chiariglione.org/mpeg/standards/mpeg-7/mpeg-7.htm 2. 3. 4. 5. 6. pl s. da .b 7. 8. 9. w w 1. 154 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007