pobierz plik referatu

Transkrypt

pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
Rozdział 14
w
Wykorzystanie XML do reprezentacji cyfrowych
dokumentów muzycznych
w
1 Wstęp
da
.b
w
Streszczenie. W bibliotekach cyfrowych dokumentów muzycznych potrzebny jest format pozwalający na wymianę danych różnego typu związanych
z dokumentem muzycznym. Otwarty format XML ma wiele zalet, które pozwalają na zastosowanie go w tej bibliotece. W rozdziale zwrócono uwagę na
możliwość wykorzystania formatów MPEG-7, MARCXML oraz MusicXML
do opisania różnorodnych aspektów muzyki. Połączenie wszystkich informacji związanych z dokumentem muzycznym zawartych w wymienionych
formatach, pozwoli na wymianę danych z istniejącymi bazami danych
o utworach muzycznych. Skorzystanie z transformacji da możliwość dalszej
konwersji do baz np. SQL, oraz pozwoli np. na wizualizację dokumentów.
pl
s.
Biblioteki cyfrowe należą obecnie do najbardziej złożonych i zaawansowanych zastosowań
informatyki. Jednakże praktyczna ich realizacja napotyka na wiele problemów występujących w różnych dziedzinach informatyki [1]. Specyficzne problemy napotyka tworzenie
w pełni funkcjonalnej biblioteki cyfrowej dokumentów muzycznych [3].
Dokumenty muzyczne są ważnym elementem kulturowego dorobku ludzkości. Są one
jednakże specyficzne i złożone, w związku z czym istnieje wiele problemów z ich pozyskiwaniem i dalszym wykorzystaniem w bibliotekach cyfrowych. W tradycyjnych bibliotekach z utworem przechowywanym jako zapis nutowy, związany jest na ogół tylko jego opis
bibliograficzny. Istniejące np. nagrania nie są w żaden sposób z partyturą powiązane.
Przechowywanie dokumentów muzycznych jedynie w jednej postaci ogranicza możliwości ich praktycznego wykorzystania. W związku z tym w bazach danych należałoby
umożliwić powiązanie z danym dokumentem muzycznym różnorodnych jego form prezentacji.
Dokument muzyczny, przechowywany w bibliotece cyfrowej realizowanego projektu
Moniuszko, może zawierać różnorodne postacie muzyki oraz jej opisy [1]. Z pojedynczym
utworem możemy związać jego opis bibliograficzny (tekst), zeskanowane partytury (obraz), nagrania utworu, czyli różnorodne jego interpretacje (nagranie dźwiękowe), partyturę
cyfrową, pliki wideo z nagranymi koncertami – czyli różnorodne dane multimedialne
(rys. 1).
Wioleta Szwoch
Politechnika Gdańska, Wydział Elektroniki, Telekomunikacji i Informatyki, ul. Narutowicza 11/12,
80-952 Gdańsk, Polska
email:[email protected]
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
W. Szwoch
w
da
.b
w
w
Rys. 1. Elementy składowe dokumentu muzycznego wraz z przykładami standardów zapisu poszczególnych postaci muzyki
pl
s.
Dzięki tak rozumianemu cyfrowemu dokumentowi muzycznemu możliwe jest:
− pokazanie pełnej informacji o wybranym utworze. Dla danego utworu dysponujemy
nie tylko zapisem nutowym, ale również interpretacją utworu, ewentualnym cyfrowym zapisem partytury, nagraniami video z koncertów;
− tworzenie multimedialnych zapytań do bazy w postaci tekstu, dźwięku, zapisu nutowego, czy obrazu. Istnienie związanych z utworem różnorodnych mediów pozwala
na bardziej przyjazne użytkownikowi wyszukiwanie w bazie danych. Może się to odbywać nie tylko poprzez zapytania tekstowe, ale poprzez nucenie fragmentów melodii (query by humming), podawanie fragmentów zapisu nutowego.
− wizualizowanie partytury w postaci wektorowej. Charakterystyczna jest tu wysoka
jakość obrazu, możliwość skalowania, wykonywania przekształceń obrazu.
− odtwarzanie brzmienia dokumentu muzycznego bezpośrednio z elektronicznej reprezentacji partytury. Pozwala to na zapoznanie się z utworem w dowolnej aranżacji instrumentalnej.
− interaktywna praca z dokumentami muzycznymi. Umożliwia ona np. rozbijanie partytur na poszczególne głosy, zmianę aranżacji utworu itp.
148
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
Wykorzystanie XML do reprezentacji cyfrowych dokumentów muzycznych
− przeprowadzenie analizy semantycznej przechowywanych dokumentów. Dzięki temu
można wyszukać podobieństwa między utworami, czy wykryć plagiaty.
Aby możliwe było przeniesienie danych z istniejących baz do tworzonej biblioteki cyfrowej, ich późniejsza wymiana z innymi bibliotekami oraz tworzenie zapytań, niezbędny
jest format wiążący z dokumentem muzycznym wszystkie postaci jego zapisu.
w
2 Formaty zapisu cyfrowych dokumentów muzycznych
2.1 MPEG-7
da
.b
w
w
Stworzono wiele standardów XML-owych, które pozwalają na zapisywanie różnorodnych
dokumentów muzycznych [2]. Niestety, żaden z istniejących formatów zapisu informacji
muzycznej nie spełnia całkowicie oczekiwań odnośnie uniwersalnego formatu opisu muzyki. Istniejące formaty zajmują się tylko określoną postacią przechowywania muzyki, pomijając pozostałe. Istnieje, więc uzasadniona potrzeba opracowania formatu pozwalającego na
integrację wszystkich postaci muzyki. W realizowanym projekcie, idealnym do wykorzystania wydaje się być MPEG-7, który jest formatem zapisu metadanych. Mankamentem
MPEG-7 dla zastosowań do projektu badawczego jest skupienie się głównie na sygnałowej,
niskopoziomowej postaci zapisu muzyki. Brak jest możliwości zapisu oraz interpretacji
partytury muzycznej. Nie istnieje też możliwość dołączenia do dokumentu jego opisu bibliograficznego (za wyjątkiem podstawowych informacji typu autor, tytuł).
Dla cyfrowego zapisu partytury muzycznej istnieją standardy oparte na XML (MML,
HyTime, MusicXML, SMDL) [2]. W projekcie postanowiono wykorzystać MusicXML.
Niedawno ukazał się standard MARCXML do opisu bibliograficznego dokumentów.
MPEG-7, MusicXML oraz MARCXML są językami znacznikowymi opartymi na XML.
Połączenie ich w jednym dokumencie pozwoli na integrację wszystkich postaci dokumentu
muzycznego. Istnienie XML Schema umożliwi walidację i kontrolę poprawności tworzonych dokumentów.
pl
s.
MPEG-7 jest standardem definiującym język opisu zawartości obiektów multimedialnych
[4], [5], [9]. Stanowi on ważną próbę integracji i ujednolicenia opisu heterogenicznych danych multimedialnych, w tym dźwięku. Bazując na notacji XML wprowadza on narzędzia
opisu składni i semantyki danych multimedialnych, ich cech oraz relacji pomiędzy tymi danymi. Poprzednie standardy grupy MPEG zajmowały się normowaniem reprezentacji samej
zawartości obiektów multimedialnych, natomiast standard MPEG-7 normuje opisy tej zawartości. Opisami tymi są tzw. deskryptory, które opisują cechy przechowywanych w plikach MPEG-7 danych. Danymi w MPEG-7 mogą być: grafika, wideo, muzyka, mowa,
tekst itp. Deskryptory, mogą być tworzone przez człowieka lub mogą być ekstrahowane
automatycznie. Możliwe jest ich wykorzystanie do tworzenia indeksów w celu ułatwienia
wyszukiwania materiałów multimedialnych.
Na tworzenie nowych schematów deskryptorów oraz deskryptorów, rozszerzanie i modyfikację istniejących pozwala DDL (Description Definition Language), czyli język definiowania deskryptorów [6]. DDL jest rozszerzeniem języka XML Schema, więc schematy
deskryptorów i same deskryptory są dokumentami języka XML. Ważny dla dokumentów
muzycznych jest np. deskryptor opisujący kontur melodyczny (MelodyContour), gdyż dzięki niemu można wyszukiwać w bazie utwory podobne do utworu zapytania.
149
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
W. Szwoch
w
Standard MPEG-7 (ISO/IEC 15938-1÷8) został opisany w 8 częściach. Nie pozwala on
na zapisanie praktycznie tylko dwóch postaci danych związanych z dokumentem muzycznym – pełnego opisu bibliograficznego i cyfrowej partytury. Jednak dzięki temu, że użytkownik może rozszerzać standard wg własnych potrzeb, używając DDL, możliwe jest dodanie brakujących deskryptorów, aby w pełni opisać dokument.
Poniżej przedstawiono fragment pliku w standardzie MPEG-7 opisujący kontur melodyczny wydobyty z pliku dźwiękowego.
w
<?xml version="1.0" encoding="utf-8"?>
<Mpeg7 xmlns="urn:mpeg:mpeg7:schema:2001"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:mpeg7="urn:mpeg:mpeg7:schema:2001"
xmlns:xml="http://www.w3.org/XML/1998/namespace"
xsi:schemaLocation="urn:mpeg:mpeg7:schema:2001 Mpeg7-2001.xsd">
2.2 MARCXML
da
.b
w
<Description xsi:type="ContentEntityType">
<MultimediaContent xsi:type="AudioType">
<Audio xsi:type="AudioSegmentType">
<AudioDescriptionScheme xsi:type="MelodyType">
<MelodyContour>
<Contour> 0 1 2 -1 -1 -1 1 1 -1 0 0 0 -1 2</Contour>
<Beat>3 2 2 4</Beat>
</MelodyContour>
</AudioDescriptionScheme>
</Audio>
</MultimediaContent>
</Description>
</Mpeg7>
pl
s.
MARC jest zaakceptowanym, międzynarodowym formatem opisu danych bibliograficznych, wykorzystywanym w środowisku bibliotekarzy na całym świecie. Pojawiły się prace
zmierzające do umożliwienia zapisu danych zawartych w tym formacie w strukturach XML
[8].
The Library of Congress' Network Development and MARC Standards Office tworzy
aktualnie strukturę do pracy ze standardem MARC w środowisku XML. W 2006 roku
stworzono schemat XML (MARC21slim.xsd), pozwalający opisać strukturę rekordów. Rekordy te zawierają dane zgodne ze standardem MARC. Aby pozwolić użytkownikowi na
pracę ze standardem MARC w sposób najbardziej dla niego użyteczny, MARCXML będzie
zawierał dodatkowo komponenty takie jak arkusze stylów (transformacje i obiekty formatujące), aplikacje.
Wszystkie istotne dane charakterystyczne dla rekordu MARC zostały przekonwertowane
i wyrażone w XML. Dzięki temu mamy możliwość pełnej konwersji z MARC do XML
oraz konwersji odwrotnej - rekordy w standardzie MARC mogą być tworzone z rekordów
zapisanych w MARCXML.
Zapis standardu MARC w formacie XML, umożliwia prezentację danych przy wykorzystaniu transformacji. Transformacje pozwalają wybrać znaczniki i wyświetlić je w odpowiedniej formie, wykonać niektóre proste operacje jak dodawanie, uaktualnianie czy kasowanie pól w rekordach. Większość konwersji danych może być zapisana jako transformacje
XML.
Poniżej przedstawiono fragment pliku XML w standardzie MARCXML zawierający
część opisu bibliograficznego.
150
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
Wykorzystanie XML do reprezentacji cyfrowych dokumentów muzycznych
w
w
w
<?xml version="1.0" encoding="UTF-8" ?>
<collection xmlns="http://www.loc.gov/MARC21/slim">
<record>
<leader>01142cam 2200301 a 4500</leader>
<controlfield tag="001">92005291</controlfield>
……..
<datafield tag="010" ind1="" ind2="">
<subfield code="a">92005291</subfield>
</datafield>
<datafield tag="020" ind1="" ind2="">
<subfield code="a">0152038655 :</subfield>
<subfield code="c">20.00</subfield>
</datafield>
<datafield tag="040" ind1=" " ind2=" ">
<subfield code="a">AMG</subfield>
<subfield code="c">AMG</subfield>
<subfield code="d">AMG</subfield>
</datafield>
………….
</record>
</collection>
2.3 MusicXML
pl
s.
da
.b
MusicXML jest znacznikowym formatem do wymiany danych muzycznych pomiędzy
programami muzycznymi. Został on stworzony jako uniwersalny translator dla współczesnej notacji muzycznej CWMN (Common Western Musical Notation), jako format służący
do wymiany danych muzycznych pomiędzy programami muzycznymi różnego typu oraz
publikacji partytur muzycznych w Internecie [7].
Składnia MusicXML zapewnia możliwość przechowywania opisu notacji muzycznej.
Nazewnictwo znaczników oraz ich atrybutów zostało zaczerpnięte z terminologii muzycznej, dzięki czemu język jest czytelny i zrozumiały dla muzyków, oraz programistów znających podstawy teorii muzyki. Format ten umożliwia zapisanie notacji muzycznej zarówno
dla pojedynczej partii instrumentalnej czy wokalnej, jak również dla wielu partii. Do zapisu
nutowego mogą być dołączone słowa piosenki. Istnieje cała grupa znaczników przechowująca informacje potrzebne do generowania plików formacie MIDI.
MusicXML jest najpopularniejszym obecnie formatem znacznikowym opisującym notację muzyczną. Informacja muzyczna w nim zawarta została tak zaprojektowana, by była
użyteczna dla całej gamy programów, począwszy od programów do notacji muzycznej, poprzez aplikacje odtwarzające muzykę, aż po specjalistyczne aplikacje służące do analizy
muzykologicznej. Spośród innych formatów, MusicXML wydaje się być najodpowiedniejszy do zapisu cyfrowej partytury muzycznej, pliki zapisane w tym formacie są plikami wejściowymi tworzonej biblioteki [2].
Rys. 2. Prosty przykład graficznego przedstawienia notacji muzycznej
Poniżej przedstawiono fragment pliku MusicXML opisującego takt z kluczem wiolinowym, metrum 4/4 i nutą C widoczny na rys.2.
151
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
W. Szwoch
w
da
.b
w
w
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE score-partwise PUBLIC
"-//Recordare//DTD MusicXML 1.1 Partwise//EN"
"http://www.musicxml.org/dtds/partwise.dtd">
<score-partwise version="1.1">
<part-list>
<score-part id="P1">
<part-name>Music</part-name>
</score-part>
</part-list>
<part id="P1">
<measure number="1">
<attributes>
<divisions>1</divisions>
<key> <fifths>0</fifths> </key>
<time> <beats>4</beats> <beat-type>4</beat-type> </time>
<clef> <sign>G</sign> <line>2</line> </clef>
</attributes>
<note>
<pitch>
<step>C</step> <octave>4</octave>
</pitch>
<duration>4</duration>
<type>whole</type>
</note>
</measure>
</part>
</score-partwise>
3 Zapis cyfrowych dokumentów muzycznych
pl
s.
Przedstawione powyżej formaty nie pozwalają zapisać w postaci jednego dokumentu pełnej
informacji dotyczącej utworu muzycznego. Jednakże istniejące w tych formatach znaczniki
w sposób wystarczający umożliwiają przedstawienie każdej postaci utworu muzycznego.
Format MARCXML, ponieważ jest zgodny ze światowym standardem MARC, jest idealny
do opisu danych bibliograficznych związanych z utworem. Format MusicXML jest najbardziej rozpowszechnionym formatem zapisu cyfrowej partytury. Pozwala na zapisanie różnego rodzaju partytur i związanych z nimi dodatkowych informacji. MPEG-7 jako standard
opisu danych multimedialnych pozwala na przechowanie obrazów, dźwięków, wydobytych
cech, które pozwalają np. na wyszukiwanie w bazie (kontur muzyczny, niskopoziomowe
opisy dźwięku). Połączenie opisów z tych formatów w jednym dokumencie pozwoli na
przedstawienie pełnej informacji o utworze muzycznym.
Dane w powstającej bibliotece dokumentów muzycznych przechowywane będą w różnorodnej postaci. Format integrujący te dane jest niezbędny jako format wymiany danych
między istniejącymi bazami przechowującymi nuty, opisy bibliograficzne, nagrania, filmy
video, tekst, itp. Istnienie takiego formatu pozwoli na wykorzystanie istniejących baz danych i przetransformowanie ich do tworzonej biblioteki cyfrowych dokumentów muzycznych. Ponadto stworzony format będzie przydatny podczas formułowania zapytań do bazy
biblioteki dokumentów muzycznych.
Aby zintegrować wszystkie postacie zapisu muzyki w jeden dokument wykorzystane
zostaną przedstawione formaty. Podstawą będzie format MPEG-7, który zostanie rozszerzony o MusicXML i MARCXML.
152
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
Wykorzystanie XML do reprezentacji cyfrowych dokumentów muzycznych
4 Wizualizacja dokumentu cyfrowego
w
Ponieważ dane o dokumencie muzycznym prezentowane są w formacie XML-owym, możliwe jest wykorzystanie transformacji XML do ich wizualizacji. Zastosowanie XSLT pozwala na przedstawienie informacji pobieranych z bazy w sposób najwygodniejszy dla użytkownika. Mimo, iż XML jako format tekstowy jest czytelny dla człowieka, prostsze jest
oglądanie danych w bardziej przejrzystej postaci. Na rys. 3 przedstawiono przetransformowany do HTML plik standardu MARCXML (punkt 2.2).
da
.b
w
w
Rys.
3. Prosta wizualizacja pliku w standardzie MARCXML
O ile stosunkowo łatwo można zorientować się w treści pliku standardu MARCXML,
o tyle duże trudności napotkalibyśmy, przy próbie odczytania partytury muzycznej bezpośrednio z pliku MusicXML. Dla użytkownika niezbędna jest jej wizualizacja w ogólnie
przyjętej notacji CWMN (rys.2).
W dokumencie XML obrazy przedstawiane są tylko jako nazwy plików. Aby obejrzeć
związane z dokumentem obrazy skanowanych druków partytur należy skorzystać z transformacji dokumentu, która umożliwia wizualizację obrazów.
pl
s.
5 Zakończenie
W rozdziale przedstawiono cyfrowe dokumenty muzyczne. Wskazano na potrzebę logicznego powiązania ze sobą w jednym dokumencie różnorodnych postaci prezentacji muzyki.
Na potrzeby realizowanego projektu Moniuszko niezbędne jest zintegrowanie formatów ich
przechowywania. W rozdziale pokazano wybrane formaty: MPEG-7, MUSICXML oraz
MARCXML. Oferowane przez nie znaczniki pozwalają na pełne pokazanie wszystkich
składowych dokumentu muzycznego. Istotne jest, że wszystkie wybrane formaty należą do
standardu XML: są one tekstowe, czytelne i zrozumiałe dla człowieka, rozszerzalne. Wykorzystanie XML Schema pozwala na walidację dokumentu. Zastosowanie transformacji
umożliwia praktycznie dowolne konwersje do innych formatów. Możliwa jest również
wizualizacja poszczególnych elementów składowych muzycznego dokumentu: czy będzie
to skan partytury, opis bibliograficzny czy też partytura cyfrowa. Wizualizacja ta może
przyjąć postać np. strony internetowej lub wysokiej jakości wydruku (z zastosowaniem
153
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007
Rozdział monografii: 'Bazy Danych: Nowe Technologie', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2007
W. Szwoch
XSL FO). Dalsze prace będą zmierzały do przeniesienia danych z istniejących baz do tworzonej biblioteki cyfrowej przy użyciu formatu integrującego wskazane w rozdziale formaty oraz wykorzystaniu go do tworzenia zapytań do tej bazy.
Praca naukowa finansowana w części ze środków budżetowych na naukę w latach 2005–
2008 jako projekt badawczy nr 3 T11C 027 28
w
Literatura
Szwoch M.: Cyfrowa biblioteka dokumentów muzycznych. Zeszyty naukowe WETI PG,
Konferencja Technologie Informacyjne, Gdańsk 2006.
Szwoch M., Szwoch W.: Formaty zapisu cyfrowych dokumentów muzycznych. Zeszyty
naukowe WETI PG, Konferencja Technologie Informacyjne, Gdańsk 2005.
Szwoch M., Michalska A.: Interaktywna biblioteka cyfrowa dokumentów muzycznych.
Infobazy´05. Bazy danych dla nauki. Red. A. Nowakowski., Warszawa: SIMP 2005.
Nack F., Lindsay A.T.: Everything You Wanted to know about MPEG-7:Part 1., s. 65-77.
Multimedia, IEEE, Volume 6, Issue 3, p. 65 – 77, 1999.
Nack F., Lindsay A.T.: Everything You Wanted to know about MPEG-7:Part 2., s. 65-77.
Multimedia, IEEE, Volume 6, Issue 4, p. 64 – 73, 1999.
Hunter J.: An overview of the MPEG-7 Description Definition Language (DDL). IEEE
Transactions on Circuits and Systems for Video Technology, vol. 11, No. 6, s. 765-772, 2001.
Standard MusicXML: http://www.musicxml.org/xml.html
Standard MARCXML: http://www.loc.gov/standards/marcxml///
Standard MPEG-7: http://www.chiariglione.org/mpeg/standards/mpeg-7/mpeg-7.htm
2.
3.
4.
5.
6.
pl
s.
da
.b
7.
8.
9.
w
w
1.
154
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2007