klasyfikator jakości dźwięku skrzypiec dla multimedialnych baz
Transkrypt
klasyfikator jakości dźwięku skrzypiec dla multimedialnych baz
XI International PhD Workshop OWD 2009, 17–20 October 2009 KLASYFIKATOR JAKOŚCI DŹWIĘKU SKRZYPIEC DLA MULTIMEDIALNYCH BAZ DANYCH VIOLIN SOUND QUALITY CLASSIFIER FOR MULTIMEDIA DATABASES Piotr Wrzeciono, Polish-Japanese Institute of Information Technology (11.06.2008, dr hab. Krzysztof Marasek, Polsko-Japońska WyŜsza Szkoła Technik Komputerowych) Abstract This paper presents the violin sound quality classifier for automatic classification in multimedia databases. Parameters of modes and harmony relations between modes frequencies were used to evaluate sound quality. The AMATI multimedia database was used to test the presented classifier. This database contains recordings and jurors’ evaluations of violin which participated in the 10th Henryk Wieniawski International Violin Making Competition in Poznań (2001). The calculated sound quality evaluation was the same as jurors’ opinion for the 75.5% of instruments from the AMATI database. Measuring error of the classifier were the same as the measuring error of jurors’ evaluation. The all estimated violin sound quality evaluations were in the range defined by the regulations of The Violin Maker Competitions. The statistical parameters of the classifier and the jurors’ opinions are very similar. Streszczenie Praca przedstawia klasyfikator jakości dźwięku skrzypiec przeznaczony do przeprowadzania automatycznej klasyfikacji w multimedialnych bazach danych. Do oszacowania oceny jakości brzmienia wykorzystano parametry rezonansów własnych instrumentu (modów) oraz relacji harmonicznych pomiędzy nimi. Klasyfikator testowano na multimedialnej bazie danych AMATI, zawierającej nagrania oraz oceny skrzypiec biorących udział w X Międzynarodowym Konkursie Lutniczym im. Henryka Wieniawskiego w Poznaniu (2001). Oceny uzyskane za pomocą klasyfikatora były zgodne z ocenami jurorów dla 75.5% instrumentów z bazy AMATI. Dokładność szacowania jakości brzmienia za pomocą prezentowanego klasyfikatora była taka sama jak błąd pomiarowy jurorów. Wszystkie wyliczone oceny jakości dźwięku skrzypiec znajdują się w przedziale określonym w regulaminie konkursu, jak równieŜ parametry statystyczne klasyfikatora i ocen jurorów są bardzo podobne. 1. Wprowadzenie Automatyczna klasyfikacja w multimedialnych bazach danych zawierających nagrania instrumentów muzycznych jest bardzo waŜnym zagadnieniem. Klasyfikacja w tym przypadku oznacza utworzenie zbioru parametrów przypisanych do nagrania, który umoŜliwia przeszukiwanie oraz porządkowanie bazy danych. PoniewaŜ multimedia w ogólności mogą być oceniane w róŜny sposób, ich parametry dzieli się na dwie grupy: obiektywne i subiektywne. Do pierwszego rodzaju zalicza się parametry, do których znalezienia nie jest istotna wiedza na temat percepcji danego medium przez człowieka. Najbardziej popularna grupa klasyfikatorów słuŜących do obliczania parametrów obiektywnych jest opisana w standardzie MPEG-7 [1]. Oprócz ogólnych metod klasyfikacji wykorzystywane są równieŜ parametry charakterystyczne dla źródła danych multimedialnych [2]. W przypadku skrzypiec są to przede wszystkim częstotliwości rezonansów własnych skrzypiec, nazywanych równieŜ modami [2, 3]. Parametry subiektywne tworzy się jako pochodne parametrów obiektywnych uwzględniających procesy percepcji informacji przez człowieka. Dla dźwięku skrzypiec tego rodzaju parametrem jest jakość brzmienia [4, 5, 6]. MoŜe być ona wyraŜana zarówno werbalnie [4, 6] jak i liczbowo [5]. Ten ostatni rodzaj oceny jest bardzo uŜyteczny dla tworzenia klasyfikatora jakości dźwięku, gdyŜ w tym przypadku szacowana wartość tego parametru nie jest ograniczona tylko do kilku pojęć, tak jak w pracy Yankovskiego [4]. W niniejszej pracy wykorzystane są dwa parametry obiektywne, oba związane z modami 225 skrzypiec. Pierwszym z nich jest częstotliwość modu, natomiast drugim jest współczynnik energii wzajemnej, opisujący zachowanie się modu podczas gry na instrumencie. 2. Parametry modów NajwaŜniejszymi elementami skrzypiec, z punktu widzenia akustyki, są płyty rezonansowe (górna i dolna), dusza (drewniany słupek łączący obie płyty) oraz powietrze w korpusie instrumentu [3, 4, 8]. Mody są falami stojącymi powstającymi na powierzchni płyt oraz wewnątrz korpusu [3, 4, 7, 8]. Klasyfikacja modów została przeprowadzona przez zespół pod kierownictwem Hutchins [3] i jest powszechnie stosowana zarówno przez lutników jak i akustyków. Mody są wykrywane podczas badania odpowiedzi impulsowej skrzypiec [3, 4, 6], której pomiaru dokonuje się za pomocą akcelerometru, bez rejestrowania dźwięku [3, 4, 6]. JednakŜe z powodu faktu, Ŝe skrzypce są systemem nieliniowym [9], sama analiza odpowiedzi impulsowej nie jest wystarczająca do określenia jakie będzie brzmienie instrumentu. W celu lepszej analizy zachowania się instrumentu podczas normalnej gry za pomocą smyczka zostały opracowane metody wyszukująca mody w dźwięku instrumentu [10, 11]. W rezultacie otrzymano dwa parametry modu: częstotliwość i współczynnik energii wzajemnej (mutual energy factor), który charakteryzuje zachowanie się instrumentu przy róŜnych poziomach energii pobudzenia. 2.1 Częstotliwość modu Podczas badań [12, 13] stwierdzono obecność modów w widmie energetycznym gam chromatycznych zagranych na skrzypcach. Nagrania pochodziły z multimedialnej bazy danych AMATI [5, 14], zawierającej rejestracje dźwięków instrumentów biorących udział w X Międzynarodowym Konkursie Lutniczym im. Henryka Wieniawskiego (2001r.). ZauwaŜono wtedy, Ŝe mody moŜna wyodrębnić z widma energetycznego, poniewaŜ częstotliwość modów jest stała i niezaleŜna od pobudzenia. Opracowane metody [10, 11] bazują na transformacie DTFT [15] obliczanej dla całego nagrania gamy chromatycznej. Dla kaŜdego instrumentu z bazy AMATI obliczono widma energetyczne gam chromatycznych, nagranych w polu bliskim. Na kaŜdej strunie wykonano jedną gamę chromatyczną przez całą skalę moŜliwą do zagrania (dwie oktawy) [7, 8]. W pasmie od 197 Hz do 650 Hz wykorzystano widma gam chromatycznych zagranych na strunie g [7, 8] oraz e’’ [7, 8], natomiast w pasmie od 650 Hz do 810 Hz wykorzystano rejestracje gam chromatycznych na wszystkich strunach (g, d’, a’, e’’). Transformata DTFT była obliczana z uŜyciem tego samego zbioru częstotliwości dla wszystkich nagrań. W następnym kroku normalizowano widmo energetyczne kaŜdej gamy względem największej wartości energii znalezionej w widmie. Kolejne działanie polega na przemnoŜeniu znormalizowanych widm energetycznych i wyszukaniu maksimów w iloczynie. Dla pasma od 197 Hz do 650 Hz tworzony był iloczyn widm energetycznych gam chromatycznych na strunie g oraz e’’, natomiast dla przedziału częstotliwości od 650 Hz do 810 Hz mnoŜono widma energetyczne dla wszystkich strun [10, 11]. Następnie wyszukiwano maksima w iloczynie widm znormalizowanych, odrzucając te ekstrema, których wartość była bardzo mała w porównaniu do maksymalnej wartości iloczynu znormalizowanych widm chromatycznych. Przyjęto, Ŝe jeŜeli wartość iloczynu widm energetycznych jest mniejsza od 0.1 maksymalnej wartości iloczynu widm, to mod posiada zbyt małą energię, any skutecznie wpływać na brzmienie instrumentu. Częstotliwości znalezionych maksimów iloczynu widm uznano za częstotliwości modów instrumentu [10, 11]. Uzyskane w ten sposób wyniki pokrywają się z wynikami badań bazujących na analizie odpowiedzi impulsowej [3, 4, 6]. 2.2 Współczynnik energii wzajemnej W wyniku analizy widma energetycznego gam chromatycznych uzyskuje się jeszcze dodatkowy parametr – jet nim wartość iloczynu znormalizowanych widm energetycznych gam chromatycznych dla częstotliwości modu. Parametr ten moŜe przyjmować wartości z przedziału (0,1> . PoniewaŜ ten współczynnik pochodzi z róŜnych widm został on nazwany współczynnikiem energii wzajemnej (mutual energy factor). Definicje są następujące: a) dla pasma od 197 Hz do 650 Hz: E f =E ng f mod E ne f mod (1) b) dla pasma od 650 Hz do 810 Hz: E f =E ng f mod E nd f mod E na f mod Ene f mod (2) Gdzie E f oznacza współczynnik energii wzajemnej, f mod - jest częstotliwością modu, są E ng f mod , E nd f mod , E na f mod , Ene f mod wartościami znormalizowanych widm energetycznych, wyliczonych odpowiednio dla gamy chromatycznej na strunie g (ng), struny d’ (nd), strunie a’ (na) i strunie e’’ (ne). Przedział częstotliwości, w którym poszukuje się modów, wynika przede wszystkim z tego, Ŝe mody o największych energiach znajdują się w zakresie częstotliwości od 197 Hz do 810 Hz [3, 4, 6]. Dodatkowo, dla zakresu od 197 Hz do około 663 Hz, w nagraniu gamy chromatycznej na strunie e’’ obecne są tylko mody, gdyŜ najniŜsza częstotliwość 226 podstawowa drgań struny wynosi około 663 Hz (dla a’ = 443 Hz). Tym samym występują znaczne róŜnice w poziomach energii pobudzeń dla modów pomiędzy struną g a struną e’’. PoniewaŜ skrzypce są nieliniowym systemem drgającym [9], to współczynnik energii wzajemnej jest obliczany dla róŜnych poziomów energii pobudzenia, to parametr ten charakteryzuje zachowanie się modu podczas gry. JeŜeli wartość E f jest bliska jedności, oznacza to, Ŝe mod zachowuje się podobnie niezaleŜnie od energii pobudzenia, natomiast gdy wartość E f jest bardzo mała, to pojawienie się modu zaleŜy bardzo mocno od energii pobudzenia. Współczynnik energii wzajemnej jest nowym parametrem, utworzonym specjalnie do charakteryzowania róŜnego zachowania się skrzypiec w zaleŜności od wartości energii pobudzenia, tym samym umoŜliwia uwzględnienie nieliniowości instrumentu podczas analizy dźwięku. 3. Percepcja modów skrzypiec Obecność modów w widmie skrzypiec oraz moŜliwość ich wyodrębnienia nie jest toŜsama z ich percepcją w procesie słyszenia. JednakŜe jeŜeli mody decydują o brzmieniu skrzypiec [3, 4, 6], to moŜna się spodziewać, Ŝe jednak ich obecność w widmie, jako komponentów o relatywnie wysokich poziomach energii, pełni znaczącą rolę w subiektywnej ocenie dźwięku jak równieŜ podczas gry na tym instrumencie. W celu sprawdzenia hipotezy, Ŝe skrzypek reaguje na obecność modu w widmie, przeprowadzono analizę statystyczną poprawności gry muzyka [16]. Zbadano rozkłady statystyczne dla dźwięków ze skali skrzypiec oraz określono prawdopodobieństwo zagrania dźwięku z prawidłową częstotliwością. Zaobserwowano, Ŝe rozkłady częstotliwości dla dźwięków leŜących w pobliŜu modów nie naleŜą do rodziny rozkładów Gaussowskich [16]. Wszystkie pozostałe dźwięki ze skali skrzypiec, których częstotliwości róŜnią się znacząco od częstotliwości modów posiadały rozkład normalny [16]. Po stwierdzeniu tego zjawiska, przeanalizowano histogramy częstotliwościowo - czasowe dźwięków gam chromatycznych znajdujących się w pobliŜu modów i stwierdzono, Ŝe jeŜeli róŜnica pomiędzy energią drgania podstawowego struny i modu była mniejsza niŜ 10 dB, to skrzypek dostrajał częstotliwość struny do częstotliwości modu. W innym przypadku, gdy róŜnica wspomniana powyŜej była większa od 10 dB, muzyk nie modyfikował swojego stylu gry [16]. Na podstawie tej analizy moŜna przyjąć hipotezę o percepcji modów przez skrzypka za prawdziwą. Innym zagadnieniem jest percepcja modów skrzypiec przez słuchacza. Na podstawie wielu prac przedstawionych w ksiąŜce pod redakcją Peretz i Zatorre [17], naleŜy się spodziewać następujących zjawisk: a)maskowania modów o zbyt małych energiach, b)percepcji modów o odpowiednio duŜych energiach, c)automatycznego rozpoznania relacji muzycznych pomiędzy częstotliwościami modów, d)oceny brzmienia na podstawie relacji muzycznych pomiędzy częstotliwościami modów. Wszystkie wymienione wyŜej zdarzenia zaleŜą od tego, czy słuchacz jest muzykiem czy teŜ nie posiada wykształcenia muzycznego [17]. W multimedialnej bazie AMATI, oprócz samych nagrań znajdują się równieŜ oceny instrumentów wystawione przez jurorów X Międzynarodowego Konkursu Lutniczego im. Henryka Wieniawskiego podczas II etapu tego wydarzenia. Jedną z kategorii ocen jest jakość brzmienia w skali od 4 do 20 punktów. Wykorzystując te dane oraz wiedzę na temat percepcji dźwięku stworzono klasyfikator jakości brzmienia skrzypiec. Przedtem jednak wyznaczono rzeczywistą dokładność jurorów. 4. Dokładność oceny jurorów W drugim etapie konkursu, czterech jurorów oceniało brzmienie skrzypiec, kaŜdy wystawiał ocenę niezaleŜnie. Zgodnie z regulaminem, ocena końcowa była średnią arytmetyczną ocen wystawionych przez jurorów. KaŜdy z muzyków mógł przyznawać punkty w skali od 4 do 20, z dokładnością jednego punktu. PoniewaŜ oceny jurorów były traktowane jako liczby, przeprowadzono analizę błędu pomiarowego i oszacowano dokładność oceniających. Do analizy błędu wykorzystano średnią arytmetyczną x oraz odchylenie standardowe zdefiniowane następująco dla N elementów [18]: = N 1 ∑ x − x2 N −1 k=1 k (3) W analizie błędu pomiarowego wykorzystano oceny wystawione przez jurorów dla siedemdziesięciu dziewięciu skrzypiec biorących udział w II etapie konkursu. Dla kaŜdego instrumentu obliczono średnią ocenę jurorów oraz odchylenie standardowe. PoniewaŜ oceny wystawiało tylko czterech jurorów, naleŜało urealnić wartość odchylenia standardowego [18]. Urealnienie przeprowadza się przemnaŜając odchylenie standardowe przez współczynnik Studenta-Fishera [18]. Wartość tego współczynnika dla czterech pomiarów i prawdopodobieństwa 0,6826 wynosi 1,197 [18]. Po obliczeniu odchylenia standardowego dla kaŜdego instrumentu oddzielnie, oszacowano graniczną dokładność jurorów dla jakości brzmienia jako średnią arytmetyczną wszystkich odchyleń standardowych wyliczonych dla siedemdziesięciu dziewięciu instrumentów. Wyliczona rzeczywista 227 dokładność jurorów wyniosła ±1,98 punktów. Średnia arytmetyczna wszystkich ocen wynosi 13,35 punktów, natomiast wartość odchylenia standardowego wyliczonego dla wszystkich ocen cząstkowych jurorów wynosi ±2,63 punktów. Zatem moŜna stwierdzić, Ŝe rzeczywista dokładność jurorów jest gorsza od tej, którą przewiduje regulamin konkursu. Centy (Cents) Nazwa (Name of interval) Kategoria (Category of interval) <350; 450) tercja wielka konsonans <450 ; 550) kwarta dysonans <550 ; 650) tryton silny dysonans <650 ; 750) kwinta konsonans <750 ; 850) seksta mała dysonans <850 ; 950) seksta wielka słaby dysonans <950; 1050) septyma mała dysonans <1050 ; 1150) septyma wielka dysonans <1150 ; 1200) oktawa konsonans 5. Klasyfikator jakości brzmienia Klasyfikator słuŜący do oszacowania oceny jakości brzmienia został utworzony z wykorzystaniem zarówno parametrów obiektywnych dźwięku instrumentu (częstotliwości modów i współczynnik energii wzajemnej) jak i zasad harmonii jako elementu subiektywnego. Interwały muzyczne zostały uszeregowane według zasad harmonii klasycznej przy załoŜeniu równomiernego systemu strojenia [19]. Częstotliwości modów porównywane są parami. Do kaŜdego porównania przypisywany jest współczynnik waŜności zdefiniowany następującym wzorem: i ,k =E f ⋅E f i (4) k gdzie i oraz k jest indeksem modu, a E f oraz E f są współczynnikami energii wzajemnej dla i-tego oraz k-tego modu. Operację porównania przeprowadza się dla kaŜdego instrumentu oddzielnie. Do wyznaczenia relacji harmonicznych pomiędzy modami uŜywa się miary centowej zdefiniowanej następująco: i k interval=1200log 2 f1 f2 Zatem dla kaŜdej porównywanej pary modów otrzymano następujące parametry: współczynnik waŜności , interwał wyraŜony w centach oraz kategorię harmoniczną. Parametry te opisują zarówno obiektywne relacje pomiędzy modami (współczynnik waŜności i interwał centowy) jak równieŜ subiektywną relację harmoniczną. Klasyfikator szacujący jakość brzmienia wykorzystuje wszystkie uzyskane parametry. Szacowanie oceny odbywa się za pomocą następującego wzoru: MSD MD e q= k=1 M SD k=1 Tab.1. Podział interwałów Categories of interval s D k MCN k=1 MD LD k k =1 k=1 M LD CN M CN D LD CN ∑ SD k ∑ k ∑ k ∑ k (5) Następnie wszystkie interwały zostają znormalizowane do oktawy poprzez wykonanie dzielenia modulo 1200 centów i obliczeniu wartości bezwzględnej. KaŜdy wyliczony interwał został przypisany do jednej z czterech kategorii harmonicznych: silnego dysonansu (strong dissonance), dysonansu (dissonance), słabego dysonansu (light dissonance) i konsonansu (consonance) [19]. Grupowanie zostało przeprowadzone według następujących reguł: M LD W SD ∑ W D ∑ W LD ∑ W CN ∑ k SD k k=1 k=1 k=1 (6) Gdzie e q jest wartością wyliczonej oceny, M SD jest liczbą silnych dysonansów, M D jest liczbą dysonansów, M LD jest liczba słabych dysonansów, jest M CN jest liczbą dysonansów. SD k współczynnikiem waŜności k-tego silnego dysonansu, Dk reprezentuje współczynnik waŜności k-tego dysonansu, odpowiada LD k współczynnikowi waŜności k-tego słabego CN dysonansu, k jest współczynnikiem waŜności ktego konsonansu. W SD , W D ,W LD i W CN są wagami dla czterech kategorii harmonicznych, odpowiednio: silnego dysonansu (SD), dysonansu (D), słabego dysonansu (LD) oraz konsonansu (CN). Wymienione wagi muszą być wyznaczone numerycznie. W tym celu wykorzystano metodę Monte Carlo. Centy (Cents) Nazwa (Name of interval) Kategoria (Category of interval) <0 ; 50) unison konsonans <50 ; 150) sekunda mała silny dysonans 6. Zastosowanie metody Monte Carlo <150 ; 250) sekunda wielka dysonans <250 ; 350) tercja mała konsonans Do wyznaczenia wartości wag występujących we wzorze 5, uŜyto metody Monte Carlo, polegającym na losowej modyfikacji wag, aby uzyskać minimalną wartość funkcji błędu opisanej wzorem (7): 228 Nv 1 e rr = ⋅∑ ∣e qk − e qk∣ N v k=0 zgodna z oceną jurorów. Wszystkie wyliczone oceny się w przedziale zdefiniowanym w regulaminie konkursu, najniŜsza uzyskana wartość wynosiła 6,92 punktów, najwyŜsza wartość oceny wyniosła 17,98 punktu. Dla porównania, najniŜsza ocena postawiona przez jurorów (z ocen cząstkowych) wynosiła 4 punkty, a najwyŜsza 19 punktów. Według regulaminu oceny mogły przyjmować wartości od 4 do 20 punktów. Wartość średnia wszystkich wyliczonych ocen wynosi 12,11 punktów, a odchylenie standardowe szacowania wynosi ±2,5 punktu. Są to wartości bardzo podobne dla ocen wystawionych przez jurorów, dla których średnia wartość wynosi 13,35 punktów, a odchylenie standardowe ±2,63 punktu. Parametry statystyczne dla ocen jurorów podane powyŜej zostały obliczone dla wszystkich ocen cząstkowych. Zatem statystyczne właściwości klasyfikatora równieŜ są bardzo podobne do ocen jurorów. Tym samym klasyfikator nadaje się to automatycznego obliczania jakości brzmienia skrzypiec oraz innych instrumentów smyczkowych, w których podczas generacji dźwięku występują podobne zjawiska fizyczne jak w skrzypcach. (7) mieściły Gdzie: e rr jest wartością funkcji błędu, N v jest liczbą instrumentów wykorzystywanych do oszacowania wag, e qk jest średnią oceną jurorów dla k-tego instrumentu wykorzystywanego do szacowania wag interwałów, e qk jest wyliczoną za pomocą wzoru (6) oceną instrumentu. Do oszacowania wartości wag wykorzystano 15 instrumentów z bazy AMATI: 5 najlepszych, 5 średnich i 5 najgorszych. Początkowe wartości wag zostały wylosowane, samo szacowanie zostało przeprowadzone wiele razy. Najmniejsza uzyskana wartość funkcji błędu wyniosła ±1,97 (1,96650644697478), co odpowiada błędowi pomiarowemu jurorów. Uzyskano następujące wartości wag: Tab.2. Wartości wag dla czter ec h kategorii interwa łó w Values of wei ght s of fou r categories of in terv al Wagi (weights) Wartości (values) W SD 14,3990523557032 WD 6,9185314074039 W LD 5,7049333116643 W CN 17,9895114267725 7. Testowanie klasyfikatora Wagi dla czterech kategorii interwałów zostały wyliczone dla 15 skrzypiec z multimedialnej bazy danych AMATI. Baza zawiera nagrania 54 instrumentów, z czego dla 53 dostępne oceny jurorów. Dodatkowy instrument to skrzypce będące własnością muzyka, który grał podczas sesji nagraniowej dla bazy AMATI. Testowanie poprawności szacowania klasyfikatora zostało przeprowadzone na 53 instrumentach z bazy AMATI. Przyjęto następujące reguły porównania ocen jurorów z oceną wyliczoną za pomocą klasyfikatora: jeŜeli ocena wyliczona mieści się w granicach błędu pomiarowego wyznaczonego dla instrumentu (średnia ocena jurorów ±błąd pomiarowy), albo ocena wyliczona mieści się w przedziale wyznaczonym przez ocenę minimalną oraz maksymalną jurorów dla danego instrumentu, to uznaje się wyliczoną ocenę za prawidłową. Wartość błędu pomiarowego wynosi 1.98 punktu, ale moŜe być większa, gdyŜ odchylenie standardowe dla wielu instrumentów jest większe od granicznej dokładności jurorów. W obliczeniach uŜyto wartości wag interwałów obliczonych poprzednio dla 15 instrumentów (sekcja 6). Dla 40 instrumentów z 53 wyliczona ocena była 8. Podsumowanie Przedstawiony w pracy klasyfikator jakości dźwięku skrzypiec dla multimedialnych baz danych spełnia swoje zadanie, gdyŜ z bardzo duŜym prawdopodobieństwem oszacowuje wartość tego parametru. RównieŜ parametry statystyczne klasyfikatora oraz ekspertów są bardzo podobne. Wartość średnia, odchylenie standardowe oraz błąd pomiarowy klasyfikatora są prawie identyczne z parametrami statystycznymi ocen jurorów X Międzynarodowego Konkursu Lutniczego im. Henryka Wieniawskiego w Poznaniu. Dodatkowo, wszystkie wyliczone oceny znajdują się w przedziale wyznaczonym regulaminem konkursu, mimo Ŝe sam klasyfikator nie posiada jakichkolwiek załoŜeń dotyczących wartości oceny minimalnej jak i maksymalnej. WaŜną cechą klasyfikatora jest potencjalna moŜliwość zmiany zastosowanego modelu harmonii oraz rodzaju systemu strojenia, co jest bardzo istotne w przypadku porównywania instrumentów przeznaczonych do wykonywania muzyki dawnej. Zatem opracowany klasyfikator spełnia swój podstawowy cel, jakim jest oszacowanie jakości brzmienia skrzypiec w celu przeprowadzania automatycznej klasyfikacji w multimedialnych bazach danych. Literatura 1.MPEG-7 Overview, International Organisation for Standardisation, ISO/IEC JTC1/SC29/WG11 2.Goto Masataka, RWC Music Database, National Institute of Advanced Industrial Science and Technology (AIST), Japan 229 3.Hutchins Carleen M., Voskuil Duane, Mode tuning for the violin maker, CAS Journal vol. 2, No. 4 (Series II), Nov. 1993, pp: 5–9 4.Yankovskii B. A., Method for the objective appraisal of violin tone quality, Soviet Physics Acoustics (in English), 11(269), 1965 5.Łukasik Ewa, Wrzeciono Piotr, Cyfrowa rejestracja dźwięków instrumentów muzycznych do badania ich barwy, Raport Instytutu Informatyki RB-03/2001, Poznań, Politechnika Poznańska, 2001 6.Andō Yoshinori, Akustyka instrumentów muzycznych (jap), Ongaku-no-tomo-sha, Tokio 2000 7.Kolender Walter, The Amadeus book of the violin – construction, history, and music, Amadeus Press, 1998 8.Kusiak Jerzy, Skrzypce od A do Z, Polskie Wydawnictwo Muzyczne S.A., Warszawa 1999 9.Weyna Stefan, Rozpływ energii akustycznych źródeł rzeczywistych, Wydawnictwa NaukowoTechniczne, Warszawa 2005 10.Wrzeciono Piotr, A New Method of Searching for Violin Modes, Warszawa, The IEEE Region 8 Eurocon 2007 Conference, 2007, Poland 11.Wrzeciono Piotr, A method of detecting the C4 violin mode in the energy spectra of chromatic scales, Archives of Acoustics, Vol. 32, No 4 (Supplement), pp: 197–201, 2007 12.Wrzeciono Piotr, Statystyczna i percepcyjna analiza dźwięku skrzypiec, 52nd Open Seminar on Acoustics, Wagrowiec, 2005, Poland 13.Wrzeciono Piotr, Matematyczna metoda opisu własności dźwięku instrumentu muzycznego, 53th Open Seminar on Acoustics, Kraków - Zakopane, 2006, Poland 14.Łukasik Ewa, AMATI : multimedia database of musical sounds, Stockholm Music Acoustics Conference, KTH [Kungliga Tekniska Hogskolan], 2003, pp: 79–82, 2003 15.Lathi Bhagwandas Pannalal, Linear system and signals, Oxford University Press, New York 2005 16.Wrzeciono Piotr, Statistical evaluation of violinist’s performance based on recordings from the AMATI multimedia database, 55th Open Seminar on Acoustics, Wrocław-Piechowice, 2008, Poland 17.Peretz Isabelle, Zatorre Robert, The cognitive neuroscience of music, Oxford University Press, New York 2007 18.Dunn Patrick F., Measurement and data analysis for engineering and science, McGraw-Hill, New York 2005 19.Levitin Daniel J., This is your brain on music – the science of a human obsession, Penguin Book, New York 2007 other bowed string instruments. By employing it, it is possible to calculate sound quality evaluation, which itself is a subjective parameter. Another advantage offered by the classifier is its possible application for the search for similar instruments within the same database. The performance of the jurors as well as that of the sound quality classifier are similar. The range of marks calculated with Formula (6) for the violins in the AMATI database falls within the range stipulated by the competition regulations despite the fact that the classifier itself does not have any such restrictions. The standard deviation calculated for all the marks given by all the jurors (σ=±2.63) is very similar to that of the marks calculated by the program (σ=±2.5). For this reason, it is fair to assert that the methods presented in this paper fulfill their main function, i.e. the ability to estimate the subjective violin tone quality. Autor: Mgr inŜ. Piotr Wrzeciono email: [email protected] Polish-Japanese Institute of Information Technology ul. Koszykowa 86 02-008 Warszawa tel. 606 35 85 18 Summary The method presented in this paper is designed for automatic classification within multimedia databases containing the recordings of violins and 230