klasyfikator jakości dźwięku skrzypiec dla multimedialnych baz

Transkrypt

klasyfikator jakości dźwięku skrzypiec dla multimedialnych baz
XI International PhD Workshop
OWD 2009, 17–20 October 2009
KLASYFIKATOR JAKOŚCI DŹWIĘKU SKRZYPIEC
DLA MULTIMEDIALNYCH BAZ DANYCH
VIOLIN SOUND QUALITY CLASSIFIER
FOR MULTIMEDIA DATABASES
Piotr Wrzeciono, Polish-Japanese Institute of Information Technology
(11.06.2008, dr hab. Krzysztof Marasek, Polsko-Japońska WyŜsza Szkoła Technik Komputerowych)
Abstract
This paper presents the violin sound quality
classifier for automatic classification in multimedia
databases. Parameters of modes and harmony
relations between modes frequencies were used to
evaluate sound quality. The AMATI multimedia
database was used to test the presented classifier.
This database contains recordings and jurors’
evaluations of violin which participated in the 10th
Henryk Wieniawski International Violin Making
Competition in Poznań (2001). The calculated sound
quality evaluation was the same as jurors’ opinion for
the 75.5% of instruments from the AMATI
database. Measuring error of the classifier were the
same as the measuring error of jurors’ evaluation.
The all estimated violin sound quality evaluations
were in the range defined by the regulations of The
Violin Maker Competitions. The statistical
parameters of the classifier and the jurors’ opinions
are very similar.
Streszczenie
Praca przedstawia klasyfikator jakości dźwięku
skrzypiec przeznaczony do przeprowadzania
automatycznej klasyfikacji w multimedialnych bazach
danych. Do oszacowania oceny jakości brzmienia
wykorzystano parametry rezonansów własnych
instrumentu (modów) oraz relacji harmonicznych
pomiędzy
nimi.
Klasyfikator
testowano
na multimedialnej bazie danych AMATI, zawierającej
nagrania oraz oceny skrzypiec biorących udział
w X Międzynarodowym Konkursie Lutniczym
im. Henryka Wieniawskiego w Poznaniu (2001).
Oceny uzyskane za pomocą klasyfikatora były
zgodne z ocenami jurorów dla 75.5% instrumentów
z bazy AMATI. Dokładność szacowania jakości
brzmienia za pomocą prezentowanego klasyfikatora
była taka sama jak błąd pomiarowy jurorów.
Wszystkie wyliczone oceny jakości dźwięku
skrzypiec znajdują się w przedziale określonym
w regulaminie konkursu, jak równieŜ parametry
statystyczne klasyfikatora i ocen jurorów są bardzo
podobne.
1. Wprowadzenie
Automatyczna klasyfikacja w multimedialnych
bazach danych zawierających nagrania instrumentów
muzycznych jest bardzo waŜnym zagadnieniem.
Klasyfikacja w tym przypadku oznacza utworzenie
zbioru parametrów przypisanych do nagrania, który
umoŜliwia przeszukiwanie oraz porządkowanie bazy
danych. PoniewaŜ multimedia w ogólności mogą być
oceniane w róŜny sposób, ich parametry dzieli się na
dwie grupy: obiektywne i subiektywne. Do
pierwszego rodzaju zalicza się parametry, do których
znalezienia nie jest istotna wiedza na temat percepcji
danego medium przez człowieka. Najbardziej
popularna grupa klasyfikatorów słuŜących do
obliczania parametrów obiektywnych jest opisana
w standardzie MPEG-7 [1]. Oprócz ogólnych metod
klasyfikacji wykorzystywane są równieŜ parametry
charakterystyczne
dla
źródła
danych
multimedialnych [2]. W przypadku skrzypiec są to
przede wszystkim częstotliwości rezonansów
własnych skrzypiec, nazywanych równieŜ modami
[2, 3].
Parametry subiektywne tworzy się jako pochodne
parametrów obiektywnych uwzględniających procesy
percepcji informacji przez człowieka. Dla dźwięku
skrzypiec tego rodzaju parametrem jest jakość
brzmienia [4, 5, 6]. MoŜe być ona wyraŜana zarówno
werbalnie [4, 6] jak i liczbowo [5]. Ten ostatni rodzaj
oceny jest bardzo uŜyteczny dla tworzenia
klasyfikatora jakości dźwięku, gdyŜ w tym przypadku
szacowana wartość tego parametru nie jest
ograniczona tylko do kilku pojęć, tak jak w pracy
Yankovskiego [4].
W niniejszej pracy wykorzystane są dwa
parametry obiektywne, oba związane z modami
225
skrzypiec. Pierwszym z nich jest częstotliwość modu,
natomiast drugim jest współczynnik energii
wzajemnej, opisujący zachowanie się modu podczas
gry na instrumencie.
2. Parametry modów
NajwaŜniejszymi elementami skrzypiec, z punktu
widzenia akustyki, są płyty rezonansowe (górna
i dolna), dusza (drewniany słupek łączący obie płyty)
oraz powietrze w korpusie instrumentu [3, 4, 8].
Mody są falami stojącymi powstającymi na
powierzchni płyt oraz wewnątrz korpusu [3, 4, 7, 8].
Klasyfikacja modów została przeprowadzona przez
zespół pod kierownictwem Hutchins [3] i jest
powszechnie stosowana zarówno przez lutników jak
i akustyków. Mody są wykrywane podczas badania
odpowiedzi impulsowej skrzypiec [3, 4, 6], której
pomiaru dokonuje się za pomocą akcelerometru,
bez rejestrowania dźwięku [3, 4, 6]. JednakŜe
z powodu
faktu, Ŝe skrzypce są systemem
nieliniowym [9], sama analiza odpowiedzi
impulsowej nie jest wystarczająca do określenia jakie
będzie brzmienie instrumentu. W celu lepszej analizy
zachowania się instrumentu podczas normalnej gry
za pomocą smyczka zostały opracowane metody
wyszukująca mody w dźwięku instrumentu [10, 11].
W rezultacie otrzymano dwa parametry modu:
częstotliwość i współczynnik energii wzajemnej
(mutual energy factor), który charakteryzuje
zachowanie się instrumentu przy róŜnych poziomach
energii pobudzenia.
2.1 Częstotliwość modu
Podczas badań [12, 13] stwierdzono obecność
modów
w
widmie
energetycznym
gam
chromatycznych zagranych na skrzypcach. Nagrania
pochodziły z multimedialnej bazy danych AMATI
[5, 14], zawierającej rejestracje dźwięków
instrumentów
biorących
udział
w X Międzynarodowym Konkursie Lutniczym
im. Henryka Wieniawskiego (2001r.). ZauwaŜono
wtedy, Ŝe mody moŜna wyodrębnić z widma
energetycznego, poniewaŜ częstotliwość modów jest
stała i niezaleŜna od pobudzenia.
Opracowane metody [10, 11] bazują na
transformacie DTFT [15] obliczanej dla całego
nagrania gamy chromatycznej. Dla kaŜdego
instrumentu z bazy AMATI obliczono widma
energetyczne gam chromatycznych, nagranych
w polu bliskim. Na kaŜdej strunie wykonano jedną
gamę chromatyczną przez całą skalę moŜliwą do
zagrania (dwie oktawy) [7, 8]. W pasmie od 197 Hz
do 650 Hz wykorzystano widma gam
chromatycznych zagranych na strunie g [7, 8] oraz e’’
[7, 8], natomiast w pasmie od 650 Hz do 810 Hz
wykorzystano rejestracje gam chromatycznych na
wszystkich strunach (g, d’, a’, e’’). Transformata
DTFT była obliczana z uŜyciem tego samego zbioru
częstotliwości dla wszystkich nagrań. W następnym
kroku normalizowano widmo energetyczne kaŜdej
gamy względem największej wartości energii
znalezionej w widmie. Kolejne działanie polega na
przemnoŜeniu
znormalizowanych
widm
energetycznych i wyszukaniu maksimów w iloczynie.
Dla pasma od 197 Hz do 650 Hz tworzony był
iloczyn widm energetycznych gam chromatycznych
na strunie g oraz e’’, natomiast dla przedziału
częstotliwości od 650 Hz do 810 Hz mnoŜono
widma energetyczne dla wszystkich strun [10, 11].
Następnie wyszukiwano maksima w iloczynie widm
znormalizowanych, odrzucając te ekstrema, których
wartość była bardzo mała w porównaniu do
maksymalnej wartości iloczynu znormalizowanych
widm chromatycznych. Przyjęto, Ŝe jeŜeli wartość
iloczynu widm energetycznych jest mniejsza od 0.1
maksymalnej wartości iloczynu widm, to mod
posiada zbyt małą energię, any skutecznie wpływać
na
brzmienie
instrumentu.
Częstotliwości
znalezionych maksimów iloczynu widm uznano za
częstotliwości modów instrumentu [10, 11].
Uzyskane w ten sposób wyniki pokrywają się
z wynikami badań bazujących na analizie odpowiedzi
impulsowej [3, 4, 6].
2.2 Współczynnik energii wzajemnej
W wyniku analizy widma energetycznego gam
chromatycznych uzyskuje się jeszcze dodatkowy
parametr
–
jet
nim
wartość
iloczynu
znormalizowanych widm energetycznych gam
chromatycznych dla częstotliwości modu. Parametr
ten moŜe przyjmować wartości z przedziału (0,1> .
PoniewaŜ ten współczynnik pochodzi z róŜnych
widm został on nazwany współczynnikiem energii
wzajemnej (mutual energy factor). Definicje są
następujące:
a) dla pasma od 197 Hz do 650 Hz:
E f =E ng f mod  E ne f mod 
(1)
b) dla pasma od 650 Hz do 810 Hz:
E f =E ng f mod  E nd f mod  E na  f mod  Ene  f mod  (2)
Gdzie E f oznacza współczynnik energii
wzajemnej, f mod - jest częstotliwością modu,
są
E ng  f mod  , E nd f mod  , E na  f mod  , Ene  f mod 
wartościami
znormalizowanych
widm
energetycznych, wyliczonych odpowiednio dla gamy
chromatycznej na strunie g (ng), struny d’ (nd),
strunie a’ (na) i strunie e’’ (ne).
Przedział częstotliwości, w którym poszukuje się
modów, wynika przede wszystkim z tego, Ŝe mody
o największych energiach znajdują się w zakresie
częstotliwości od 197 Hz do 810 Hz [3, 4, 6].
Dodatkowo, dla zakresu od 197 Hz do około 663
Hz, w nagraniu gamy chromatycznej na strunie e’’
obecne są tylko mody, gdyŜ najniŜsza częstotliwość
226
podstawowa drgań struny wynosi około 663 Hz (dla
a’ = 443 Hz). Tym samym występują znaczne
róŜnice w poziomach energii pobudzeń dla modów
pomiędzy struną g a struną e’’.
PoniewaŜ skrzypce są nieliniowym systemem
drgającym [9], to współczynnik energii wzajemnej
jest obliczany dla róŜnych poziomów energii
pobudzenia, to parametr ten charakteryzuje
zachowanie się modu podczas gry. JeŜeli wartość
E f jest bliska jedności, oznacza to, Ŝe mod
zachowuje się podobnie niezaleŜnie od energii
pobudzenia, natomiast gdy wartość E f jest bardzo
mała, to pojawienie się modu zaleŜy bardzo mocno
od energii pobudzenia.
Współczynnik energii wzajemnej jest nowym
parametrem,
utworzonym
specjalnie
do
charakteryzowania róŜnego zachowania się skrzypiec
w zaleŜności od wartości energii pobudzenia, tym
samym umoŜliwia uwzględnienie nieliniowości
instrumentu podczas analizy dźwięku.
3. Percepcja modów skrzypiec
Obecność modów w widmie skrzypiec oraz
moŜliwość ich wyodrębnienia nie jest toŜsama z ich
percepcją w procesie słyszenia. JednakŜe jeŜeli mody
decydują o brzmieniu skrzypiec [3, 4, 6], to moŜna
się spodziewać, Ŝe jednak ich obecność w widmie,
jako komponentów o relatywnie wysokich
poziomach
energii,
pełni
znaczącą
rolę
w subiektywnej ocenie dźwięku jak równieŜ podczas
gry na tym instrumencie.
W celu sprawdzenia hipotezy, Ŝe skrzypek reaguje
na obecność modu w widmie, przeprowadzono
analizę statystyczną poprawności gry muzyka [16].
Zbadano rozkłady statystyczne dla dźwięków ze skali
skrzypiec oraz określono prawdopodobieństwo
zagrania dźwięku z prawidłową częstotliwością.
Zaobserwowano, Ŝe rozkłady częstotliwości dla
dźwięków leŜących w pobliŜu modów nie naleŜą do
rodziny rozkładów Gaussowskich [16]. Wszystkie
pozostałe dźwięki ze skali skrzypiec, których
częstotliwości róŜnią się znacząco od częstotliwości
modów posiadały rozkład normalny [16]. Po
stwierdzeniu tego zjawiska, przeanalizowano
histogramy częstotliwościowo - czasowe dźwięków
gam chromatycznych znajdujących się w pobliŜu
modów i stwierdzono, Ŝe jeŜeli róŜnica pomiędzy
energią drgania podstawowego struny i modu była
mniejsza niŜ 10 dB, to skrzypek dostrajał
częstotliwość struny do częstotliwości modu. W
innym przypadku, gdy róŜnica wspomniana powyŜej
była większa od 10 dB, muzyk nie modyfikował
swojego stylu gry [16]. Na podstawie tej analizy
moŜna przyjąć hipotezę o percepcji modów przez
skrzypka za prawdziwą.
Innym zagadnieniem jest percepcja modów
skrzypiec przez słuchacza. Na podstawie wielu prac
przedstawionych w ksiąŜce pod redakcją Peretz
i Zatorre [17], naleŜy się spodziewać następujących
zjawisk:
a)maskowania modów o zbyt małych energiach,
b)percepcji modów o odpowiednio duŜych
energiach,
c)automatycznego
rozpoznania
relacji
muzycznych pomiędzy częstotliwościami modów,
d)oceny brzmienia na podstawie relacji
muzycznych pomiędzy częstotliwościami modów.
Wszystkie wymienione wyŜej zdarzenia zaleŜą od
tego, czy słuchacz jest muzykiem czy teŜ nie posiada
wykształcenia muzycznego [17].
W multimedialnej bazie AMATI, oprócz samych
nagrań znajdują się równieŜ oceny instrumentów
wystawione przez jurorów X Międzynarodowego
Konkursu Lutniczego im. Henryka Wieniawskiego
podczas II etapu tego wydarzenia. Jedną z kategorii
ocen jest jakość brzmienia w skali od 4 do 20
punktów. Wykorzystując te dane oraz wiedzę na
temat percepcji dźwięku stworzono klasyfikator
jakości brzmienia skrzypiec. Przedtem jednak
wyznaczono rzeczywistą dokładność jurorów.
4. Dokładność oceny jurorów
W drugim etapie konkursu, czterech jurorów
oceniało brzmienie skrzypiec, kaŜdy wystawiał ocenę
niezaleŜnie. Zgodnie z regulaminem, ocena końcowa
była średnią arytmetyczną ocen wystawionych przez
jurorów. KaŜdy z muzyków mógł przyznawać
punkty w skali od 4 do 20, z dokładnością jednego
punktu. PoniewaŜ oceny jurorów były traktowane
jako liczby, przeprowadzono analizę błędu
pomiarowego
i
oszacowano
dokładność
oceniających.
Do analizy błędu wykorzystano średnią
arytmetyczną x oraz odchylenie standardowe 
zdefiniowane następująco dla N elementów [18]:
=

N
1
∑  x − x2
N −1 k=1 k
(3)
W analizie błędu pomiarowego wykorzystano
oceny
wystawione
przez
jurorów
dla
siedemdziesięciu dziewięciu skrzypiec biorących
udział w II etapie konkursu. Dla kaŜdego
instrumentu obliczono średnią ocenę jurorów oraz
odchylenie standardowe. PoniewaŜ oceny wystawiało
tylko czterech jurorów, naleŜało urealnić wartość
odchylenia standardowego
[18]. Urealnienie
przeprowadza
się
przemnaŜając
odchylenie
standardowe przez współczynnik Studenta-Fishera
[18]. Wartość tego współczynnika dla czterech
pomiarów i prawdopodobieństwa 0,6826 wynosi
1,197 [18]. Po obliczeniu odchylenia standardowego
dla kaŜdego instrumentu oddzielnie, oszacowano
graniczną dokładność jurorów dla jakości brzmienia
jako średnią arytmetyczną wszystkich odchyleń
standardowych wyliczonych dla siedemdziesięciu
dziewięciu instrumentów. Wyliczona rzeczywista
227
dokładność jurorów wyniosła ±1,98 punktów.
Średnia arytmetyczna wszystkich ocen wynosi 13,35
punktów,
natomiast
wartość
odchylenia
standardowego wyliczonego dla wszystkich ocen
cząstkowych jurorów wynosi ±2,63 punktów.
Zatem moŜna stwierdzić, Ŝe rzeczywista
dokładność jurorów jest gorsza od tej, którą
przewiduje regulamin konkursu.
Centy
(Cents)
Nazwa
(Name of
interval)
Kategoria
(Category of
interval)
<350; 450)
tercja wielka
konsonans
<450 ; 550)
kwarta
dysonans
<550 ; 650)
tryton
silny dysonans
<650 ; 750)
kwinta
konsonans
<750 ; 850)
seksta mała
dysonans
<850 ; 950)
seksta wielka
słaby dysonans
<950; 1050)
septyma mała
dysonans
<1050 ; 1150)
septyma wielka
dysonans
<1150 ; 1200)
oktawa
konsonans
5. Klasyfikator jakości brzmienia
Klasyfikator słuŜący do oszacowania oceny
jakości
brzmienia
został
utworzony
z
wykorzystaniem
zarówno
parametrów
obiektywnych dźwięku instrumentu (częstotliwości
modów i współczynnik energii wzajemnej) jak
i zasad harmonii jako elementu subiektywnego.
Interwały muzyczne zostały uszeregowane według
zasad harmonii klasycznej przy załoŜeniu
równomiernego
systemu
strojenia
[19].
Częstotliwości modów porównywane są parami. Do
kaŜdego
porównania
przypisywany
jest
współczynnik waŜności zdefiniowany następującym
wzorem:
i ,k =E f ⋅E f
i
(4)
k
gdzie i oraz k jest indeksem modu, a E f oraz
E f są współczynnikami energii wzajemnej dla
i-tego oraz k-tego modu. Operację porównania
przeprowadza się dla kaŜdego instrumentu
oddzielnie. Do wyznaczenia relacji harmonicznych
pomiędzy modami uŜywa się miary centowej
zdefiniowanej następująco:
i
k
interval=1200log 2

f1
f2
Zatem dla kaŜdej porównywanej pary modów
otrzymano następujące parametry: współczynnik
waŜności  , interwał wyraŜony w centach oraz
kategorię harmoniczną. Parametry te opisują
zarówno obiektywne relacje pomiędzy modami
(współczynnik waŜności i interwał centowy) jak
równieŜ subiektywną relację harmoniczną.
Klasyfikator
szacujący
jakość
brzmienia
wykorzystuje wszystkie uzyskane parametry.
Szacowanie oceny odbywa się za pomocą
następującego wzoru:
MSD
MD
e q=
k=1
M SD
k=1
Tab.1.
Podział interwałów
Categories of interval s
D
k
MCN
k=1
MD
LD
k
k =1
k=1
M LD
CN
M CN
D
LD
CN
∑  SD
k ∑  k ∑ k  ∑  k
(5)
Następnie
wszystkie
interwały
zostają
znormalizowane do oktawy poprzez wykonanie
dzielenia modulo 1200 centów i obliczeniu wartości
bezwzględnej.
KaŜdy wyliczony interwał został przypisany do
jednej z czterech kategorii harmonicznych: silnego
dysonansu
(strong
dissonance),
dysonansu
(dissonance), słabego dysonansu (light dissonance)
i konsonansu (consonance) [19]. Grupowanie
zostało przeprowadzone według następujących
reguł:
M LD
W SD ∑  W D ∑  W LD ∑  W CN ∑  k
SD
k
k=1
k=1
k=1
(6)
Gdzie e q jest wartością wyliczonej oceny, M SD
jest liczbą silnych dysonansów, M D jest liczbą
dysonansów, M LD jest liczba słabych dysonansów,
jest
M CN jest liczbą dysonansów. SD
k
współczynnikiem
waŜności
k-tego
silnego
dysonansu, Dk reprezentuje współczynnik waŜności
k-tego
dysonansu,
odpowiada
LD
k
współczynnikowi
waŜności
k-tego
słabego
CN
dysonansu, k jest współczynnikiem waŜności ktego konsonansu.
W SD , W D ,W LD i W CN są
wagami dla czterech kategorii harmonicznych,
odpowiednio: silnego dysonansu (SD), dysonansu
(D), słabego dysonansu (LD) oraz konsonansu (CN).
Wymienione wagi muszą być wyznaczone
numerycznie. W tym celu wykorzystano metodę
Monte Carlo.
Centy
(Cents)
Nazwa
(Name of
interval)
Kategoria
(Category of
interval)
<0 ; 50)
unison
konsonans
<50 ; 150)
sekunda mała
silny dysonans
6. Zastosowanie metody Monte Carlo
<150 ; 250)
sekunda wielka
dysonans
<250 ; 350)
tercja mała
konsonans
Do wyznaczenia wartości wag występujących we
wzorze 5, uŜyto metody Monte Carlo, polegającym
na losowej modyfikacji wag, aby uzyskać minimalną
wartość funkcji błędu opisanej wzorem (7):
228
Nv
1
e rr = ⋅∑ ∣e qk − e qk∣
N v k=0
zgodna z oceną jurorów. Wszystkie wyliczone oceny
się w przedziale zdefiniowanym
w regulaminie konkursu, najniŜsza uzyskana wartość
wynosiła 6,92 punktów, najwyŜsza wartość oceny
wyniosła 17,98 punktu. Dla porównania, najniŜsza
ocena postawiona przez jurorów (z ocen
cząstkowych) wynosiła 4 punkty, a najwyŜsza 19
punktów. Według regulaminu oceny mogły
przyjmować wartości od 4 do 20 punktów.
Wartość średnia wszystkich wyliczonych ocen
wynosi 12,11 punktów, a odchylenie standardowe
szacowania wynosi ±2,5 punktu. Są to wartości
bardzo podobne dla ocen wystawionych przez
jurorów, dla których średnia wartość wynosi 13,35
punktów, a odchylenie standardowe ±2,63 punktu.
Parametry statystyczne dla ocen jurorów podane
powyŜej zostały obliczone dla wszystkich ocen
cząstkowych. Zatem statystyczne właściwości
klasyfikatora równieŜ są bardzo podobne do ocen
jurorów. Tym samym klasyfikator nadaje się to
automatycznego obliczania jakości brzmienia
skrzypiec oraz innych instrumentów smyczkowych,
w których podczas generacji dźwięku występują
podobne zjawiska fizyczne jak w skrzypcach.
(7) mieściły
Gdzie: e rr jest wartością funkcji błędu, N v jest
liczbą
instrumentów
wykorzystywanych
do
oszacowania wag, e qk jest średnią oceną jurorów dla
k-tego
instrumentu
wykorzystywanego
do
szacowania wag interwałów, e qk jest wyliczoną za
pomocą wzoru (6) oceną instrumentu.
Do oszacowania wartości wag wykorzystano 15
instrumentów z bazy AMATI: 5 najlepszych, 5
średnich i 5 najgorszych. Początkowe wartości wag
zostały wylosowane, samo szacowanie zostało
przeprowadzone wiele razy. Najmniejsza uzyskana
wartość
funkcji
błędu
wyniosła
±1,97
(1,96650644697478), co odpowiada błędowi
pomiarowemu jurorów. Uzyskano następujące
wartości wag:
Tab.2.
Wartości wag dla czter ec h kategorii interwa łó w
Values of wei ght s of fou r categories of in terv al
Wagi (weights)
Wartości (values)
W SD
14,3990523557032
WD
6,9185314074039
W LD
5,7049333116643
W CN
17,9895114267725
7. Testowanie klasyfikatora
Wagi dla czterech kategorii interwałów zostały
wyliczone dla 15 skrzypiec z multimedialnej bazy
danych AMATI. Baza zawiera nagrania 54
instrumentów, z czego dla 53 dostępne oceny
jurorów. Dodatkowy instrument to skrzypce będące
własnością muzyka, który grał podczas sesji
nagraniowej dla bazy AMATI.
Testowanie
poprawności
szacowania
klasyfikatora zostało przeprowadzone na 53
instrumentach z bazy AMATI. Przyjęto następujące
reguły porównania ocen jurorów z oceną wyliczoną
za pomocą klasyfikatora:
jeŜeli ocena wyliczona mieści się w granicach
błędu pomiarowego wyznaczonego dla instrumentu
(średnia ocena jurorów ±błąd pomiarowy), albo
ocena wyliczona mieści się w przedziale
wyznaczonym przez ocenę minimalną oraz
maksymalną jurorów dla danego instrumentu, to
uznaje się wyliczoną ocenę za prawidłową.
Wartość błędu pomiarowego wynosi 1.98
punktu, ale moŜe być większa, gdyŜ odchylenie
standardowe dla wielu instrumentów jest większe od
granicznej dokładności jurorów.
W obliczeniach uŜyto wartości wag interwałów
obliczonych poprzednio dla 15 instrumentów (sekcja
6). Dla 40 instrumentów z 53 wyliczona ocena była
8. Podsumowanie
Przedstawiony w pracy klasyfikator jakości
dźwięku skrzypiec dla multimedialnych baz danych
spełnia swoje zadanie, gdyŜ z bardzo duŜym
prawdopodobieństwem oszacowuje wartość tego
parametru.
RównieŜ
parametry
statystyczne
klasyfikatora oraz ekspertów są bardzo podobne.
Wartość średnia, odchylenie standardowe oraz błąd
pomiarowy klasyfikatora są prawie identyczne z
parametrami
statystycznymi
ocen
jurorów
X Międzynarodowego Konkursu Lutniczego
im. Henryka Wieniawskiego w Poznaniu.
Dodatkowo, wszystkie wyliczone oceny znajdują się
w przedziale wyznaczonym regulaminem konkursu,
mimo Ŝe sam klasyfikator nie posiada jakichkolwiek
załoŜeń dotyczących wartości oceny minimalnej jak
i maksymalnej. WaŜną cechą klasyfikatora jest
potencjalna moŜliwość zmiany zastosowanego
modelu harmonii oraz rodzaju systemu strojenia, co
jest bardzo istotne w przypadku porównywania
instrumentów przeznaczonych do wykonywania
muzyki dawnej. Zatem opracowany klasyfikator
spełnia swój podstawowy cel, jakim jest oszacowanie
jakości brzmienia skrzypiec w celu przeprowadzania
automatycznej klasyfikacji w multimedialnych bazach
danych.
Literatura
1.MPEG-7 Overview, International Organisation for
Standardisation, ISO/IEC JTC1/SC29/WG11
2.Goto Masataka, RWC Music Database, National
Institute of Advanced Industrial Science and
Technology (AIST), Japan
229
3.Hutchins Carleen M., Voskuil Duane, Mode tuning
for the violin maker, CAS Journal vol. 2, No. 4
(Series II), Nov. 1993, pp: 5–9
4.Yankovskii B. A., Method for the objective appraisal of
violin tone quality, Soviet Physics Acoustics (in
English), 11(269), 1965
5.Łukasik Ewa, Wrzeciono Piotr, Cyfrowa rejestracja
dźwięków instrumentów muzycznych do badania ich
barwy, Raport Instytutu Informatyki RB-03/2001,
Poznań, Politechnika Poznańska, 2001
6.Andō Yoshinori, Akustyka instrumentów muzycznych
(jap), Ongaku-no-tomo-sha, Tokio 2000
7.Kolender Walter, The Amadeus book of the violin –
construction, history, and music, Amadeus Press, 1998
8.Kusiak Jerzy, Skrzypce od A do Z, Polskie
Wydawnictwo Muzyczne S.A., Warszawa 1999
9.Weyna Stefan, Rozpływ energii akustycznych
źródeł rzeczywistych, Wydawnictwa NaukowoTechniczne, Warszawa 2005
10.Wrzeciono Piotr, A New Method of Searching for
Violin Modes, Warszawa, The IEEE Region 8
Eurocon 2007 Conference, 2007, Poland
11.Wrzeciono Piotr, A method of detecting the C4 violin
mode in the energy spectra of chromatic scales, Archives
of Acoustics, Vol. 32, No 4 (Supplement), pp:
197–201, 2007
12.Wrzeciono Piotr, Statystyczna i percepcyjna analiza
dźwięku skrzypiec, 52nd Open Seminar on
Acoustics, Wagrowiec, 2005, Poland
13.Wrzeciono Piotr, Matematyczna metoda opisu
własności dźwięku instrumentu muzycznego, 53th Open
Seminar on Acoustics, Kraków - Zakopane, 2006,
Poland
14.Łukasik Ewa, AMATI : multimedia database of
musical sounds, Stockholm Music Acoustics
Conference,
KTH
[Kungliga
Tekniska
Hogskolan], 2003, pp: 79–82, 2003
15.Lathi Bhagwandas Pannalal, Linear system and
signals, Oxford University Press, New York 2005
16.Wrzeciono Piotr, Statistical evaluation of violinist’s
performance based on recordings from the AMATI
multimedia database, 55th Open Seminar on
Acoustics, Wrocław-Piechowice, 2008, Poland
17.Peretz Isabelle, Zatorre Robert, The cognitive
neuroscience of music, Oxford University Press, New
York 2007
18.Dunn Patrick F., Measurement and data analysis for
engineering and science, McGraw-Hill, New York
2005
19.Levitin Daniel J., This is your brain on music – the
science of a human obsession, Penguin Book, New
York 2007
other bowed string instruments. By employing it, it is
possible to calculate sound quality evaluation, which
itself is a subjective parameter.
Another advantage offered by the classifier is its
possible application for the search for similar
instruments within the same database. The
performance of the jurors as well as that of the
sound quality classifier are similar. The range of
marks calculated with Formula (6) for the violins in
the AMATI database falls within the range stipulated
by the competition regulations despite the fact that
the classifier itself does not have any such
restrictions. The standard deviation calculated for all
the marks given by all the jurors (σ=±2.63) is very
similar to that of the marks calculated by the
program (σ=±2.5). For this reason, it is fair to assert
that the methods presented in this paper fulfill their
main function, i.e. the ability to estimate the
subjective violin tone quality.
Autor:
Mgr inŜ. Piotr Wrzeciono
email: [email protected]
Polish-Japanese Institute of Information Technology
ul. Koszykowa 86
02-008 Warszawa
tel. 606 35 85 18
Summary
The method presented in this paper is designed
for automatic classification within multimedia
databases containing the recordings of violins and
230

Podobne dokumenty