inteligentny algorytm klasyfikacji nagrań archiwalnych

Transkrypt

inteligentny algorytm klasyfikacji nagrań archiwalnych
P O Z N A N UN I VE RS I T Y O F T E C HN O L O G Y ACA D E MI C J O URN A L S
No 88
Electrical Engineering
2016
Piotr KARDASZ*
INTELIGENTNY ALGORYTM KLASYFIKACJI
NAGRAŃ ARCHIWALNYCH
Proces rekonstrukcji archiwalnych nagrań składa się z szeregu procedur, których parametry wymagają precyzyjnego ustawienia. Dobór tych nastaw jest na ogół zadaniem
eksperta, który znając podstawowe cechy nagrania, takie jak rodzaj nośnika i stopień
jego zużycia, ustala je na podstawie swojej wiedzy i doświadczenia. W celu zautomatyzowania tego procesu niezbędny jest algorytm, który na podstawie analizy nagrania
będzie mógł dostarczyć tego rodzaju informacji, pozwalając na automatyczny dobór
algorytmów rekonstrukcji i określenie ich parametrów. Algorytm tego rodzaju powinien
dokonywać analizy nagrania przy użyciu zarówno metod czasowych, jak
i częstotliwościowych oraz czasowo-częstotliwościowych. Na podstawie wyników tej
analizy powinien zostać określony rodzaj i stopień zużycia nośnika, na którym zapisane
zostało nagranie. Algorytm tego rodzaju został opracowany i przetestowany przy użyciu
fragmentów archiwalnych nagrań zapisanych na nośnikach magnetycznych i mechanicznych, o różnej jakości i stopniu zużycia. Artykuł przedstawia istotę działania opracowanego algorytmu, wyniki testów oraz kierunki dalszych badań
SŁOWA KLUCZOWE: algorytm inteligentny, klasyfikacja, sygnał dźwiękowy, rekonstrukcja
1. WPROWADZENIE
Zarówno w muzeach i archiwach, jak też w domowych bibliotekach, można
znaleźć stare nagrania zapisane na nośnikach analogowych, takich jak taśmy
magnetofonowe na szpulach i w kasetach oraz płyty analogowe, wykonane
z materiału na bazie polichlorku winylu, lub (starsze) szelaku, czy też ebonitu.
Jakość tych nagrań zależy od rodzaju nośnika, wieku nagrania, sprzętu, jakim
nagrania dokonano oraz sposobu obchodzenia się z już zapisanymi nośnikami.
Zawarte w nich zakłócenia i zniekształcenia powodują, że ich brzmienie często
odbiega od pożądanego.
W tej sytuacji istnieje potrzeba rekonstrukcji tego rodzaju nagrań. W tym celu
należy rozpoznać rodzaje zakłóceń istniejące w danym nagraniu, wybrać odpowiednie metody ich redukcji, dobrać ich parametry a następnie zastosować. Dobór metod redukcji zakłóceń i ich parametrów dokonywany jest na ogół przez
__________________________________________
* Politechnika Białostocka.
200
Piotr Kardasz
eksperta, który znając rodzaj, wiek i stopień zużycia nośnika dobiera je zgodnie
ze swoja wiedzą i intuicją. Proces ten jest często iteracyjny: nagranie po poddaniu
procesowi redukcji zakłóceń jest odsłuchiwane, a jeśli rezultat odbiega od zamierzonego, procedura jest powtarzana przy zastosowaniu innych algorytmów lub
ich parametrów, do chwili uzyskania zadowalającego rezultatu. Wymaga to dużego nakładu pracy, a także wiedzy oraz doświadczenia operatora.
2. ZAKŁÓCENIA ARCHIWALNYCH NAGRAŃ DŹWIĘKU
2.1. Zakłócenia nagrań na płytach gramofonowych
Nowe płyty gramofonowe charakteryzują się na ogół dobrą jakością dźwięku. Produkowane współcześnie płyty drobnorowkowe są w stanie przenieść
pełne pasmo akustyczne przy dynamice sięgającej 75 dB [1]. Płyty normalnorowkowe, z pierwszej połowy XX wieku, zapisywane przy prędkości obrotowej
78 obrotów na minutę, maja jednak znacznie gorsze parametry. W ich przypadku odstęp sygnału od szumu jest znacznie mniejszy, a pasmo przenoszenia, ze
względu na ograniczenia technologiczne aparatury zapisującej dźwięk dostępnej
w tamtych czasach, ograniczone (rys. 1).
Rys. 1. Widmo nagrania na płycie normalnorowkowej, 78 obr./min, z lat pięćdziesiątych XX w.
a) fragment nagrania; b) pusty rowek na końcu nagrania
Gramofony klasy popularnej, powszechnie używane w latach sześćdziesiątych i siedemdziesiątych XX wieku, posiadały wkładki krystaliczne. Ich działanie opierało sie na zmianie odkształcenia kryształu o własnościach piezoelektrycznych na napięcie, podawane następnie na wejście wzmacniacza. Wadą tego
rodzaju wkładek jest wymagany przez nie duży nacisk igły na powierzchnię
płyty, rzędu 0,1 N (współczesne magnetyczne wkładki gramofonowe wymagają
nacisku 0,01-0,025 N). Jednocześnie stosowane w nich igły szafirowe miały
niewielką trwałość i ulegały szybkiemu zużyciu. Odtwarzanie płyt za pomocą
tego rodzaju sprzętu powodowało ich szybkie zużycie poprzez ścieranie
Inteligentny algorytm klasyfikacji nagrań archiwalnych
201
i uszkadzanie ścianek rowka płyty. W rezultacie starcia najdrobniejszych szczegółów rowka zapis pozbawiony zostaje wysokich tonów, uszkodzenia zaś objawiają się w postaci trzasków (rys. 2).
Rys. 2. Przebieg czasowy nagrania na płycie gramofonowej z zakłóceniami impulsowymi.
a) dziesięciosekundowy fragment nagrania b) krótki fragment z zakłóceniem impulsowym
Sytuacja jest jeszcze gorsza w przypadku starszych płyt odtwarzanych
z prędkością 78 obrotów na minutę. Zanim rozpowszechniły się gramofony
z wkładką krystaliczną i wzmacniaczem elektronicznym, do odtwarzania takich
płyt stosowano gramofony ze stalową igłą o nacisku rzędu 1 N. Nie posiadały
one wzmacniacza, źródłem dźwięku takiego gramofonu były drgania membrany
wprawianej w ruch bezpośrednio przez igłę.
Innym źródłem szumów i zakłóceń na płytach gramofonowych są zbierające
się w rowku zanieczyszczenia, takie jak kurz lub zabrudzenia powstałe
w wyniku nieostrożnego obchodzenia się z nośnikiem. W zależności od charakteru tych zanieczyszczeń ich obecność będzie objawiać się w postaci szumów
lub trzasków. Większość tego rodzaju zanieczyszczeń może jednak zostać usunięta w procesie mycia płyt za pomocą odpowiednich urządzeń.
Niecentrycznie wykonany otwór centralny w płycie będzie powodować
zmiany chwilowej prędkości przesuwu nośnika, objawiające się zmienną
w czasie wysokością odtwarzanych dźwięków. Zakłócenia tego rodzaju określane są jako zakłócenia typu wow [2] i są dość często spotykane na płytach
produkcji polskiej z lat osiemdziesiątych XX wieku.
Podstawowym rodzajem zakłóceń na płytach gramofonowych są więc zakłócenia impulsowe i zniekształcenia typu wow. Płyty wyprodukowane po 1960
roku rzadko będą wymagały redukcji szumów i innych zakłóceń. Nagrania wykonane wcześniej mogą jednak wymagać redukcji szumu oraz zastosowania
innych metod poprawiających ich brzmienie [3].
202
Piotr Kardasz
2.2. Zakłócenia nagrań na taśmach magnetofonowych
Nagrania na taśmach magnetofonowych charakteryzują się na ogół wysokim
poziomem szumów i często ograniczonym pasmem przenoszenia [1, 4]. O ile
zapis na płytach gramofonowych dokonywany jest w warunkach profesjonalnych, o tyle zapis na taśmach magnetofonowych wykonywany był na ogół za
pomocą urządzeń klasy popularnej, często również o znacznym stopniu zużycia.
Nagrania te pochodzą z różnorodnych źródeł: płyt gramofonowych, audycji
radiowych, telewizyjnych, mikrofonu; częstą praktyką było również wielokrotne kopiowanie taśm.
Nagrania na taśmach magnetofonowych kopiują zakłócenia ich źródeł. Nagranie z płyty gramofonowej będzie więc zawierać zakłócenia impulsowe
i zniekształcenia wow przekopiowane z płyty. Gramofony niskiej jakości często
charakteryzowały się występowaniem przydźwięku sieci zasilającej, który dostawał się do sygnału poprzez drgania mechaniczne wywoływane przez silnik
gramofonu lub zakłócenia elektromagnetyczne powodujące indukowanie się
napięć w przewodach połączeniowych lub układach elektronicznych. Przydźwięk taki jest zapisywany na taśmie razem z sygnałem użytecznym.
Rys. 3. Widmo nagrania na taśmie magnetofonowej. Widoczne zakłócenie w okolicy
częstotliwości 16 kHz wskazuje na to, że źródłem nagrania była audycja telewizyjna
Nagrania audycji radiowych, zwłaszcza dokonywane w latach osiemdziesiątych przy użyciu monofonicznych odbiorników radiowych, mogą zawierać częstotliwość pilota stereo 19 kHz [5], nagrania z telewizji zaś – częstotliwość
odchylania poziomego (rys. 3), wynoszącą dla stosowanych w Polsce systemów
telewizji 15625 Hz.
Inteligentny algorytm klasyfikacji nagrań archiwalnych
203
Nagrania dokonywane amatorskimi mikrofonami charakteryzują się wysokim poziomem szumów i ograniczonym pasmem przenoszenia; podobne cechy
mają nagrania wielokrotnie kopiowane.
Poza zakłóceniami, charakterystycznymi dla źródeł nagrań na taśmie, będą
w nich występować również zakłócenia charakterystyczne dla magnetycznej
metody zapisu. Amatorskie magnetofony i przeznaczone do nich taśmy ze
względu na niewielką prędkość przesuwu i szerokość ścieżki charakteryzują się
stosunkowo wysokim poziomem szumu [4]. Skończona długość szczeliny głowicy odczytującej, błędne jej ustawienie oraz niedokładności wykonania powodują ograniczenie pasma zapisywanego i odczytywanego sygnału od góry, zaś
zjawisko różniczkowania sygnału podczas odczytu i związana z tym konieczność stosowania dużych wzmocnień dla niskich częstotliwości, ogranicza to
pasmo od dołu. Obecne na powierzchni czynnej taśmy zanieczyszczenia powodują odsuniecie jej od głowic magnetofonu, co powoduje zjawisko krótkotrwałych zaników sygnału określanych jako drop-out. Zjawisko to występuje szczególnie dla górnej części pasma akustycznego.
W przypadku wielokrotnie kopiowanych taśm z każdą kolejną generacją
kopii wzrastać będzie liczba drop-outów. Jednocześnie będzie wzrastać intensywność szumu, a pasmo przenoszenia będzie coraz bardziej ograniczone na
obu krańcach widma.
3. CEL I ZAKRES PRACY
Na podstawie powyższych rozważań można wyciągnąć wniosek, że jednym
z podstawowych zadań w procesie rekonstrukcji archiwalnych nagrań dźwięku
jest określenie rodzajów zakłóceń występujących w nagraniu i dobór odpowiednich metod ich redukcji. Metody te zależą od źródła nagrania oraz rodzaju
i stopnia zużycia nośnika, na którym jest ono zapisane. Zadanie to jest na ogół
wykonywane przez operatora, posiadającego wiedzę zarówno o nośniku, na
którym zapisane jest nagranie, jak i o rodzajach występujących na nim zakłóceń
i metodach ich redukcji.
W celu automatyzacji tego procesu, a co za tym idzie, obniżenia wymagań
stawianych operatorowi, niezbędne jest opracowanie algorytmu, który mógłby
go zastąpić w procesie rozpoznania rodzaju archiwalnego nagrania i określeniu
jego podstawowych cech, a także doboru metod jego rekonstrukcji
Celem pracy było w tej sytuacji opracowanie algorytmu, który na podstawie
wyników analiz nagrania, wykonywanych za pomocą różnorodnych metod,
czasowych, częstotliwościowych i czasowo-częstotliwościowych miałby za
zadanie określenie rodzaju nagrania i występujących w nim zakłóceń. Wyniki
jego działania mogłyby stanowić wtedy podstawę automatycznego doboru metod rekonstrukcji nagrania i ich parametrów.
204
Piotr Kardasz
4. ALGORYTM KLASYFIKACJI NAGRAŃ ARCHIWALNYCH
4.1. Klasy nagrań archiwalnych i ich podstawowe cechy
Nagrania o wysokiej jakości, na płytach gramofonowych drobnorowkowych
lub taśmach magnetycznych, na ogół nie wymagają rekonstrukcji. Nagrania na
płytach o niższej jakości mogą zawierać zniekształcenia typu wow oraz pewną
liczbę zakłóceń impulsowych, które należy usunąć. Rzadko wymagana jest
w tym przypadku redukcja szumu, a jeśli już, ze względu na jego niską intensywność, może być ona dokonana przy pomocy prostych algorytmów.
Nagrania na starych, zniszczonych płytach będą wymagały przede wszystkim redukcji zakłóceń impulsowych. W następnej kolejności należy zredukować zakłócenia typu wow i szum o dużej intensywności. Ze względu na występujące w tym procesie problemy [6] niezbędne jest zastosowanie w tym celu
zaawansowanych algorytmów. Jeśli nagranie było zapisane na płycie normalnorowkowej, może być dodatkowo potrzebne zastosowanie algorytmów poprawiających brzmienie nagrania [3].
Nagrania na taśmach, niezależnie od jakości, zawierają na ogół przydźwięk
sieciowy oraz zniekształcenia typu wow. Jeśli nagranie wykonywane było
z gramofonu, należy dokonać również redukcji zakłóceń impulsowych. Nagrania audycji radiowych i telewizyjnych mogą zawierać zakłócenia quasistacjonarne [7] o częstotliwościach powyżej 10 kHz. Zakłócenia takie należy usunąć.
W przypadku nagrań niskiej jakości, do których zaliczają sie również nagrania
wielokrotnie kopiowane oraz nagrania dokonywane amatorskimi mikrofonami,
należy zastosować zawansowane metody redukcji szumu oraz algorytmy poprawiające brzmienie.
Nagrania archiwalne mogą być monofoniczne lub, rzadziej, stereofoniczne.
Liczba kanałów jest zadana z góry poprzez parametry pliku, w którym zapisany
jest zdigitalizowany sygnał. W przypadku sygnału stereofonicznego algorytm
klasyfikacji powinien dokonywać oceny jakości na podstawie cech sygnału
monofonicznego otrzymanego poprzez zsumowanie obu kanałów stereo. Powinny być one bowiem rekonstruowane z zastosowaniem tych samych metod
i ich parametrów, nawet jeśli z jakichś przyczyn ich jakość jest różna.
Na podstawie powyższych rozważań wybrane zostały klasy nagrań archiwalnych, które mają być rozpoznawane przez prezentowany algorytm. Przedstawione są one w tabeli 1.
4.2 Działanie algorytmu
Proponowany algorytm ma za zadanie, na podstawie wyników analizy archiwalnego nagrania, zakwalifikowanie go do jednej z klas, opisanych w tabeli 1.
W tym celu wymagana jest znajomość podstawowych cech nagrania, takich jak
Inteligentny algorytm klasyfikacji nagrań archiwalnych
205
odstęp sygnału od szumu, pasmo przenoszonych częstotliwości, występowanie
zakłóceń impulsowych i ich liczba, występowanie zakłóceń quasistacjonarnych
i ich parametrów.
Tabela 1. Podstawowe klasy archiwalnych nagrań rozpoznawane przez prezentowany
algorytm i wymagane dla tych klas metody redukcji zakłóceń i zniekształceń
Lp
Klasa nagrania
1
Nagranie o wysokiej
jakości
2
3
4
5
5
6
Podstawowe cechy nagrania
Wymagane metody rekonstrukcji
pasmo przenoszenia szersze
rekonstrukcja na ogół nie
niż 40..12000 Hz
jest potrzebna
odstęp od szumu > 50 dB
pasmo przenoszenia szersze
Nagranie na płycie
redukcja zakłóceń wow
niż 40..12000 Hz
gramofonowej drobodstęp od szumu < 50 dB
redukcja zakłóceń impulsonorowkowej, średwych proste algorytmy
obecność zakłóceń impulsoniej jakości
wych i ewentualnie zakłóceń
redukcji szumu
wow
obecność dużej liczby zakłózaawansowane metody
Nagranie na płycie
ceń impulsowych,
redukcji szumów i zakłóceń
drobnorowkowej,
pasmo przenoszenia węższe
impulsowych, korekcja
o niskiej jakości
niż 40..12000 Hz
zniekształceń liniowych
odstęp od szumu < 40 dB
obecność dużej liczby zakłójak wyżej, dodatkowo zaceń impulsowych,
Nagranie na płycie
odstęp od szumu < 40 dB
awansowane algorytmy
normalnorowkowej
poprawy brzmienia
brak sygnału użytecznego
powyżej 4 kHz
pasmo przenoszenia rzędu
niż 40..10000 Hz
redukcja szumu, przydźwięNagranie na taśmie
ku sieciowego, zakłóceń
odstęp od szumu i zakłóceń >
magnetofonowej
40 dB
impulsowych, wow, zniez gramofonu
kształceń liniowych
obecność przydźwięku
i zakłóceń impulsowych
jak wyżej, dodatkowo reNagranie na taśmie
obecność przydźwięku siedukcja zakłóceń quasistamagnetofonowej
ciowego i zakłóceń quasistacjonarnych
audycji radiowej lub
cjonarnych o częstotliwoo częstotliwościach
telewizyjnej
ściach > 10 kHz
>10 kHz
zaawansowane metody
pasmo przenoszenia ograniredukcji szumu
czone od góry do ok. 4 kHz
Nagranie na taśmie
zaawansowane metody
lub mniej występowanie
magnetofonowej
poprawy brzmienia
zaników sygnału i wszelkieo niskiej jakości
redukcja innych odnaleziogo rodzaju zakłóceń quasinych zakłóceń
stacjonarnych
i zniekształceń
206
Piotr Kardasz
W celu określenia odstępu sygnału do szumu algorytm poszukuje fragmentów sygnału o długości 1/2 sekundy o najwyższej i najniższej mocy średniej dla
danego fragmentu. Zakłada się, że nagranie, poddawane rekonstrukcji, zawiera
również fragmenty reprezentujące wyłącznie szum nośnika. Warunek ten jest na
ogół spełniony, ponieważ fragmenty takie występują w przerwach pomiędzy
utworami. Aby zmniejszyć wpływ ewentualnych zakłóceń quasistacjonarnych,
sygnał przed poddaniem go wspomnianej analizie jest filtrowany przez filtr
pasmowoprzepustowy o paśmie przenoszenia od 150 do 12000 Hz. Wynikiem
działania tej części algorytmu jest pojedyncza wartość, stanowiąca szacowany
odstęp sygnału od szumu w skali logarytmicznej (dB).
W celu odnalezienia zakłóceń impulsowych dokonywana jest dekompozycja
sygnału z zastosowaniem falek Haara [8]. Wystąpienie izolowanych współczynników o dużej wartości bezwzględnej dla najwyższych częstotliwości
świadczy o możliwości wystąpienia zakłócenia impulsowego (rys. 4). Wynikiem działania tej części algorytmu jest pojedyncza wartość, będąca szacowaną
liczbą zakłóceń impulsowych w jednej minucie nagrania.
Rys. 4. Rozkład nagrania na zniszczonej płycie gramofonowej na falki Haara.
Zakłócenia impulsowe widoczne w postaci jaśniejszych prążków w górnej części rysunku
Dla oceny pasma przenoszenia nagrania dokonuje się jego analizy za pomocą krótkoczasowej transformaty Fouriera o 1024 próbkach przy zastosowaniu
okna Hanna [8]. Wyniki tej transformaty są uśredniane dla całego nagrania.
Jednocześnie dokonuje się analizy nagrania w jego wcześniej odnalezionych
fragmentach zawierających wyłącznie szum. Wynikiem działania tego etapu są
dwie wartości, określające najniższą i najwyższą częstotliwość, dla której odstęp od szumów przekracza określoną wartość.
W celu wykrycia zakłóceń quasistacjonarnych dokonuje się analizy sygnału
za pomocą transformaty Fouriera o 222 próbkach i sprawdza występowanie
maksimów amplitudy w okolicach częstotliwości 50 Hz i 100 Hz, a także 15625
i 19000 Hz. Procedura zwraca trzy wartości logiczne (prawda/fałsz) odpowiadające wykryciu odpowiednio przydźwięku sieciowego, częstotliwości odchylania
poziomego i częstotliwości pilota stereo.
Wyniki pracy procedur analizy podawane są na wejście algorytmu wnioskującego, który na ich podstawie przyporządkowuje analizowane nagranie do
Inteligentny algorytm klasyfikacji nagrań archiwalnych
207
jednej z grup wymienionych w tabeli 1. Algorytm ten, złożony z sześciu bloków wnioskowania, po jednym dla każdej z klas, generuje sześć wartości wyjściowych. Uważa się, że nagranie należy do klasy, której blok wnioskowania
zwrócił najwyższą wartość.
Bloki wnioskowania zostały zaprojektowane na podstawie tabeli 1. Algorytm, zaimplementowany w systemie uruchomieniowym Lazarus, został poddany następnie dostrojeniu przy użyciu fragmentów archiwalnych nagrań o różnej
jakości, zapisanych na różnorodnych nośnikach. Dostrojenie to zostało przeprowadzone ręcznie, poprzez poddanie tych nagrań działaniu algorytmu,
a następnie dostrajaniu jego parametrów do chwili uzyskania poprawnego działania dla zestawu sygnałów testowych.
5. WNIOSKI KOŃCOWE I KIERUNKI DALSZYCH BADAŃ
Przedstawiony algorytm został opracowany jako część systemu rekonstrukcji
nagrań dźwięku. Celem tego systemu ma być uproszczenie i automatyzacja tego
procesu. W tej sytuacji przedstawiony algorytm powinien zostać tak rozbudowany, aby uzyskane w wyniku jego działania dane mogły posłużyć nie tylko w
celu doboru algorytmów rekonstrukcji, ale także ich parametrów. Wymaga to
rozbudowy algrytmu wnioskowania i dostrojenia go przy użyciu większego
zestawu archiwalnych nagrań. Zestaw taki został przygotowany w trakcie badań
i zawiera dużą liczbę zdigitalizowanych nagrań o różnej jakości pochodzących z
różnych nośników. Zasoby te powinny pozwolić na precyzyjne dostrojenie zarówno opisanego algorytmu klasyfikacji, jak i pozostałych algorytmów [3, 6, 7,
9, 10] zaprojektowanych dla tego systemu.
Artykuł opracowano w ramach pracy MB/WE/4/2015.
LITERATURA
[1] Praca zbiorowa - Zapisywanie i odtwarzanie dźwięku. Wydawnictwa NaukowoTechniczne, Warszawa, 1991.
[2] Czyżewski A., Maziewski P., Some Techniques for Wow Effect Reduction.
IEEE International Conference on Image Processing ICIP 2007, San Antonio.
[3] Kardasz P., Algorytm poprawy jakości brzmienia archiwalnych nagrań dźwięku
na nośnikach magnetycznych, Poznan University of Technology Academic Journals. Electrical Engineering, Nr 84 (2015), s. 231-236.
[4] Iwanicka B., Koprowski E., Kasety magnetofonowe i magnetowidowe. Wydawnictwa Komunikacji i Łączności, Warszawa, 1988.
[5] Chaciński H., Odbiorniki radiowe, Wydawnictwa Szkolne i Pedagogiczne, Warszawa, 1980.
208
Piotr Kardasz
[6] Kardasz P., Algorytm redukcji szumów w nagraniach dźwiękowych
z wykorzystaniem podziału sygnału na składowe harmoniczne i stochastyczne,
Pomiary, Automatyka, Robotyka, R. 19, nr 1 (2015), s. 71-76.
[7] Kardasz P., Algorytm detekcji zakłóceń impulsowych w archiwalnych nagraniach dźwięku na płytach analogowych, Poznan University of Technology Academic Journals. Electrical Engineering, Nr 84 (2015), s. 225-230.
[8] Zieliński T. P., Cyfrowe przetwarzanie sygnałów, Wydawnictwa Komunikacji
i Łączności, Warszawa 2005.
[9] Kardasz P., Algorytm redukcji zakłóceń quasistacjonarnych w zabytkowych nagraniach dźwięku, Poznan University of Technology Academic Journals. Electrical Engineering, Nr 80 (2014), s. 101-108.
[10] Kardasz P., Wykorzystanie zakłóceń quasistacjonarnych w celu redukcji nierównomierności przesuwu taśmy w nagraniach dźwięku na nośnikach magnetycznych. Poznan University of Technology Academic Journals. Electrical Engineering, Nr 80 (2014), s. 109-114.
THE INTELLIGENT ALGORITGM
FOR ARCHIVAL RECORDING CLASSIFICATION
The reconstruction process of archival audio recordings consists of several procedures that require precise parameters settings. The selection of these procedures and settings is generally done by an expert who knows the basic characteristics of the recording,
such as the media type and degree of wear. The expert can then choose reconstruction
procedures and their parameters according to his knowledge and experience. To make
this process automatic, an algorithm is necessary, which is able to provide information
needed for reconstruction algorithms selection and parameters setting. Such algorithm
should analyze the recording using time, frequency and time-frequency analysis methods and then determine the type of media and its wearing level. The paper presents the
intelligent classification algorithm which has been developed and tested using fragments
of archival recordings stored on magnetic and mechanic media of different quality and
degree of wear. The test results and directions for further research are presented.
(Received: 31. 01. 2016, revised: 4. 03. 2016)