Streszczenie rozprawy w języku polskim: Praca doktorska opisuje

Transkrypt

Streszczenie rozprawy w języku polskim: Praca doktorska opisuje
Streszczenie rozprawy w języku polskim:
Praca doktorska opisuje nowe metody usuwania zakłóceń impulsowych z
archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione
w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie
autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno
sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po
obróbce. Testy odsłuchowe przeprowadzone w grupie 20 słuchaczy potwierdziły, że
opracowany algorytm poprawia subiektywnie odczuwalną jakość przetworzonego sygnału.
Otrzymywana jakość zrekonstruowanych nagrań fonicznych jest porównywalna, a w
niektórych przypadkach nawet znacząco lepsza od tej uzyskiwanej przez komercyjny
system CEDAR, uznawany powszechnie za najlepszy produkt komercyjny służący do
rekonstrukcji archiwalnych nagrań dźwiękowych. Opracowana metoda pozwala na
całkowite lub prawie całkowite wyeliminowanie zakłóceń impulsowych w sposób nie
powodujący nowych, niepożądanych efektów dźwiękowych.
Przedstawiona w pracy metoda wraz z wynikami eksperymentów potwierdzają
jednoznacznie tezę rozprawy dowodząc, że możliwe jest skuteczne usuwanie zakłóceń
impulsowych, a w rezultacie uzyskiwanie wysokiej jakości zrekonstruowanego sygnału
fonicznego.
W rozprawie zaprezentowano również podejście oparte na wykorzystaniu wiedzy a
priori o typowych kształtach i rozmiarach zakłóceń impulsowych do dokładniejszego
wykrywania położenia zakłóceń w sygnale. Otrzymane wyniki testów symulacyjnych oraz
testów odsłuchowych potwierdzają, że podejście to jest użyteczne w przypadku analizy
sygnałów dźwiękowych „w czasie rzeczywistym”.
Streszczenie rozprawy w języku angielskim:
The aim of this PhD thesis was to solve a problem of elimination of impulsive disturbances
from real archive gramophone recordings. Three new solutions were proposed. The first one
is based on bidirectional signal processing – noise pulses are localized by combining the
results of forward-time and backward-time signal analysis. The second one is based on
sparse autoregressive (AR) modeling – detector based on sparse AR model is able to
distinguish noise pulses from a periodic impulsive excitation appearing in speech and some
music signals. The third solution assumes using vector autoregressive modeling technique
which is recommended in this PhD thesis for stereo audio signals processing. If all three
techniques are combined in one algorithm, one obtains very good results both for speech
and music signals.
Listening tests in a group of 20 test persons confirmed very good declicking properties of
the developed method. The method yields results comparable with those produced by the
state-of-the-art commercial declicking software, CEDAR.
The obtained results allowed for proposing the following dissertation thesis: Usage of the
approach based on sparse autoregressive signal modeling combined with bidirectional
signal processing allows for efficient elimination of impulsive disturbances.
In this PhD thesis, a new approach to localization of impulsive noises in audio signals based
on template matching technique, was also proposed. The new approach stems from the
observation that a large proportion of noise pulses corrupting audio recordings have highly
repetitive shapes that match several typical “patterns”. The proposed approach is useful in
on-line processing.

Podobne dokumenty