Streszczenie rozprawy w języku polskim: Praca doktorska opisuje
Transkrypt
Streszczenie rozprawy w języku polskim: Praca doktorska opisuje
Streszczenie rozprawy w języku polskim: Praca doktorska opisuje nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone w grupie 20 słuchaczy potwierdziły, że opracowany algorytm poprawia subiektywnie odczuwalną jakość przetworzonego sygnału. Otrzymywana jakość zrekonstruowanych nagrań fonicznych jest porównywalna, a w niektórych przypadkach nawet znacząco lepsza od tej uzyskiwanej przez komercyjny system CEDAR, uznawany powszechnie za najlepszy produkt komercyjny służący do rekonstrukcji archiwalnych nagrań dźwiękowych. Opracowana metoda pozwala na całkowite lub prawie całkowite wyeliminowanie zakłóceń impulsowych w sposób nie powodujący nowych, niepożądanych efektów dźwiękowych. Przedstawiona w pracy metoda wraz z wynikami eksperymentów potwierdzają jednoznacznie tezę rozprawy dowodząc, że możliwe jest skuteczne usuwanie zakłóceń impulsowych, a w rezultacie uzyskiwanie wysokiej jakości zrekonstruowanego sygnału fonicznego. W rozprawie zaprezentowano również podejście oparte na wykorzystaniu wiedzy a priori o typowych kształtach i rozmiarach zakłóceń impulsowych do dokładniejszego wykrywania położenia zakłóceń w sygnale. Otrzymane wyniki testów symulacyjnych oraz testów odsłuchowych potwierdzają, że podejście to jest użyteczne w przypadku analizy sygnałów dźwiękowych „w czasie rzeczywistym”. Streszczenie rozprawy w języku angielskim: The aim of this PhD thesis was to solve a problem of elimination of impulsive disturbances from real archive gramophone recordings. Three new solutions were proposed. The first one is based on bidirectional signal processing – noise pulses are localized by combining the results of forward-time and backward-time signal analysis. The second one is based on sparse autoregressive (AR) modeling – detector based on sparse AR model is able to distinguish noise pulses from a periodic impulsive excitation appearing in speech and some music signals. The third solution assumes using vector autoregressive modeling technique which is recommended in this PhD thesis for stereo audio signals processing. If all three techniques are combined in one algorithm, one obtains very good results both for speech and music signals. Listening tests in a group of 20 test persons confirmed very good declicking properties of the developed method. The method yields results comparable with those produced by the state-of-the-art commercial declicking software, CEDAR. The obtained results allowed for proposing the following dissertation thesis: Usage of the approach based on sparse autoregressive signal modeling combined with bidirectional signal processing allows for efficient elimination of impulsive disturbances. In this PhD thesis, a new approach to localization of impulsive noises in audio signals based on template matching technique, was also proposed. The new approach stems from the observation that a large proportion of noise pulses corrupting audio recordings have highly repetitive shapes that match several typical “patterns”. The proposed approach is useful in on-line processing.