dwuetapowa metoda detekcji zakłóceń impulsowych w sygnałach
Transkrypt
dwuetapowa metoda detekcji zakłóceń impulsowych w sygnałach
Krzysztof Cisowski Politechnika Gdańska, Wydział ETiI Katedra Systemów Automatyki, ul. G. Narutowicza 11/12, 80-952 Gdańsk, e-mail: [email protected] 2006 Poznańskie Warsztaty Telekomunikacyjne Poznań 7 - 8 grudnia 2006 DWUETAPOWA METODA DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH Streszczenie: Artykuł poświęcony jest problemom detekcji zakłóceń impulsowych w sygnałach fonicznych. Zaproponowano dwuetapową metodę detekcji zakłóceń opartą o analizę funkcji gęstości rozkładu prawdopodobieństwa poziomu zakłóceń impulsowych występujących w danym sygnale. Określono sposób ustalenia poziomu wyzwalania detektora progowego. 1. WSTĘP Jednym z najczęściej stosowanych sposobów detekcji zakłóceń impulsowych występujących w sygnałach fonicznych jest metoda progowa polegająca na porównywaniu chwilowych wartości poziomu sygnału z pewną z góry przyjętą wartością odniesienia. W danej chwili czasu sygnał uznawany jest za zakłócenie, gdy wartość jego amplitudy jest większa od progu detekcji. Dla usprawnienia procesu wykrywania zakłóceń (ich uwydatnienia w badanym sygnale) dokonuje się często wstępnego przetwarzania sygnału fonicznego. Stosowane metody to między innymi: filtracja górno-pasmowa i parametryzacja sygnału. W parametrycznych detektorach progowych zakłada się, że sygnał foniczny {y(t)} jest lokalnie stacjonarnym procesem autoregresyjnym (AR) rzędu p. W kolejnych przedziałach stacjonarności {y(t)} poddawany jest wstępnej filtracji za pomocą filtru analizującego (wybielającego) o współczynnikach równych parametrom modelu AR. Otrzymany sygnał błędów resztowych {e(t)} ma w porównaniu z {y(t)} znacznie mniejszą wariancję (σe2 σy2 ), a w związku z tym zmniejszoną wartość stosunku sygnał/szum (filtracja tylko nieznacznie wpływa na zmianę wariancji szumu). Dzięki temu nieciągłości wprowadzane do sygnału przez zakłócenia impulsowe są bardziej wyeksponowane – łatwiejsze do wykrycia. Próg detekcji jest najczęściej ustalany w sposób dynamiczny w oparciu o lokalne własności statystyczne sygnału {e(t)}. Sygnał błędów resztowych uzyskany w procesie wybielania {y(t)} ma charakter szumu białego o nieznanym rozkładzie prawdopodobieństwa. Często dla uproszczenia przyjmuje się, że sygnał {y(t)} (a w konsekwencji {e(t)}) ma rozkład gaussowski – w pełni określony przez dwa parametry: wartość oczekiwaną my oraz wariancję σy2 (w przypadku sygnału {e(t)} są to odpowiednio: me oraz σe2 ). W przypadku, gdy {y(t)} zawiera zakłócenia impulsowe, założenie o jego gaussowskim charakterze jest dużym uproszczeniem. Impulsy o znacząco dużych poziomach pojawiają się częściej niż wynikałoby to z własności funkcji gęstości rozkładu normalnego, która bardzo szybko maleje do zera, gdy wartości modułu sygnału są p większe 3 σe i dążą do ∞ (σe = σe2 jest średnim odchyleniem standardowym błędów resztowych). W wielu pracach dotyczących analizy sygnałów zakłóconych impulsowo do modelowania rozkładów prawdopodobieństw sygnałów stosuje się rozkład gaussowski mieszany (Mixture Gaussian Process), rozkład α−stabilny (szczególnym przypadkiem rozkładu α−stabilnego jest rozkład gaussowski, dla którego α = 2), uogólniony proces gaussowski lub rozkład t-Studenta [4], [3]. Ważną cechą pierwszych dwóch klas rozkładów oraz rozkładu gaussowskiego jest samopodobieństwo (suma zmiennych losowych o jednakowym rozkładzie prawdopodobieństwa zachowuje ten sam rozkład wymagane jest jedynie odpowiednie przeskalowanie funkcji gęstości). Dzięki samopodobieństwu sygnały poddawane filtracji liniowej - operacja splotu - zachowują swój rozkład prawdopodobieństwa. Znając rozkładu prawdopodobieństwa {e(t)} poziomy wyzwalania w detektora można ustalić w oparciu o klasyczne kryterium Neymana-Pearsona [2]. Dolne i górne wartości progowe odpowiadają wówczas wartościom krytycznym Ld oraz Lg testu statystycznego, w którym dla danego poziomu istotności β weryfikowane są dwie hipotezy dotyczące: 1) braku przynależności lub 2) przynależności poszczególnych próbek {e(t)} do zbioru próbek nadmiarowych (próbki o bardzo dużych amplitudach występują w „czystym“ sygnale {e(t)} bardzo rzadko - częstotliwość ich występowania określamy arbitralnie dobierając prawdopodobieństwo β). Hipoteza zerowa Ho mówi, że w chwili ti dana próbka sygnału e(ti ) nie jest nadmiarowa (Ld ¬ e(ti ) ¬ Lg z prawdopodobieństwem równym 1 − β), a hipoteza alternatywna H1 zakłada, że próbka e(ti ) jest nadmiarowa – zawiera zakłócenie impulsowe (e(ti ) > Lg lub e(ti ) < Ld z prawdopodobieństwem równym β). W trakcie weryfikacji hipotez można popełnić dwa błędy: błąd I rodzaju – gdy niezakłócona impulsowo próbka sygnału zostanie uznana za zakłóconą (próbka „dobra“ będzie miała poziom należący do obszaru krytycznego testu statystycznego) lub błędy II rodzaju – gdy próbka zakłócona impulsowo zostanie uznana za „dobrą“ – będzie należała do obszaru dopuszczalności H0 . Przyjmując założenie o gaussowskim charakterze sygnału {e(t)} poziomy wyzwalania w detektora można ustalić w oparciu o popularne kryterium 3 σ. Wynika z niego, iż za próbki nadmiarowe uznawane są te dane, których amplituda przekracza trzykrotną wartość średniego odchylenia standardowego: Lg = 3 σe , Ld = −3 σe . Dla tak przyjętych progów poziom istotności jest równy β = 0,0027. Prawdopodobieństwo popełnienia błędów pierwszego rodzaju jest wówczas małe (równe β). Stosując powyższe kryterium detekcji wykryjemy większość zakłóceń (popełnimy również pewną, nieznaną liczbę błędów drugiego rodzaju) ale również część próbek "dobrych" zakwalifikujemy jako zakłócenie. W proponowanym algorytmie powyższy etap, jest pierwszą fazą detekcji, służącą do wstępnej selekcji danych. Druga faza, której celem jest zmniejszenie sumarycznej liczby błędów pierwszego rodzaju polega na dalszej analizie wstępnie wyselekcjonowanych danych w oparciu o ich zmienione własności statystyczne. Nowe poziomy wyzwalania obliczone są na podstawie nowej funkcji gęstości rozkładu prawdopodobieństwa wyznaczonej z rozkładu prawdopodobieństwa sygnału {e(t)}. Dwuetapowy algorytm detekcji można również zastosować przy braku założeń co do gaussowskiego charakteru {e(t)}. Progi detekcji każdego z etapów są wówczas obliczane w oparciu o daną funkcję gęstości rozkładu {e(t)}. W pierwszym etapie można przyjąć poziom istotności równy β = 0,0027 czyli wartości odpowiadającej zastosowaniu dla rozkładu gaussowskiego reguły 3 σ. W etapie drugim funkcję gęstości rozkładu prawdopodobieństwa należy obliczyć w oparciu o postać analityczną gęstości rozkładu {e(t)}. W przypadku, gdy znany jest tylko histogram {e(t)} poziomy wyzwalania detektorów w fazach I i II można wyznaczyć się w sposób opisany w [1]. 2. MODEL SYGNAŁU FONICZNEGO W pracy przyjęto, że zakłócony impulsowo sygnał foniczny {y(t)} opisany jest w przedziale stacjonarności zależnościami: p X y(t) = s(t) + z(t), s(t) = aj s(t − j) + n(t), (1) j=1 gdzie aj , j = 1, . . . , p, oznaczają wartości współczynników AR, {s(t)} jest niezakłóconym sygnałem fonicznym, {n(t)} to szum wejściowy o nieznanym rozkładzie prawdopodobieństwa (posiadający wartość oczekiwaną mn = 0 i wariancję σn2 < ∞) formujący sygnał {s(t)}, a {z(t)} jest sygnałem zakłóceń impulsowych. Przyjmując, że sygnał foniczny {s(t)} jest samopodobnym procesem losowym rozkłady prawdopodobieństw {s(t)} oraz {n(t)} są takie same (różnią się jedynie skalą). Sygnał {y(t)} z racji zawierania sygnału {z(t)} ma rozkład prawdopodobieństwa nieco inny niż {s(t)} (przy małej w stosunku do sygnału użytecznego intensywności zakłóceń obydwa rozkłady są podobne). Poddając sygnał {y(t)} filtracji odwrotnej za pomocą filtru analizującego o skończonej odpowiedzi impulsowej (FIR), którego współczynnikami są oszacowania parametrów b aj , j = 1, . . . , p, otrzymuje się sygnał błędów resztowych {e(t)} o wartości oczekiwanej me ' 0 i wariancji σe2 < ∞ wyrażony równaniem: e(t) = y(t) − p X b aj y(t − j) (2) j=1 = s(t)+z(t) − p X b aj (s(t−j)+ z(t−j)). j=1 Wprowadźmy oznaczenia n e(t) = n(t) + ∆n (t) = s(t) − ze(t) = z(t) + ∆z (t) = z(t) − p X j=1 p X b aj s(t − j), (3) b aj z(t − j), (4) j=1 gdzie {e n(t)} oznacza szum wejściowy powiększony o część {∆n (t)} powstałą na skutek błędów oszacowań parametrów modelu aj , j = 1, . . . , p, a {e z (t)} jest sygnałem zakłóceń impulsowych {z(t)} powiększonym o składową {∆z (t)} (składnik {∆z (t)} zawiera sumy ważone opóźnionych w czasie p wartości {z(t)}, oznacza to, że w {e z (t)} „rozmyte“ impulsy zanikają dłużej niż w sygnale {z(t)}). Wykorzystując wprowadzone oznaczenia równanie (2) można zapisać w postaci: e(t) = n e(t) + ze(t) = n(t) + [∆n (t) + ze(t)]. (5) Gdy szum impulsowy nie jest zbyt intensywny oraz stosowane są efektywne algorytmy estymacji parametrów {aj }, rozkład prawdopodobieństwa {e(t)} jest najczęściej podobny do rozkładu prawdopdobieństwa {n(t)}. Różnica wyraża się w grubościach ogonów obydwu funkcji - wykres gęstości rozkładu {e(t)} w porównaniu z {n(t)} nieznacznie wolniej opada ze wzrostem wartości poziomu sygnału (prawdopodobieństwo próbek o dużych poziomach jest większe). 3. DETEKTOR ZAKŁÓCEŃ IMPULSOWYCH Proponowana metoda detekcji zakłóceń impulsowych jest procesem dwuetapowym. W pierwszej fazie sygnał błędów resztowych {e(t)} podawany jest procesowi wstępnej selekcji przy wykorzystaniu zależności: e(t) − L β d dla e(t) < L β d 2 2 0 dla L β d ¬ e(t) ¬ L β g e0 (t) = 2 2 e(t) − L β dla e(t) > L β g , 2g 2 (6) gdzie L β d L β g to odpowiednio dolny i górny próg 2 2 wyzwalania detektora wyznaczony dla przyjętego poziomu istotności β w oparciu o rozkład prawdopodobieństwa {e(t)}. W pracy przyjęto, że poziom ten jest równy β = 0,0027, co przy założeniu gaussowskiego charakteru {e(t)} odpowiada zastosowaniu reguły 3 σ. Progi wyznacza się rozwiązując równania: Z Lβ Z ∞ d β β 2 p (e(t)) de , (7) = = p (e(t)) de , 2 2 Lβ −∞ 2 które można zapisać w postaci F (L β d ) = β/2, 2 2 2 p (A|B) = p (A ∩ B)/p (B) = p (A)/p (B) . (9) Przyjmując następujące oznaczenia: B = {(e(t) < L β d ) ∨ (e(t) > L β g )} – zbiór wszystkich wartości sy2 2 gnału wykrywanych przez detektor w pierwszej fazie detekcji, {eB (t)} ⊂ B – zbiór próbek sygnału {e(t)} spełniających kryterium detekcji, funkcję gęstości rozkładu prawdopodobieństwa p (e0 (t)) sygnału można wyznaczyć korzystając z zależności: p (eB (t)) . p (B) (10) Na rys. 1 zamieszczono wykresy przedstawiające metodę konstrukcji funkcji gęstości rozkładu prawdopodobieństwa sygnału {e0 (t)}. Czynnik p (B) równy p (e0 (t)) = p (e(t) | B) = p (eB (t) | B) = Z p (e(t))de = B B p (eB (t))de = β (11) sprawia, iż zachowany jest podstawowy warunek normalizacji funkcji rozkładu prawdopodobieństwa p (e0 (t)): Z p (e0 (t))de0 = 1 . (12) B W drugim etapie detekcji, którego celem jest zmniejszenie ogólnej liczby błędów pierwszego rodzaju wyznacza się w oparciu o rozkład p (e0 (t)) nową parę progów wyzwalania detektora L γ2 d i L γ2 g . W tym celu należy rozwiązać się następujące równania: γ = 2 Z Lγd 2 −∞ p (e0 (t)) de0 , 0.2 0 −4 β/2 −3 2 gdzie F −1 (·) oraz Φ−1 (·) oznaczają funkcje odwrotne odpowiednio F (·) (w przedziale, w którym: e(t) ¬ L β d ) oraz Φ(·) (w przedziale, gdzie: e(t) > L β g ). 2 2 Funkcje rozkładu prawdopodobieństwa p(e0 (t)) sygnału {e0 (t)} wyznacza się korzystając z dobrze znanej własności prawdopodobieństwa warunkowego, które mówi, że jeśli pomiędzy dwoma zdarzeniami elementarnymi A i B zachodzi zależność A ⊂ B to prawdopodobieństwo warunkowe zdarzenia A pod warunkiem B jest równe: Z 0.3 0.1 gdzie F (·) oznacza dystrybuantę rozkładu prawdopodobieństwa {e(t)} a Φ(·) uzupełnienie dystrybuanty F (·). Korzystając z powyższych oznaczeń progi detekcji {e(t)} można wyznaczyć korzystając z zależności: L β d = F −1 (β/2) dla e(t) ¬ L β d , 2 2 (8) L β g = Φ−1 (β/2) dla e(t) > L β g , p (B) = 0.4 g Φ(L β g ) = 1 − F (L β g ) = β/2 , 2 a) P(e(t)) 0.5 γ = 2 Z ∞ Lγg 2 p (e0 (t)) de0 , (13) b) P(e‘(t)) β/2 −2 −1 A 0 1 2 A A ¢ A AU −3 4 e(t) −2 3 4 e‘(t) ¢ ¢ A 0.5 0 −4 3 ¢ A 1 ¢ ¢® −1 0 1 ¢ 2 Rys. 1: Metoda konstrukcji funkcji gęstości rozkładu prawdopodobieństwa sygnału {e0 (t)}, a) przykładowy rozkład prawdopodobieństwa sygnału {e(t)} ∼ N (0, 1), b) funkcja rozkładu {e0 (t)} otrzymana po odpowiednim przeskalowaniu fragmentów rozkładu {e(t)} odpowiadających obszarom krytycznym testu statystycznego I fazy detekcji (poziom istotności β = 0,05). gdzie γ jest arbitralnie przyjętym poziomem istotności (np. γ = 0,05). Powyższe zależności można zapisać w postaci F 0 (L γ2 d ) = γ/2 , Φ0 (L γ2 g ) = 1 − F 0 (L γ2 g ) = γ/2 , przy czym F 0 (·) oznacza dystrybuantę rozkładu prawdopodobieństwa {e0 (t)} a Φ0 (·) jest uzupełnieniem F 0 (·). Podobnie jak w pierwszym etapie detekcji progi wyzwalania detektora dla ujemnych i dodatnich wartości sygnału {e0 (t)} można wyznaczyć korzystając z zależności: L γ2 d = F 0−1 (γ/2) dla e0 (t) ¬ L γ2 d , (14) L γ2 g = Φ0−1 (γ/2) dla e0 (t) > L γ2 g , gdzie F 0−1 (·) oraz Φ0−1 (·) to funkcje odwrotne odpowiednio F 0 (·) (w przedziale, w którym: e0 (t) ¬ L γ2 d ) oraz Φ0 (·) (w przedziale, gdzie: e0 (t) > L γ2 g ). Ostatecznie, korzystając z zależności: 0 e (t) − L γ2 d 0 e00 (t) = 0 e (t) − L γ2 g dla e0 (t) < L γ2 d dla L γ2 d ¬ e0 (t) ¬ L γ2 g dla e0 (t) > L γ2 g (15) otrzymuje się sygnał {e00 (t)}. Sygnał ten podawany jest na wejście dyskryminatora, opisanego zależnością: 0 gdy e00 (t) = 0 d(t) = (16) 1 gdy e00 (t) 6= 0 , na którego wyjściu pojawia się sygnał zerojedynkowy będący jednocześnie sygnałem wyjściowym całego detektora. Jedynki oznaczają wykryte zakłócenia. Progi detekcji L γ2 d oraz L γ2 g można wyznaczyć zarówno w oparciu o rozkład prawdopodobieństwa p (e0 (t)) (rozwiązując równania (13)) jak również p (e(t)), gdyż pierwszy z wymienionych rozkładów powstał przez przeskalowanie (normalizacje) fragmentów rozkładu drugiego. Nowa formuła wyznaczania progów wyzwalania pomijająca konieczność wyznaczania rozkładu prawdopodobieństwa p (e0 (t)) ma postać: βγ = 2 Z Lγd 2 p (e(t)) de , −∞ βγ = 2 Z ∞ p (e(t)) de . (17) Lγg 2 Przyjmując, że {e(t)} ma rozkład normalny N (0, σe ) poziomy odniesienia można wyznaczyć korzystając z tablic standaryzowanego rozkładu normalnego poprzez odczytanie wartości se , dla której dystrybuanta jest równa βγ 2 . Progi detekcji są wówczas równe odpowiednio: L γ2 d = −σe | se |, L γ2 g = σe | se | . (18) Tabela 1 zawiera wartości parametru se dla wybranych wartości γ przy ustalonym β = 0,0027. γ 1 0,5 0,1 0,05 0,01 0,005 0,0027 0,00135 0,001 se -3,0 -3,2051 -3,6425 -3,8172 -4,1974 -4,3518 -4,4850 -4,6307 -4,6924 Tabela 1: Parametr se dla wybranych wartości γ (β = 0,0027), szczegóły w tekście. Z dotychczasowych doświadczeń praktycznych autora wynika, że w detektorach parametrycznych działających w oparciu o zależności (18), (15) oraz (16) (zamiast σe stosowana jest chwilowa ocena średniego odchylenia standardowego σ b(t)) wartość | se | dobierana jest eksperymentalnie w zakresie 3,5 <| se |< 4,5. Oznacza to, że przyjmując założenie o gaussowskim charakterze {e(t)} w drugim etapie detekcji należy przyjmować poziom istotności γ należący do przedziału od około 0,1 do 0,0027. W przypadku innych założeń co do rozkładu prawdopodobieństwa {e(t)} i/lub znajomości oszacowania funkcji gęstości rozkładu prawdopodobieństwa (np. w postaci histogramu) progi detekcji wyznaczamy rozwiązując równania (17). Wartości poziomu istotności γ należy dobrać eksperymentalnie (przyjmując, że β = 0,0027). 4. WNIOSKI KOŃCOWE W pracy omówiono nową dwuetapową metodę wykrywania zakłóceń impulsowych występujących w sygnałach fonicznych. Algorytm jest odmianą parametrycznego detektora zakłóceń, wykorzystującego model autoregresyjny sygnału. Oparty jest o analizę rozkładów prawdopodobieństw błędów resztowych otrzymywanych na wyjściu filtru analizującego o współczynnikach równych parametrom modelu AR. W algorytmie tym wyznaczanie wartości progowych detektora przebiega w dwóch fazach. W pierwszej, w której dokonywana jest wstępna selekcja danych, progi wyzwalania detektora wyznaczane są w oparciu o znany rozkład prawdopodobieństwa sygnału {e(t)} jako wartości krytyczne testu statystycznego dla poziomu istotności β = 0,0027 (dla rozkładu gaussowskiego przyjęty poziom istotności odpowiada zastosowaniu reguły 3 σ). Druga faza detekcji służy do zmniejszenia liczby fałszywych alarmów (błędów I rodzaju testu statystycznego) pojawiających się licznie w fazie pierwszej. Progi detekcji drugiego etapu są obliczane dla nowej wartości poziomu istotności γ w oparciu o rozkład prawdopodobieństwa próbek {e(t)} wykrytych jako zakłócenia przez detektor pierwszego etapu. Rozkład ten wyznaczany jest w oparciu o pierwotny rozkład prawdopodobieństwa {e(t)}. W pracy zaproponowano także sposób połączenia obydwu etapów detekcji w jeden algorytm, oraz wskazano zakres zmienności parametru γ odpowiadający empirycznie wyznaczonemu przez autora przedziałowi typowych wartości poziomów wyzwalania detektorów parametrycznych. SPIS LITERATURY [1] K. Cisowski, Detekcja zakłóceń impulsowych w sygnałach fonicznych z wykorzystaniem wygładzonych lokalnych histogramów sygnału Proc. X Poznańskie Warsztaty Telekomunikacyjne PWT2005, Poznań, 8–9 grudnia 2005, str. 109– 114. [2] Kay S. M.: Fundamentals of Statistical Signal Processing, Volume II Detection Theory. Prentice Hall PTR, Prentice-Hall, Inc. Upper Saddle River. New Jersey 07458, 1998. [3] Kuruoglu E. E.: Signal Processing in α−stable noise environments: a least lp −norm approach, PHD Thesis, Signal Processing and Communications Laboratory, Department of Engineering University of Cambridge, 1998. [4] Moerland P.: A comparison of mixture models for density estimation, ICANN99. Ninth International Conference on Artificial Neural Networks (IEE Conf. Publ. No.470), Vol. 1, pp 2530, Edinburgh, UK, 09.1999.