dwuetapowa metoda detekcji zakłóceń impulsowych w sygnałach

Transkrypt

dwuetapowa metoda detekcji zakłóceń impulsowych w sygnałach
Krzysztof Cisowski
Politechnika Gdańska, Wydział ETiI
Katedra Systemów Automatyki,
ul. G. Narutowicza 11/12, 80-952 Gdańsk,
e-mail: [email protected]
2006
Poznańskie Warsztaty Telekomunikacyjne
Poznań 7 - 8 grudnia 2006
DWUETAPOWA METODA DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W
SYGNAŁACH FONICZNYCH
Streszczenie: Artykuł poświęcony jest problemom
detekcji zakłóceń impulsowych w sygnałach fonicznych. Zaproponowano dwuetapową metodę
detekcji zakłóceń opartą o analizę funkcji gęstości rozkładu prawdopodobieństwa poziomu zakłóceń impulsowych występujących w danym sygnale.
Określono sposób ustalenia poziomu wyzwalania
detektora progowego.
1. WSTĘP
Jednym z najczęściej stosowanych sposobów detekcji zakłóceń impulsowych występujących w sygnałach fonicznych jest metoda progowa polegająca na
porównywaniu chwilowych wartości poziomu sygnału z pewną z góry przyjętą wartością odniesienia. W
danej chwili czasu sygnał uznawany jest za zakłócenie, gdy wartość jego amplitudy jest większa od
progu detekcji. Dla usprawnienia procesu wykrywania zakłóceń (ich uwydatnienia w badanym sygnale)
dokonuje się często wstępnego przetwarzania sygnału
fonicznego. Stosowane metody to między innymi: filtracja górno-pasmowa i parametryzacja sygnału. W
parametrycznych detektorach progowych zakłada się,
że sygnał foniczny {y(t)} jest lokalnie stacjonarnym
procesem autoregresyjnym (AR) rzędu p. W kolejnych przedziałach stacjonarności {y(t)} poddawany
jest wstępnej filtracji za pomocą filtru analizującego (wybielającego) o współczynnikach równych parametrom modelu AR. Otrzymany sygnał błędów resztowych {e(t)} ma w porównaniu z {y(t)} znacznie
mniejszą wariancję (σe2 σy2 ), a w związku z tym
zmniejszoną wartość stosunku sygnał/szum (filtracja
tylko nieznacznie wpływa na zmianę wariancji szumu). Dzięki temu nieciągłości wprowadzane do sygnału przez zakłócenia impulsowe są bardziej wyeksponowane – łatwiejsze do wykrycia. Próg detekcji jest
najczęściej ustalany w sposób dynamiczny w oparciu
o lokalne własności statystyczne sygnału {e(t)}.
Sygnał błędów resztowych uzyskany w procesie
wybielania {y(t)} ma charakter szumu białego o nieznanym rozkładzie prawdopodobieństwa. Często dla
uproszczenia przyjmuje się, że sygnał {y(t)} (a w konsekwencji {e(t)}) ma rozkład gaussowski – w pełni
określony przez dwa parametry: wartość oczekiwaną
my oraz wariancję σy2 (w przypadku sygnału {e(t)}
są to odpowiednio: me oraz σe2 ). W przypadku, gdy
{y(t)} zawiera zakłócenia impulsowe, założenie o jego gaussowskim charakterze jest dużym uproszczeniem. Impulsy o znacząco dużych poziomach pojawiają się częściej niż wynikałoby to z własności funkcji gęstości rozkładu normalnego, która bardzo szybko maleje do zera, gdy wartości modułu
sygnału są
p
większe 3 σe i dążą do ∞ (σe = σe2 jest średnim
odchyleniem standardowym błędów resztowych). W
wielu pracach dotyczących analizy sygnałów zakłóconych impulsowo do modelowania rozkładów prawdopodobieństw sygnałów stosuje się rozkład gaussowski mieszany (Mixture Gaussian Process), rozkład α−stabilny (szczególnym przypadkiem rozkładu α−stabilnego jest rozkład gaussowski, dla którego α = 2), uogólniony proces gaussowski lub rozkład
t-Studenta [4], [3].
Ważną cechą pierwszych dwóch klas rozkładów
oraz rozkładu gaussowskiego jest samopodobieństwo
(suma zmiennych losowych o jednakowym rozkładzie
prawdopodobieństwa zachowuje ten sam rozkład wymagane jest jedynie odpowiednie przeskalowanie
funkcji gęstości). Dzięki samopodobieństwu sygnały
poddawane filtracji liniowej - operacja splotu - zachowują swój rozkład prawdopodobieństwa.
Znając rozkładu prawdopodobieństwa {e(t)}
poziomy wyzwalania w detektora można ustalić w
oparciu o klasyczne kryterium Neymana-Pearsona
[2]. Dolne i górne wartości progowe odpowiadają
wówczas wartościom krytycznym Ld oraz Lg testu
statystycznego, w którym dla danego poziomu istotności β weryfikowane są dwie hipotezy dotyczące: 1)
braku przynależności lub 2) przynależności poszczególnych próbek {e(t)} do zbioru próbek nadmiarowych (próbki o bardzo dużych amplitudach występują w „czystym“ sygnale {e(t)} bardzo rzadko - częstotliwość ich występowania określamy arbitralnie dobierając prawdopodobieństwo β). Hipoteza zerowa
Ho mówi, że w chwili ti dana próbka sygnału e(ti )
nie jest nadmiarowa (Ld ¬ e(ti ) ¬ Lg z prawdopodobieństwem równym 1 − β), a hipoteza alternatywna
H1 zakłada, że próbka e(ti ) jest nadmiarowa – zawiera zakłócenie impulsowe (e(ti ) > Lg lub e(ti ) < Ld z
prawdopodobieństwem równym β). W trakcie weryfikacji hipotez można popełnić dwa błędy: błąd I rodzaju – gdy niezakłócona impulsowo próbka sygnału
zostanie uznana za zakłóconą (próbka „dobra“ będzie
miała poziom należący do obszaru krytycznego testu
statystycznego) lub błędy II rodzaju – gdy próbka
zakłócona impulsowo zostanie uznana za „dobrą“ –
będzie należała do obszaru dopuszczalności H0 .
Przyjmując założenie o gaussowskim charakterze sygnału {e(t)} poziomy wyzwalania w detektora
można ustalić w oparciu o popularne kryterium 3 σ.
Wynika z niego, iż za próbki nadmiarowe uznawane są te dane, których amplituda przekracza trzykrotną wartość średniego odchylenia standardowego:
Lg = 3 σe , Ld = −3 σe . Dla tak przyjętych progów
poziom istotności jest równy β = 0,0027. Prawdopodobieństwo popełnienia błędów pierwszego rodzaju
jest wówczas małe (równe β). Stosując powyższe kryterium detekcji wykryjemy większość zakłóceń (popełnimy również pewną, nieznaną liczbę błędów drugiego rodzaju) ale również część próbek "dobrych"
zakwalifikujemy jako zakłócenie. W proponowanym
algorytmie powyższy etap, jest pierwszą fazą detekcji, służącą do wstępnej selekcji danych. Druga faza, której celem jest zmniejszenie sumarycznej liczby
błędów pierwszego rodzaju polega na dalszej analizie wstępnie wyselekcjonowanych danych w oparciu o
ich zmienione własności statystyczne. Nowe poziomy
wyzwalania obliczone są na podstawie nowej funkcji
gęstości rozkładu prawdopodobieństwa wyznaczonej
z rozkładu prawdopodobieństwa sygnału {e(t)}.
Dwuetapowy algorytm detekcji można również
zastosować przy braku założeń co do gaussowskiego
charakteru {e(t)}. Progi detekcji każdego z etapów
są wówczas obliczane w oparciu o daną funkcję gęstości rozkładu {e(t)}. W pierwszym etapie można
przyjąć poziom istotności równy β = 0,0027 czyli
wartości odpowiadającej zastosowaniu dla rozkładu
gaussowskiego reguły 3 σ. W etapie drugim funkcję
gęstości rozkładu prawdopodobieństwa należy obliczyć w oparciu o postać analityczną gęstości rozkładu
{e(t)}. W przypadku, gdy znany jest tylko histogram
{e(t)} poziomy wyzwalania detektorów w fazach I i
II można wyznaczyć się w sposób opisany w [1].
2. MODEL SYGNAŁU FONICZNEGO
W pracy przyjęto, że zakłócony impulsowo sygnał foniczny {y(t)} opisany jest w przedziale stacjonarności zależnościami:
p
X
y(t) = s(t) + z(t), s(t) =
aj s(t − j) + n(t), (1)
j=1
gdzie aj , j = 1, . . . , p, oznaczają wartości współczynników AR, {s(t)} jest niezakłóconym sygnałem fonicznym, {n(t)} to szum wejściowy o nieznanym rozkładzie prawdopodobieństwa (posiadający wartość
oczekiwaną mn = 0 i wariancję σn2 < ∞) formujący
sygnał {s(t)}, a {z(t)} jest sygnałem zakłóceń impulsowych.
Przyjmując, że sygnał foniczny {s(t)} jest samopodobnym procesem losowym rozkłady prawdopodobieństw {s(t)} oraz {n(t)} są takie same (różnią się
jedynie skalą). Sygnał {y(t)} z racji zawierania sygnału {z(t)} ma rozkład prawdopodobieństwa nieco
inny niż {s(t)} (przy małej w stosunku do sygnału
użytecznego intensywności zakłóceń obydwa rozkłady są podobne).
Poddając sygnał {y(t)} filtracji odwrotnej za
pomocą filtru analizującego o skończonej odpowiedzi
impulsowej (FIR), którego współczynnikami są oszacowania parametrów b
aj , j = 1, . . . , p, otrzymuje się
sygnał błędów resztowych {e(t)} o wartości oczekiwanej me ' 0 i wariancji σe2 < ∞ wyrażony równaniem:
e(t) = y(t) −
p
X
b
aj y(t − j)
(2)
j=1
= s(t)+z(t) −
p
X
b
aj (s(t−j)+ z(t−j)).
j=1
Wprowadźmy oznaczenia
n
e(t) = n(t) + ∆n (t) = s(t) −
ze(t) = z(t) + ∆z (t) = z(t) −
p
X
j=1
p
X
b
aj s(t − j),
(3)
b
aj z(t − j),
(4)
j=1
gdzie {e
n(t)} oznacza szum wejściowy powiększony o
część {∆n (t)} powstałą na skutek błędów oszacowań
parametrów modelu aj , j = 1, . . . , p, a {e
z (t)} jest sygnałem zakłóceń impulsowych {z(t)} powiększonym
o składową {∆z (t)} (składnik {∆z (t)} zawiera sumy
ważone opóźnionych w czasie p wartości {z(t)}, oznacza to, że w {e
z (t)} „rozmyte“ impulsy zanikają dłużej
niż w sygnale {z(t)}). Wykorzystując wprowadzone
oznaczenia równanie (2) można zapisać w postaci:
e(t) = n
e(t) + ze(t) = n(t) + [∆n (t) + ze(t)]. (5)
Gdy szum impulsowy nie jest zbyt intensywny oraz
stosowane są efektywne algorytmy estymacji parametrów {aj }, rozkład prawdopodobieństwa {e(t)} jest
najczęściej podobny do rozkładu prawdopdobieństwa
{n(t)}. Różnica wyraża się w grubościach ogonów
obydwu funkcji - wykres gęstości rozkładu {e(t)} w
porównaniu z {n(t)} nieznacznie wolniej opada ze
wzrostem wartości poziomu sygnału (prawdopodobieństwo próbek o dużych poziomach jest większe).
3. DETEKTOR ZAKŁÓCEŃ
IMPULSOWYCH
Proponowana metoda detekcji zakłóceń impulsowych jest procesem dwuetapowym. W pierwszej fazie sygnał błędów resztowych {e(t)} podawany jest
procesowi wstępnej selekcji przy wykorzystaniu zależności:

e(t) − L β d dla e(t) < L β d


2
2




0
dla L β d ¬ e(t) ¬ L β g
e0 (t) =
2
2





 e(t) − L β
dla e(t) > L β g ,
2g
2
(6)
gdzie L β d L β g to odpowiednio dolny i górny próg
2
2
wyzwalania detektora wyznaczony dla przyjętego poziomu istotności β w oparciu o rozkład prawdopodobieństwa {e(t)}. W pracy przyjęto, że poziom ten jest
równy β = 0,0027, co przy założeniu gaussowskiego charakteru {e(t)} odpowiada zastosowaniu reguły
3 σ. Progi wyznacza się rozwiązując równania:
Z Lβ
Z ∞
d
β
β
2
p (e(t)) de , (7)
=
=
p (e(t)) de ,
2
2
Lβ
−∞
2
które można zapisać w postaci
F (L β d ) = β/2,
2
2
2
p (A|B) = p (A ∩ B)/p (B) = p (A)/p (B) .
(9)
Przyjmując następujące oznaczenia: B = {(e(t) <
L β d ) ∨ (e(t) > L β g )} – zbiór wszystkich wartości sy2
2
gnału wykrywanych przez detektor w pierwszej fazie detekcji, {eB (t)} ⊂ B – zbiór próbek sygnału
{e(t)} spełniających kryterium detekcji, funkcję gęstości rozkładu prawdopodobieństwa p (e0 (t)) sygnału można wyznaczyć korzystając z zależności:
p (eB (t))
.
p (B)
(10)
Na rys. 1 zamieszczono wykresy przedstawiające
metodę konstrukcji funkcji gęstości rozkładu prawdopodobieństwa sygnału {e0 (t)}. Czynnik p (B) równy
p (e0 (t)) = p (e(t) | B) = p (eB (t) | B) =
Z
p (e(t))de =
B
B
p (eB (t))de = β
(11)
sprawia, iż zachowany jest podstawowy warunek
normalizacji funkcji rozkładu prawdopodobieństwa
p (e0 (t)):
Z
p (e0 (t))de0 = 1 .
(12)
B
W drugim etapie detekcji, którego celem jest
zmniejszenie ogólnej liczby błędów pierwszego rodzaju wyznacza się w oparciu o rozkład p (e0 (t)) nową parę progów wyzwalania detektora L γ2 d i L γ2 g . W tym
celu należy rozwiązać się następujące równania:
γ
=
2
Z
Lγd
2
−∞
p (e0 (t)) de0 ,
0.2
0
−4
β/2
−3
2
gdzie F −1 (·) oraz Φ−1 (·) oznaczają funkcje odwrotne
odpowiednio F (·) (w przedziale, w którym: e(t) ¬
L β d ) oraz Φ(·) (w przedziale, gdzie: e(t) > L β g ).
2
2
Funkcje rozkładu prawdopodobieństwa p(e0 (t))
sygnału {e0 (t)} wyznacza się korzystając z dobrze
znanej własności prawdopodobieństwa warunkowego,
które mówi, że jeśli pomiędzy dwoma zdarzeniami
elementarnymi A i B zachodzi zależność A ⊂ B
to prawdopodobieństwo warunkowe zdarzenia A pod
warunkiem B jest równe:
Z
0.3
0.1
gdzie F (·) oznacza dystrybuantę rozkładu prawdopodobieństwa {e(t)} a Φ(·) uzupełnienie dystrybuanty
F (·). Korzystając z powyższych oznaczeń progi detekcji {e(t)} można wyznaczyć korzystając z zależności:
L β d = F −1 (β/2) dla e(t) ¬ L β d ,
2
2
(8)
L β g = Φ−1 (β/2) dla e(t) > L β g ,
p (B) =
0.4
g
Φ(L β g ) = 1 − F (L β g ) = β/2 ,
2
a) P(e(t))
0.5
γ
=
2
Z
∞
Lγg
2
p (e0 (t)) de0 , (13)
b) P(e‘(t))
β/2
−2
−1
A
0
1
2
A
A
¢
A
AU
−3
4
e(t)
−2
3
4
e‘(t)
¢
¢
A
0.5
0
−4
3
¢
A
1
¢
¢®
−1
0
1
¢
2
Rys. 1: Metoda konstrukcji funkcji gęstości rozkładu prawdopodobieństwa sygnału {e0 (t)}, a) przykładowy rozkład prawdopodobieństwa sygnału {e(t)}
∼ N (0, 1), b) funkcja rozkładu {e0 (t)} otrzymana
po odpowiednim przeskalowaniu fragmentów rozkładu {e(t)} odpowiadających obszarom krytycznym testu statystycznego I fazy detekcji (poziom istotności
β = 0,05).
gdzie γ jest arbitralnie przyjętym poziomem istotności (np. γ = 0,05). Powyższe zależności można zapisać w postaci
F 0 (L γ2 d ) = γ/2 ,
Φ0 (L γ2 g ) = 1 − F 0 (L γ2 g ) = γ/2 ,
przy czym F 0 (·) oznacza dystrybuantę rozkładu
prawdopodobieństwa {e0 (t)} a Φ0 (·) jest uzupełnieniem F 0 (·).
Podobnie jak w pierwszym etapie detekcji progi
wyzwalania detektora dla ujemnych i dodatnich wartości sygnału {e0 (t)} można wyznaczyć korzystając z
zależności:
L γ2 d = F 0−1 (γ/2) dla e0 (t) ¬ L γ2 d ,
(14)
L γ2 g = Φ0−1 (γ/2) dla e0 (t) > L γ2 g ,
gdzie F 0−1 (·) oraz Φ0−1 (·) to funkcje odwrotne odpowiednio F 0 (·) (w przedziale, w którym: e0 (t) ¬ L γ2 d )
oraz Φ0 (·) (w przedziale, gdzie: e0 (t) > L γ2 g ). Ostatecznie, korzystając z zależności:
 0
e (t) − L γ2 d





0
e00 (t) =




 0
e (t) − L γ2 g
dla
e0 (t) < L γ2 d
dla
L γ2 d ¬ e0 (t) ¬ L γ2 g
dla
e0 (t) > L γ2 g
(15)
otrzymuje się sygnał {e00 (t)}. Sygnał ten podawany
jest na wejście dyskryminatora, opisanego zależnością:
0 gdy e00 (t) = 0
d(t) =
(16)
1 gdy e00 (t) 6= 0 ,
na którego wyjściu pojawia się sygnał zerojedynkowy będący jednocześnie sygnałem wyjściowym całego detektora. Jedynki oznaczają wykryte
zakłócenia.
Progi detekcji L γ2 d oraz L γ2 g można wyznaczyć zarówno w oparciu o rozkład prawdopodobieństwa p (e0 (t)) (rozwiązując równania (13)) jak również
p (e(t)), gdyż pierwszy z wymienionych rozkładów
powstał przez przeskalowanie (normalizacje) fragmentów rozkładu drugiego. Nowa formuła wyznaczania progów wyzwalania pomijająca konieczność wyznaczania rozkładu prawdopodobieństwa p (e0 (t)) ma
postać:
βγ
=
2
Z
Lγd
2
p (e(t)) de ,
−∞
βγ
=
2
Z
∞
p (e(t)) de . (17)
Lγg
2
Przyjmując, że {e(t)} ma rozkład normalny
N (0, σe ) poziomy odniesienia można wyznaczyć korzystając z tablic standaryzowanego rozkładu normalnego poprzez odczytanie wartości se , dla której
dystrybuanta jest równa βγ
2 . Progi detekcji są wówczas równe odpowiednio:
L γ2 d = −σe | se |,
L γ2 g = σe | se | .
(18)
Tabela 1 zawiera wartości parametru se dla wybranych wartości γ przy ustalonym β = 0,0027.
γ
1
0,5
0,1
0,05
0,01
0,005
0,0027
0,00135
0,001
se
-3,0
-3,2051
-3,6425
-3,8172
-4,1974
-4,3518
-4,4850
-4,6307
-4,6924
Tabela 1: Parametr se dla wybranych wartości γ (β =
0,0027), szczegóły w tekście.
Z dotychczasowych doświadczeń praktycznych
autora wynika, że w detektorach parametrycznych
działających w oparciu o zależności (18), (15) oraz
(16) (zamiast σe stosowana jest chwilowa ocena
średniego odchylenia standardowego σ
b(t)) wartość
| se | dobierana jest eksperymentalnie w zakresie
3,5 <| se |< 4,5. Oznacza to, że przyjmując założenie o gaussowskim charakterze {e(t)} w drugim etapie detekcji należy przyjmować poziom istotności γ
należący do przedziału od około 0,1 do 0,0027. W
przypadku innych założeń co do rozkładu prawdopodobieństwa {e(t)} i/lub znajomości oszacowania
funkcji gęstości rozkładu prawdopodobieństwa (np. w
postaci histogramu) progi detekcji wyznaczamy rozwiązując równania (17). Wartości poziomu istotności γ należy dobrać eksperymentalnie (przyjmując,
że β = 0,0027).
4. WNIOSKI KOŃCOWE
W pracy omówiono nową dwuetapową metodę
wykrywania zakłóceń impulsowych występujących w
sygnałach fonicznych. Algorytm jest odmianą parametrycznego detektora zakłóceń, wykorzystującego
model autoregresyjny sygnału. Oparty jest o analizę rozkładów prawdopodobieństw błędów resztowych otrzymywanych na wyjściu filtru analizującego o współczynnikach równych parametrom modelu
AR. W algorytmie tym wyznaczanie wartości progowych detektora przebiega w dwóch fazach. W pierwszej, w której dokonywana jest wstępna selekcja danych, progi wyzwalania detektora wyznaczane są w
oparciu o znany rozkład prawdopodobieństwa sygnału {e(t)} jako wartości krytyczne testu statystycznego dla poziomu istotności β = 0,0027 (dla rozkładu
gaussowskiego przyjęty poziom istotności odpowiada
zastosowaniu reguły 3 σ). Druga faza detekcji służy
do zmniejszenia liczby fałszywych alarmów (błędów I
rodzaju testu statystycznego) pojawiających się licznie w fazie pierwszej. Progi detekcji drugiego etapu są
obliczane dla nowej wartości poziomu istotności γ w
oparciu o rozkład prawdopodobieństwa próbek {e(t)}
wykrytych jako zakłócenia przez detektor pierwszego
etapu. Rozkład ten wyznaczany jest w oparciu o pierwotny rozkład prawdopodobieństwa {e(t)}. W pracy
zaproponowano także sposób połączenia obydwu etapów detekcji w jeden algorytm, oraz wskazano zakres
zmienności parametru γ odpowiadający empirycznie
wyznaczonemu przez autora przedziałowi typowych
wartości poziomów wyzwalania detektorów parametrycznych.
SPIS LITERATURY
[1] K. Cisowski, Detekcja zakłóceń impulsowych w
sygnałach fonicznych z wykorzystaniem wygładzonych lokalnych histogramów sygnału Proc.
X Poznańskie Warsztaty Telekomunikacyjne
PWT2005, Poznań, 8–9 grudnia 2005, str. 109–
114.
[2] Kay S. M.: Fundamentals of Statistical Signal
Processing, Volume II Detection Theory. Prentice Hall PTR, Prentice-Hall, Inc. Upper Saddle
River. New Jersey 07458, 1998.
[3] Kuruoglu E. E.: Signal Processing in α−stable
noise environments: a least lp −norm approach,
PHD Thesis, Signal Processing and Communications Laboratory, Department of Engineering
University of Cambridge, 1998.
[4] Moerland P.: A comparison of mixture models
for density estimation, ICANN99. Ninth International Conference on Artificial Neural Networks (IEE Conf. Publ. No.470), Vol. 1, pp 2530, Edinburgh, UK, 09.1999.

Podobne dokumenty