jakość kompresji sygnału ekg w dynamicznej elektrokardiografii

Transkrypt

jakość kompresji sygnału ekg w dynamicznej elektrokardiografii
Materiały XXXVI Międzyuczelnianej Konferencji Metrologów MKM’04
_________________________________________________________________________________
Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA
Politechnika Wrocławska
Wydział Elektroniki
Zakład Wydziałowy Miernictwa i Systemów Pomiarowych
JAKOŚĆ KOMPRESJI SYGNAŁU EKG W DYNAMICZNEJ
ELEKTROKARDIOGRAFII HOLTERA Z ZASTOSOWANIEM
TRÓJWARSTWOWEJ SIECI NEURONOWEJ
W pracy przedstawiono czynniki mające wpływ na jakość kompresji sygnału EKG z
zastosowaniem sieci neuronowych (ANN). Po analizie wstępnego przetwarzania sygnału
przeprowadzono dobór parametrów procesu uczenia oraz przebadano wpływ synchronizacji
cyklu na jakość procesu uczenia. Na zakończenie przedstawiono wyniki kompresji sygnału
przeprowadzone za pomocą nauczonych sieci i porównano je z wynikami uzyskanymi dla
tych samych zbiorów metodą DPCM (Differential Pulse Code Modulation). Przy
porównywalnych współczynnikach kompresji uzyskano lepszą jakość kompresji metodą
DPCM.
QUALITY OF COMPRESSION OF ECG SIGNALS IN DYNAMIC HOLTER
ELECTROCARDIOGRAPHY BY MEANS OF THREE-LAYER NEURAL NETWORK
In the paper important factors contributing to quality of compression of ECG signals
by means of artificial neural networks (ANN) are presented. Analysis of pre-processing has
been first performed then selection of parameters of learning process has been done.
Relationship between cycle synchronisation and quality of learning has been investigated.
Results of compression of ECG signals obtained from learned ANN are presented and their
comparison with DCPM (Differential Pulse Code Modulation) results is given. When
compression coefficients were comparable, the DPCM produces better results than the
ANN method.
1. WSTĘP
Wzrost pojemności pamięci półprzewodnikowych i związanych z tym możliwości
rejestracji strumieni informacji o coraz większych rozmiarach nie ogranicza prac badawczych
w zakresie redukcji redundacji informacji a więc i opracowywania algorytmów kompresji
sygnałów. Ponieważ sygnały biomedyczne są rejestrowane i przesyłane głównie w celach
diagnostycznych, dlatego na funkcjonowanie algorytmów kompresji nałożone są szczególne
wymagania co do wierności odtwarzania odcinków sygnałów odpowiadających artefaktom.
Wynika stąd, że warunkiem poprawnego zdiagnozowania zmian chorobowych jest dobre
odtworzenie trajektorii czasowej sygnału [3], [4], [5], [14]. Znaczące osiągnięcia zanotowano
tu w zakresie bezstratnej kompresji z zastosowaniem adaptacyjnych całkowitoliczbowych
pakietów falkowych [8], [9], [10]. W opracowaniu podjęto próbę przeanalizowania
czynników mających wpływ na jakość kompresji sygnału EKG z wykorzystaniem sieci
neuronowych ANN (Artificial Neural Networks) do zastosowań w monitorowaniu Holtera.
Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA
________________________________________________________________________________
160
Przyjęto założenie wstępne, że fragmenty sygnału, których jakość kompresji jest
niezadowalająca, są rejestrowane w postaci oryginalnej.
W łańcuchu przetworzeń od pierwotnego źródła sygnału EKG do zdekompresowanej
odtworzonej postaci tego sygnału, stanowiącej podstawę analizy medycznej można wyróżnić
dwa główne elementy mające wpływ na efekt kompresji:
•
wejściowe bloki pomiarowe, których produktem jest cyfrowa reprezentacja sygnału,
•
zastosowane algorytmy kompresji i dekompresji, według których następuje przetwarzanie
danych pomiarowych.
2. WEJŚCIOWE BLOKI POMIAROWE
Sygnał EKG (rys.1) jest pozyskiwany w warunkach dużych zakłóceń generowanych
zarówno przez otoczenie, jak również przez organizm pacjenta w postaci sygnałów
elektromiograficznych o składowych zlokalizowanych w pobliżu 35 Hz [6]. Ze względu na
swoją quasi-okresowość i wynikający stąd duży nadmiar informacji sygnał ten charakteryzuje
się niską entropią a ok. 95% informacji niosą składowe o częstotliwościach mieszczących się
w przedziale (0,25 do 30) Hz [3]. Konieczne jest więc zastosowanie przed procesem
kompresji filtru dolnoprzepustowego o częstotliwości granicznej fgr < 35 Hz; zdecydowano
się zastosować filtr o skończonej odpowiedzi impulsowej z oknem Hamminga o
częstotliwości granicznej fgr =30 Hz.
Częstotliwość próbkowania fp sygnału EKG wybrano eksperymentalnie zmniejszając ją
od początkowej wartości 500Hz. Podstawą oceny były decyzje podejmowane niezależnie
przez trzech lekarzy kardiologów w odniesieniu do przebiegów czasowych sygnałów
odtworzonych na podstawie próbek.
Rys. 1. Standardowy model sygnału EKG
Fig. 1. Standard model of ECG signal
Ostatecznie zredukowano ją poprzez decymację z początkowej wartości 500Hz do 62,5Hz,
czyli zbliżonej do minimalnej wartości spełniającej warunek Shannona-Kotielnikowa.
Badania praktyczne jakości kompresji prowadzono w oparciu o zbiór danych pozyskanych z
Jakość kompresji sygnału EKG w dynamicznej elektrokardiografii Holtera ...
161
________________________________________________________________________________
Okręgowego Szpitala Kolejowego we Wrocławiu. Dane zarejestrowane w plikach w postaci
wartości 8-bitowych, poddawano kompresji i dekompresji, celem określenia jakości działania
algorytmu. Zbiór ten zawiera sygnały zarejestrowane w układzie kończynowym
dwubiegunowym Einthovena oraz jednobiegunowym Goldbergera. Otrzymane rezultaty
zyskały by na wartości dla bardziej reprezentatywnego zbioru danych testowych, niestety na
dzień dzisiejszy próby pozyskania danych patologicznych z baz AHA (American Health
Association) czy też European ST-T Database, nie powiodły się z przyczyn finansowych.
Dalsze prace doświadczalne w dziedzinie kompresji sygnałów EKG wymagają pozyskania
danych z profesjonalnych źródeł.
3. KOMPRESJA SYGNAŁÓW POMIAROWYCH Z ZASTOSOWANIEM
SIECI NEURONOWYCH
Zadaniem kompresji jest zmniejszenie ilości informacji tak by możliwe było jej
późniejsze odtworzenie (dekompresja). Zadanie to jest możliwe do rozwiązania za pomocą
sieci neuronowej jednokierunkowej, w najprostszym przypadku trójwarstwowej [2], która
daje możliwość kompresji typu stratnego (z utratą informacji nadmiarowej) przy wysokim
współczynniku kompresji CR. Współczynnik kompresji rozumiany jest jako stosunek
objętości zajmowanej przez sygnał oryginalny do objętości zajmowanej przez sygnał
skompresowany. Sieć zawiera dwie warstwy wejściową i wyjściową o takiej samej liczbie
neuronów N i co najmniej jedną warstwę ukrytą składającą się z M neuronów. Kompresję
realizują neurony warstw wejściowej i ukrytej a dekompresję ukrytej i wyjściowej.
Warunkiem kompresji jest M < N. Liczba N zależna jest od częstotliwości próbkowania fp
sygnału i wartości średniej częstotliwości fE kompresowanego sygnału EKG:
N = fp (fE)-1.
(1)
Średnia częstotliwość tętna analizowanych przebiegów wynosi fE = 75 min-1, co daje wartość
N = 50. Można wyróżnić następujące czynniki mające wpływ na jakość kompresji:
•
struktura sieci, liczba warstw ukrytych,
•
liczba neuronów w warstwach ukrytych,
•
przyjęty model neuronu, w tym wybór postaci oraz parametrów funkcji aktywacji,
•
wybór algorytmu uczenia sieci, kryterium jakości oraz parametrów procesu
uczenia,
•
wybór zbioru uczącego, liczności prezentowanych wzorców,
•
zastosowanie innych procedur, np. synchronizacji cyklu, w przypadku kompresji
sygnałów quasi-okresowych.
Ze względu na charakter oraz liczbę czynników nie jest możliwa pełna optymalizacja procesu
kompresji. Do badań kompresji i dekompresji odcinka P-QRS-T sygnału EKG przyjęto zatem
sieć z jedną warstwą ukrytą o strukturze 50-M-50.
Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA
________________________________________________________________________________
162
4. MIARY JAKOŚCI KOMPRESJI I REKONSTRUKCJI SYGNAŁU,
MODEL NEURONU
Ocenę jakości kompresji i rekonstrukcji [1],[2] sygnałów wykonano dla 2 ≤M≤ 7 w
oparciu o następujące miary:
-
błąd średni kwadratowy RMS:
1
N
RMS =
-
N
∑ ( X i − Xˆ i ) 2
(2)
,
i =1
procentową różnicę średnio-kwadratową PRD [%]:
N
PRD =
∑ ( X i − Xˆ i ) 2
i =1
N
∑ X i2
⋅ 100 %
,
(3)
i =1
-
względny wskaźnik szumów SNR [dB]:
N
SNR = 10 log
∑X
N
i =1
∑ (X
i =1
i
2
i
ˆ )2
−X
i
,
(4)
gdzie: -jest wartością i-tej próbki sygnału oryginalnego, ˆ -jest wartością i-tej próbki
sygnału zrekonstruowanego. Niestałość wartości okresu analizowanych sygnałów wymaga
aby próbki reprezentujące pozostałą część cyklu oraz cykle nierozpoznane przez „nauczoną
sieć”, których wyróżnikiem jest RMS > RMSprog, zostały zapisane w pamięci w oryginale.
Przyjęto nieliniowy modelu i-tego neuronu o wejściach xj, (1≤ j ≤N), wagach
synaptycznych wij, funkcji aktywacji f(ui), wyjściu yi:
N
u i = ∑ wij x j + wi 0 ,
(5)
y i = f (u i ) .
(6)
j =1
Badania przeprowadzone dla sieci neuronowej, jednokierunkowej trójwarstwowej o zmiennej
liczbie neuronów w warstwie ukrytej, dla parametru 0.05 ≤ β ≤ 1 wykazały zalety unipolarnej
funkcji aktywacji (7) pojedynczego neuronu dla wartości β ≈ 1:
f (u i ) =
1
,
1 + exp(− β ⋅ u i )
f (u i ) = tgh( β ⋅ u i ) .
(7)
(8)
Bipolarna (8) funkcja aktywacji w trakcie procesu uczenia prowadziła w około 50 %
badanych przypadków do nasycania się neuronów warstwy wyjściowej oraz do utykania w
lokalnych minimach funkcji celu.
Jakość kompresji sygnału EKG w dynamicznej elektrokardiografii Holtera ...
163
________________________________________________________________________________
5. PROCES UCZENIA SIECI
Istotnym czynnikiem mającym wpływ na jakość kompresji sygnału jest proces uczenia
sieci. Celem procesu uczenia pojedynczego neuronu jest uzyskanie zgodności między jego
wyjściem (ym(j)) a wymaganą odpowiedzią (zm(j)) w j-tym kroku uczenia, dla m-tego neuronu.
Miarą stopnia niezgodności jest błąd δm(j) = (zm(j) – ym(j))2.
Dla rozpatrywanej sieci autoasocjacyjnej najbardziej efektywnym jest algorytm
wstecznej propagacji błędów EBP, który zakłada korekcję i-tej wagi m-tego neuronu dla
j-tego kroku uczenia według zależności:
∆wi( m )( j ) = ηδ m( j )
gdzie: η
α
df (u ) ( j )
y i + α∆wi( m )( j −1) ,
( j)
du m
(9)
- współczynnik uczenia ( 0 <η< 1),
- współczynnik momentum (0<α<1),
δ m( j ) - błąd dla m-tego neuronu w j-tym kroku uczenia.
Nieznajomość wartości z m ( j ) dla neuronów warstwy ukrytej uniemożliwia obliczenie
ich błędów δ m( j ) ; jedyną metodą jest ich wyznaczenie poprzez wsteczne rzutowanie błędów
warstwy wyjściowej. Błędy warstwy wyjściowej mnożone są przez te same wartości wag,
przez które mnożone są sygnały propagowane z wejścia do wyjścia:
δ m( j ) = ∑ wm( k )( j )
k
df (u ) ( j )
δk .
du k( j )
(10)
Ponieważ współczynniki η i α określają odpowiednio udział składowej gradientowej i
historii w algorytmie korekcji wag synaptycznych, przeprowadzono eksperymentalne badanie
wpływu wartości obu parametrów na jakość procesu uczenia, przyjmując jako miarę jakości
wartość RMS (2). Wyniki badań symulacyjnych uzyskane dla 6 różnych zbiorów uczących,
przy założeniu 2 ≤ M ≤ 7, wskazują jednoznacznie na suboptymalne wartości parametrów
η = 0,1, α = 0,9. W procedurach uczenia sieci utrzymywano zalecany w [1] warunek
η/α = const (Tabela 1).
Próba poprawy efektywności nauki poprzez zmianę wartości η, np. przez uzależnienie od
numeru pokazu [1], nie dały zadowalających rezultatów i wymagają dalszych badań.
Zdecydowaną poprawę jakości uczenia i kompresji sygnału uzyskuje się wykorzystując jego
quasi-okresowość w procesie synchronizacji cyklu polegającym na przyporządkowaniu
poszczególnym fragmentom sygnału tego samego zbioru neuronów. Dla sygnału EKG za
element synchronizujący najwygodniej jest przyjąć próbkę odpowiadającą szczytowi załamka
R (rys.1), która w badanych przypadkach zawsze jest przetwarzana przez neuron wejściowy o
numerze i = 21.
Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA
________________________________________________________________________________
164
Tabela 1
Porównanie jakości uczenia bez synchronizacji i z synchronizacją cyklu dla jednego ze zbiorów uczących
Quality of learning of ANN without and with synchronization of cycle for one of learning sets
Liczba
neuronów
ukrytych
2
3
4
5
6
7
RMStotal
Bez synchro- Z synchronizacją
nizacji
R2
R1
0,0474
0,0214
0,0404
0,0179
0,0317
0,0182
0,0260
0,0161
0,0224
0,0154
0,0191
0,0142
R1/R2
2,21
2,26
1,74
1,61
1,45
1,35
Przeprowadzone testy porównawcze dla różnych zbiorów uczących i różnej liczby
neuronów warstwy ukrytej pozwalają wyciągnąć wniosek, że synchronizacja średnio
dwukrotnie poprawia jakość uczenia, poprawa jest tym większa im mniejsza jest liczba
neuronów warstwy ukrytej.
6. REALIZACJA KOMPRESJI
W celu oceny jakości kompresji przeprowadzono testy dla 8 zbiorów danych,
przykładowe wyniki kompresji za pomocą nauczonych sieci dla dwu wybranych zbiorów
porównano z wynikami uzyskanymi dla tych samych zbiorów metodą adaptacyjnej kompresji
DPCM (Differential Pulse Code Modulation) [11], [13]. W obu przypadkach (Tabela 2,
Tabela 3) liczba prezentowanych wzorców wynosi 6000, parametry procesu uczenia wynoszą
odpowiednio η = 0,1 ; α = 0,9.
Tabela 2
Wyniki kompresji sygnału EKG (patologia) metodami DPCM [11] i ANN, rozmiar pliku 1725 B
Results of compression of pathological ECG signal by DPCM [11] and ANN methods, file size 1725 B
Metoda sieci neuronowych (ANN)
RMS po
PRD
RMS po nauce
Liczba
[%]
neuronów kompresji
ukrytych
0,0267
2
0,0401
28,8
0,0204
3
0,0338
24,2
0,0158
4
0,0342
24,6
0,0124
5
0,0276
19,8
0,0100
6
0,0220
15,8
0.0084
7
0,0186
13,3
SNR
[dB]
CR
Metoda (DPCM)
PRD SNR
CR
[%]
[dB]
10,8
12,3
12,2
14,1
16,0
17,5
2,97
2,97
3,51
2,92
2,50
2,19
9,63
20,85
2,83
Jakość kompresji sygnału EKG w dynamicznej elektrokardiografii Holtera ...
165
________________________________________________________________________________
Tabela 3
Wyniki kompresji sygnału EKG (w normie) metodami DPCM [11] i ANN. Rozmiar pliku 1441 B
Results of compression of standard ECG signal by using DPCM [11] and ANN methods, file size 1441 B
Metoda sieci neuronowych (ANN)
RMS po
PRD
RMS po nauce
Liczba
[%]
neuronów kompresji
ukrytych
0,0217
2
0,0384
29,4
0,0133
3
0,0263
20,2
0,0127
4
0,0249
19,1
0,0115
5
0,0230
17,6
0,0113
6
0,0234
17,9
0,0118
7
0,0267
20,5
SNR
[dB]
CR
10,6
13,9
14,4
15,1
14,9
13,8
4,69
4,71
3,59
2,91
2,44
2,10
Metoda (DPCM)
PRD SNR
CR
[%]
[dB]
9,05
21,77
2,71
Z danych zawartych w tabelach wynika, że w obu przypadkach lepszą jakość kompresji
zapewnia algorytm DPCM. Dla sygnału EKG w normie uzyskane współczynniki kompresji
CR zmieniają się od 2,10 dla M = 7 do 4,71 dla M = 3, zastosowanie metody DPCM daje
CR = 2,71. Podobnie dla danych z Tab.2 wartość CR=2,19 dla M=7 oraz CR=3,51 dla M=4 dla
metody DPCM współczynnik CR=2,83. Uzyskiwane wartości współczynników kompresji
obiema metodami można zatem uznać za porównywalne.
Znaczne różnice na korzyść metody DPCM występują w wartościach parametrów
jakościowych sygnału, procentowej różnicy średnio-kwadratowej PRD i względnego
wskaźnika szumów SNR. W najkorzystniejszym przypadku (M=5) dla sygnału w normie
różnica wartości SNR wynosi 6,67dB, a różnica PRD 8,55%, natomiast dla sygnału
odpowiadającego patologii wartości różnic są mniejsze i wynoszą dla SNR 3,35dB a dla PRD
3,67%. Wartość współczynnika PRD jest zależna od liczby neuronów warstwy ukrytej, przy
wzroście liczby neuronów od M=2 do M=7 wartość PRD zmniejszyła się dwukrotnie dla
danych z tab.2 i półtorakrotnie dla danych z tab.3. Przeprowadzone dla 8 zbiorów danych,
niezależnie przez 3 lekarzy, oceny wartości diagnostycznej sygnału EKG po dekompresji dały
wynik pozytywny dla M≥3, można zatem zaimplementować algorytm w modelowym
rejestratorze Holtera.
7. LITERATURA
1. TADEUSIEWICZ R, Sieci neuronowe, Akademicka Oficyna Wyd., Warszawa, 1993.
2. OSOWSKI S., Sieci neuronowe w ujęciu algorytmicznym, WNT, Warszawa, 1996.
3. TAI S. C., ECG data compression by corner detection, Medical & Biological Eng.
& Computing, vol. 30, Nov. 1992, 584-590.
Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA
________________________________________________________________________________
166
4. ZHAO Y., WANG B., ZHAO W., DONG L., Applying incompletely connected feedforward neural network to ambulatory ECG data Compression, Electron. Letters, Jan.
1997, vol. 33 (3), 220-221.
5. Przewodnik metodyczny po systemie analizy laboratoryjnej EKG- HP New Wave Holter,
Hewlett Packard, 1991.
6. IWATA A., NAGASAKA Y., SUZUMURA N., Data Compression of the ECG using
neural network for digital Holter Monitor, IEEE Engineering in Medicine and Biology,
vol. 9 (3), 1990, 53-57.
7. SAXENA S. C., SHARMA A., CHAUDHARY S. C., Data compression and feature
extraction of ECG Signals, International Journal of Systems Science, 1997, vol. 28 (5),
483-498.
8. DUDA K., TURCZA P., Porównanie wydajności bezstratnych metod kompresji dla
sygnału EKG, Modelowanie i Pomiary w Medycynie, Materiały III-go Sympozjum.
Krynica 7-11 maja 2001.
9. DUDA K., ZIELIŃSKI T., Zastosowanie adaptacyjnej transformaty falkowej w wersji
predykcyjnej do bezstratnej kompresji sygnału EKG, Modelowanie i Pomiary w
Medycynie, Materiały III-go Sympozjum. Krynica 7-11 maja 2001.
10. DUDA K., Bezstratna kompresja sygnału EKG z zastosowaniem adaptacyjnych
całkowitoliczbowych pakietów falkowych, Modelowanie i Pomiary w Medycynie,
Materiały IV-go Sympozjum. Krynica 13-17 maja 2002.
11. GIŻEWSKI S., RUTKOWSKI T., Adaptacyjny algorytm DPCM kompresji sygnału EKG,
Krajowy Kongres Metrologii, Gdańsk, 1998.
12. GIŻEWSKI S., KRZYWAŹNIA A., OCIEPKA J., Algorytm kompresji sygnału EKG z
wykorzystaniem sieci neuronowych. Joint IMEKO TC-1 &XXXIV MKM Conference,
Wrocław 8-12 września 2002.
13. JALALEDDINE S., ECG Data Compression Techniques – A Unified Approach, IEEE
Transactions on Biomedical Eng., vol. 37, Nr 4, 1990, str. 329-342.
14. GACEK A., JEŻEWSKI J., Representation of ECG signals using the segmentation
technique, Biocybernetics and Biomedical Engineering, vol.23, nr 4, 2003.
ABSTRACT
The most important factors contributing to quality of compression of signals are specified.
Basic parameters of a standard ECG signal are given as well as their influence on design of
input blocks of electrocardiograph. Measures of quality of signal compression are shown and
functions of neurone activation are chosen. Parameters of learning process of ANN are
determined. Comparison of quality of learning process has been performed in two cases, with
cycle synchronisation and without synchronisation. Comparison of results of compression of
test signals by ANN method and PPCM methods is presented.