jakość kompresji sygnału ekg w dynamicznej elektrokardiografii
Transkrypt
jakość kompresji sygnału ekg w dynamicznej elektrokardiografii
Materiały XXXVI Międzyuczelnianej Konferencji Metrologów MKM’04 _________________________________________________________________________________ Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA Politechnika Wrocławska Wydział Elektroniki Zakład Wydziałowy Miernictwa i Systemów Pomiarowych JAKOŚĆ KOMPRESJI SYGNAŁU EKG W DYNAMICZNEJ ELEKTROKARDIOGRAFII HOLTERA Z ZASTOSOWANIEM TRÓJWARSTWOWEJ SIECI NEURONOWEJ W pracy przedstawiono czynniki mające wpływ na jakość kompresji sygnału EKG z zastosowaniem sieci neuronowych (ANN). Po analizie wstępnego przetwarzania sygnału przeprowadzono dobór parametrów procesu uczenia oraz przebadano wpływ synchronizacji cyklu na jakość procesu uczenia. Na zakończenie przedstawiono wyniki kompresji sygnału przeprowadzone za pomocą nauczonych sieci i porównano je z wynikami uzyskanymi dla tych samych zbiorów metodą DPCM (Differential Pulse Code Modulation). Przy porównywalnych współczynnikach kompresji uzyskano lepszą jakość kompresji metodą DPCM. QUALITY OF COMPRESSION OF ECG SIGNALS IN DYNAMIC HOLTER ELECTROCARDIOGRAPHY BY MEANS OF THREE-LAYER NEURAL NETWORK In the paper important factors contributing to quality of compression of ECG signals by means of artificial neural networks (ANN) are presented. Analysis of pre-processing has been first performed then selection of parameters of learning process has been done. Relationship between cycle synchronisation and quality of learning has been investigated. Results of compression of ECG signals obtained from learned ANN are presented and their comparison with DCPM (Differential Pulse Code Modulation) results is given. When compression coefficients were comparable, the DPCM produces better results than the ANN method. 1. WSTĘP Wzrost pojemności pamięci półprzewodnikowych i związanych z tym możliwości rejestracji strumieni informacji o coraz większych rozmiarach nie ogranicza prac badawczych w zakresie redukcji redundacji informacji a więc i opracowywania algorytmów kompresji sygnałów. Ponieważ sygnały biomedyczne są rejestrowane i przesyłane głównie w celach diagnostycznych, dlatego na funkcjonowanie algorytmów kompresji nałożone są szczególne wymagania co do wierności odtwarzania odcinków sygnałów odpowiadających artefaktom. Wynika stąd, że warunkiem poprawnego zdiagnozowania zmian chorobowych jest dobre odtworzenie trajektorii czasowej sygnału [3], [4], [5], [14]. Znaczące osiągnięcia zanotowano tu w zakresie bezstratnej kompresji z zastosowaniem adaptacyjnych całkowitoliczbowych pakietów falkowych [8], [9], [10]. W opracowaniu podjęto próbę przeanalizowania czynników mających wpływ na jakość kompresji sygnału EKG z wykorzystaniem sieci neuronowych ANN (Artificial Neural Networks) do zastosowań w monitorowaniu Holtera. Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA ________________________________________________________________________________ 160 Przyjęto założenie wstępne, że fragmenty sygnału, których jakość kompresji jest niezadowalająca, są rejestrowane w postaci oryginalnej. W łańcuchu przetworzeń od pierwotnego źródła sygnału EKG do zdekompresowanej odtworzonej postaci tego sygnału, stanowiącej podstawę analizy medycznej można wyróżnić dwa główne elementy mające wpływ na efekt kompresji: • wejściowe bloki pomiarowe, których produktem jest cyfrowa reprezentacja sygnału, • zastosowane algorytmy kompresji i dekompresji, według których następuje przetwarzanie danych pomiarowych. 2. WEJŚCIOWE BLOKI POMIAROWE Sygnał EKG (rys.1) jest pozyskiwany w warunkach dużych zakłóceń generowanych zarówno przez otoczenie, jak również przez organizm pacjenta w postaci sygnałów elektromiograficznych o składowych zlokalizowanych w pobliżu 35 Hz [6]. Ze względu na swoją quasi-okresowość i wynikający stąd duży nadmiar informacji sygnał ten charakteryzuje się niską entropią a ok. 95% informacji niosą składowe o częstotliwościach mieszczących się w przedziale (0,25 do 30) Hz [3]. Konieczne jest więc zastosowanie przed procesem kompresji filtru dolnoprzepustowego o częstotliwości granicznej fgr < 35 Hz; zdecydowano się zastosować filtr o skończonej odpowiedzi impulsowej z oknem Hamminga o częstotliwości granicznej fgr =30 Hz. Częstotliwość próbkowania fp sygnału EKG wybrano eksperymentalnie zmniejszając ją od początkowej wartości 500Hz. Podstawą oceny były decyzje podejmowane niezależnie przez trzech lekarzy kardiologów w odniesieniu do przebiegów czasowych sygnałów odtworzonych na podstawie próbek. Rys. 1. Standardowy model sygnału EKG Fig. 1. Standard model of ECG signal Ostatecznie zredukowano ją poprzez decymację z początkowej wartości 500Hz do 62,5Hz, czyli zbliżonej do minimalnej wartości spełniającej warunek Shannona-Kotielnikowa. Badania praktyczne jakości kompresji prowadzono w oparciu o zbiór danych pozyskanych z Jakość kompresji sygnału EKG w dynamicznej elektrokardiografii Holtera ... 161 ________________________________________________________________________________ Okręgowego Szpitala Kolejowego we Wrocławiu. Dane zarejestrowane w plikach w postaci wartości 8-bitowych, poddawano kompresji i dekompresji, celem określenia jakości działania algorytmu. Zbiór ten zawiera sygnały zarejestrowane w układzie kończynowym dwubiegunowym Einthovena oraz jednobiegunowym Goldbergera. Otrzymane rezultaty zyskały by na wartości dla bardziej reprezentatywnego zbioru danych testowych, niestety na dzień dzisiejszy próby pozyskania danych patologicznych z baz AHA (American Health Association) czy też European ST-T Database, nie powiodły się z przyczyn finansowych. Dalsze prace doświadczalne w dziedzinie kompresji sygnałów EKG wymagają pozyskania danych z profesjonalnych źródeł. 3. KOMPRESJA SYGNAŁÓW POMIAROWYCH Z ZASTOSOWANIEM SIECI NEURONOWYCH Zadaniem kompresji jest zmniejszenie ilości informacji tak by możliwe było jej późniejsze odtworzenie (dekompresja). Zadanie to jest możliwe do rozwiązania za pomocą sieci neuronowej jednokierunkowej, w najprostszym przypadku trójwarstwowej [2], która daje możliwość kompresji typu stratnego (z utratą informacji nadmiarowej) przy wysokim współczynniku kompresji CR. Współczynnik kompresji rozumiany jest jako stosunek objętości zajmowanej przez sygnał oryginalny do objętości zajmowanej przez sygnał skompresowany. Sieć zawiera dwie warstwy wejściową i wyjściową o takiej samej liczbie neuronów N i co najmniej jedną warstwę ukrytą składającą się z M neuronów. Kompresję realizują neurony warstw wejściowej i ukrytej a dekompresję ukrytej i wyjściowej. Warunkiem kompresji jest M < N. Liczba N zależna jest od częstotliwości próbkowania fp sygnału i wartości średniej częstotliwości fE kompresowanego sygnału EKG: N = fp (fE)-1. (1) Średnia częstotliwość tętna analizowanych przebiegów wynosi fE = 75 min-1, co daje wartość N = 50. Można wyróżnić następujące czynniki mające wpływ na jakość kompresji: • struktura sieci, liczba warstw ukrytych, • liczba neuronów w warstwach ukrytych, • przyjęty model neuronu, w tym wybór postaci oraz parametrów funkcji aktywacji, • wybór algorytmu uczenia sieci, kryterium jakości oraz parametrów procesu uczenia, • wybór zbioru uczącego, liczności prezentowanych wzorców, • zastosowanie innych procedur, np. synchronizacji cyklu, w przypadku kompresji sygnałów quasi-okresowych. Ze względu na charakter oraz liczbę czynników nie jest możliwa pełna optymalizacja procesu kompresji. Do badań kompresji i dekompresji odcinka P-QRS-T sygnału EKG przyjęto zatem sieć z jedną warstwą ukrytą o strukturze 50-M-50. Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA ________________________________________________________________________________ 162 4. MIARY JAKOŚCI KOMPRESJI I REKONSTRUKCJI SYGNAŁU, MODEL NEURONU Ocenę jakości kompresji i rekonstrukcji [1],[2] sygnałów wykonano dla 2 ≤M≤ 7 w oparciu o następujące miary: - błąd średni kwadratowy RMS: 1 N RMS = - N ∑ ( X i − Xˆ i ) 2 (2) , i =1 procentową różnicę średnio-kwadratową PRD [%]: N PRD = ∑ ( X i − Xˆ i ) 2 i =1 N ∑ X i2 ⋅ 100 % , (3) i =1 - względny wskaźnik szumów SNR [dB]: N SNR = 10 log ∑X N i =1 ∑ (X i =1 i 2 i ˆ )2 −X i , (4) gdzie: -jest wartością i-tej próbki sygnału oryginalnego, ˆ -jest wartością i-tej próbki sygnału zrekonstruowanego. Niestałość wartości okresu analizowanych sygnałów wymaga aby próbki reprezentujące pozostałą część cyklu oraz cykle nierozpoznane przez „nauczoną sieć”, których wyróżnikiem jest RMS > RMSprog, zostały zapisane w pamięci w oryginale. Przyjęto nieliniowy modelu i-tego neuronu o wejściach xj, (1≤ j ≤N), wagach synaptycznych wij, funkcji aktywacji f(ui), wyjściu yi: N u i = ∑ wij x j + wi 0 , (5) y i = f (u i ) . (6) j =1 Badania przeprowadzone dla sieci neuronowej, jednokierunkowej trójwarstwowej o zmiennej liczbie neuronów w warstwie ukrytej, dla parametru 0.05 ≤ β ≤ 1 wykazały zalety unipolarnej funkcji aktywacji (7) pojedynczego neuronu dla wartości β ≈ 1: f (u i ) = 1 , 1 + exp(− β ⋅ u i ) f (u i ) = tgh( β ⋅ u i ) . (7) (8) Bipolarna (8) funkcja aktywacji w trakcie procesu uczenia prowadziła w około 50 % badanych przypadków do nasycania się neuronów warstwy wyjściowej oraz do utykania w lokalnych minimach funkcji celu. Jakość kompresji sygnału EKG w dynamicznej elektrokardiografii Holtera ... 163 ________________________________________________________________________________ 5. PROCES UCZENIA SIECI Istotnym czynnikiem mającym wpływ na jakość kompresji sygnału jest proces uczenia sieci. Celem procesu uczenia pojedynczego neuronu jest uzyskanie zgodności między jego wyjściem (ym(j)) a wymaganą odpowiedzią (zm(j)) w j-tym kroku uczenia, dla m-tego neuronu. Miarą stopnia niezgodności jest błąd δm(j) = (zm(j) – ym(j))2. Dla rozpatrywanej sieci autoasocjacyjnej najbardziej efektywnym jest algorytm wstecznej propagacji błędów EBP, który zakłada korekcję i-tej wagi m-tego neuronu dla j-tego kroku uczenia według zależności: ∆wi( m )( j ) = ηδ m( j ) gdzie: η α df (u ) ( j ) y i + α∆wi( m )( j −1) , ( j) du m (9) - współczynnik uczenia ( 0 <η< 1), - współczynnik momentum (0<α<1), δ m( j ) - błąd dla m-tego neuronu w j-tym kroku uczenia. Nieznajomość wartości z m ( j ) dla neuronów warstwy ukrytej uniemożliwia obliczenie ich błędów δ m( j ) ; jedyną metodą jest ich wyznaczenie poprzez wsteczne rzutowanie błędów warstwy wyjściowej. Błędy warstwy wyjściowej mnożone są przez te same wartości wag, przez które mnożone są sygnały propagowane z wejścia do wyjścia: δ m( j ) = ∑ wm( k )( j ) k df (u ) ( j ) δk . du k( j ) (10) Ponieważ współczynniki η i α określają odpowiednio udział składowej gradientowej i historii w algorytmie korekcji wag synaptycznych, przeprowadzono eksperymentalne badanie wpływu wartości obu parametrów na jakość procesu uczenia, przyjmując jako miarę jakości wartość RMS (2). Wyniki badań symulacyjnych uzyskane dla 6 różnych zbiorów uczących, przy założeniu 2 ≤ M ≤ 7, wskazują jednoznacznie na suboptymalne wartości parametrów η = 0,1, α = 0,9. W procedurach uczenia sieci utrzymywano zalecany w [1] warunek η/α = const (Tabela 1). Próba poprawy efektywności nauki poprzez zmianę wartości η, np. przez uzależnienie od numeru pokazu [1], nie dały zadowalających rezultatów i wymagają dalszych badań. Zdecydowaną poprawę jakości uczenia i kompresji sygnału uzyskuje się wykorzystując jego quasi-okresowość w procesie synchronizacji cyklu polegającym na przyporządkowaniu poszczególnym fragmentom sygnału tego samego zbioru neuronów. Dla sygnału EKG za element synchronizujący najwygodniej jest przyjąć próbkę odpowiadającą szczytowi załamka R (rys.1), która w badanych przypadkach zawsze jest przetwarzana przez neuron wejściowy o numerze i = 21. Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA ________________________________________________________________________________ 164 Tabela 1 Porównanie jakości uczenia bez synchronizacji i z synchronizacją cyklu dla jednego ze zbiorów uczących Quality of learning of ANN without and with synchronization of cycle for one of learning sets Liczba neuronów ukrytych 2 3 4 5 6 7 RMStotal Bez synchro- Z synchronizacją nizacji R2 R1 0,0474 0,0214 0,0404 0,0179 0,0317 0,0182 0,0260 0,0161 0,0224 0,0154 0,0191 0,0142 R1/R2 2,21 2,26 1,74 1,61 1,45 1,35 Przeprowadzone testy porównawcze dla różnych zbiorów uczących i różnej liczby neuronów warstwy ukrytej pozwalają wyciągnąć wniosek, że synchronizacja średnio dwukrotnie poprawia jakość uczenia, poprawa jest tym większa im mniejsza jest liczba neuronów warstwy ukrytej. 6. REALIZACJA KOMPRESJI W celu oceny jakości kompresji przeprowadzono testy dla 8 zbiorów danych, przykładowe wyniki kompresji za pomocą nauczonych sieci dla dwu wybranych zbiorów porównano z wynikami uzyskanymi dla tych samych zbiorów metodą adaptacyjnej kompresji DPCM (Differential Pulse Code Modulation) [11], [13]. W obu przypadkach (Tabela 2, Tabela 3) liczba prezentowanych wzorców wynosi 6000, parametry procesu uczenia wynoszą odpowiednio η = 0,1 ; α = 0,9. Tabela 2 Wyniki kompresji sygnału EKG (patologia) metodami DPCM [11] i ANN, rozmiar pliku 1725 B Results of compression of pathological ECG signal by DPCM [11] and ANN methods, file size 1725 B Metoda sieci neuronowych (ANN) RMS po PRD RMS po nauce Liczba [%] neuronów kompresji ukrytych 0,0267 2 0,0401 28,8 0,0204 3 0,0338 24,2 0,0158 4 0,0342 24,6 0,0124 5 0,0276 19,8 0,0100 6 0,0220 15,8 0.0084 7 0,0186 13,3 SNR [dB] CR Metoda (DPCM) PRD SNR CR [%] [dB] 10,8 12,3 12,2 14,1 16,0 17,5 2,97 2,97 3,51 2,92 2,50 2,19 9,63 20,85 2,83 Jakość kompresji sygnału EKG w dynamicznej elektrokardiografii Holtera ... 165 ________________________________________________________________________________ Tabela 3 Wyniki kompresji sygnału EKG (w normie) metodami DPCM [11] i ANN. Rozmiar pliku 1441 B Results of compression of standard ECG signal by using DPCM [11] and ANN methods, file size 1441 B Metoda sieci neuronowych (ANN) RMS po PRD RMS po nauce Liczba [%] neuronów kompresji ukrytych 0,0217 2 0,0384 29,4 0,0133 3 0,0263 20,2 0,0127 4 0,0249 19,1 0,0115 5 0,0230 17,6 0,0113 6 0,0234 17,9 0,0118 7 0,0267 20,5 SNR [dB] CR 10,6 13,9 14,4 15,1 14,9 13,8 4,69 4,71 3,59 2,91 2,44 2,10 Metoda (DPCM) PRD SNR CR [%] [dB] 9,05 21,77 2,71 Z danych zawartych w tabelach wynika, że w obu przypadkach lepszą jakość kompresji zapewnia algorytm DPCM. Dla sygnału EKG w normie uzyskane współczynniki kompresji CR zmieniają się od 2,10 dla M = 7 do 4,71 dla M = 3, zastosowanie metody DPCM daje CR = 2,71. Podobnie dla danych z Tab.2 wartość CR=2,19 dla M=7 oraz CR=3,51 dla M=4 dla metody DPCM współczynnik CR=2,83. Uzyskiwane wartości współczynników kompresji obiema metodami można zatem uznać za porównywalne. Znaczne różnice na korzyść metody DPCM występują w wartościach parametrów jakościowych sygnału, procentowej różnicy średnio-kwadratowej PRD i względnego wskaźnika szumów SNR. W najkorzystniejszym przypadku (M=5) dla sygnału w normie różnica wartości SNR wynosi 6,67dB, a różnica PRD 8,55%, natomiast dla sygnału odpowiadającego patologii wartości różnic są mniejsze i wynoszą dla SNR 3,35dB a dla PRD 3,67%. Wartość współczynnika PRD jest zależna od liczby neuronów warstwy ukrytej, przy wzroście liczby neuronów od M=2 do M=7 wartość PRD zmniejszyła się dwukrotnie dla danych z tab.2 i półtorakrotnie dla danych z tab.3. Przeprowadzone dla 8 zbiorów danych, niezależnie przez 3 lekarzy, oceny wartości diagnostycznej sygnału EKG po dekompresji dały wynik pozytywny dla M≥3, można zatem zaimplementować algorytm w modelowym rejestratorze Holtera. 7. LITERATURA 1. TADEUSIEWICZ R, Sieci neuronowe, Akademicka Oficyna Wyd., Warszawa, 1993. 2. OSOWSKI S., Sieci neuronowe w ujęciu algorytmicznym, WNT, Warszawa, 1996. 3. TAI S. C., ECG data compression by corner detection, Medical & Biological Eng. & Computing, vol. 30, Nov. 1992, 584-590. Stefan GIŻEWSKI, Janusz OCIEPKA, Adam KRZYWAŹNIA ________________________________________________________________________________ 166 4. ZHAO Y., WANG B., ZHAO W., DONG L., Applying incompletely connected feedforward neural network to ambulatory ECG data Compression, Electron. Letters, Jan. 1997, vol. 33 (3), 220-221. 5. Przewodnik metodyczny po systemie analizy laboratoryjnej EKG- HP New Wave Holter, Hewlett Packard, 1991. 6. IWATA A., NAGASAKA Y., SUZUMURA N., Data Compression of the ECG using neural network for digital Holter Monitor, IEEE Engineering in Medicine and Biology, vol. 9 (3), 1990, 53-57. 7. SAXENA S. C., SHARMA A., CHAUDHARY S. C., Data compression and feature extraction of ECG Signals, International Journal of Systems Science, 1997, vol. 28 (5), 483-498. 8. DUDA K., TURCZA P., Porównanie wydajności bezstratnych metod kompresji dla sygnału EKG, Modelowanie i Pomiary w Medycynie, Materiały III-go Sympozjum. Krynica 7-11 maja 2001. 9. DUDA K., ZIELIŃSKI T., Zastosowanie adaptacyjnej transformaty falkowej w wersji predykcyjnej do bezstratnej kompresji sygnału EKG, Modelowanie i Pomiary w Medycynie, Materiały III-go Sympozjum. Krynica 7-11 maja 2001. 10. DUDA K., Bezstratna kompresja sygnału EKG z zastosowaniem adaptacyjnych całkowitoliczbowych pakietów falkowych, Modelowanie i Pomiary w Medycynie, Materiały IV-go Sympozjum. Krynica 13-17 maja 2002. 11. GIŻEWSKI S., RUTKOWSKI T., Adaptacyjny algorytm DPCM kompresji sygnału EKG, Krajowy Kongres Metrologii, Gdańsk, 1998. 12. GIŻEWSKI S., KRZYWAŹNIA A., OCIEPKA J., Algorytm kompresji sygnału EKG z wykorzystaniem sieci neuronowych. Joint IMEKO TC-1 &XXXIV MKM Conference, Wrocław 8-12 września 2002. 13. JALALEDDINE S., ECG Data Compression Techniques – A Unified Approach, IEEE Transactions on Biomedical Eng., vol. 37, Nr 4, 1990, str. 329-342. 14. GACEK A., JEŻEWSKI J., Representation of ECG signals using the segmentation technique, Biocybernetics and Biomedical Engineering, vol.23, nr 4, 2003. ABSTRACT The most important factors contributing to quality of compression of signals are specified. Basic parameters of a standard ECG signal are given as well as their influence on design of input blocks of electrocardiograph. Measures of quality of signal compression are shown and functions of neurone activation are chosen. Parameters of learning process of ANN are determined. Comparison of quality of learning process has been performed in two cases, with cycle synchronisation and without synchronisation. Comparison of results of compression of test signals by ANN method and PPCM methods is presented.