Artykuł naukowy
Transkrypt
Artykuł naukowy
Paweł Stróżak Instytut Psychologii Katedra Psychologii Eksperymentalnej Katolicki Uniwersytet Lubelski Jana Pawła II Metoda potencjałów wywołanych w neuronauce poznawczej 1. Elektrofizjologiczne podstawy metody potencjałów wywołanych Metoda mózgowych potencjałów wywołanych (event-related potentials, ERP), nazywana również metodą potencjałów skorelowanych ze zdarzeniami, jest techniką badawczą szeroko wykorzystywaną w naukach o mózgu i poznaniu, czyli w dziedzinie określanej terminem neuronauki poznawczej (cognitive neuroscience). Głównym celem tej dynamicznie rozwijającej się dyscypliny naukowej jest odpowiedź na pytania dotyczące powiązań między rozmaitymi procesami poznawczymi człowieka (takimi jak percepcja, pamięć, wyobraźnia, myślenie, samoświadomość) a funkcjonowaniem biologicznego układu, jakim jest ludzki mózg. Neuronauka poznawcza jest dziedziną interdyscyplinarną, łączącą w sobie dorobek takich nauk jak psychologia, fizjologia czy neurobiologia. Korzysta też z wielu technik badawczych, które pozwalają na rejestrację i analizę aktywności ludzkiego mózgu podczas wykonywania różnych zadań poznawczych. Jedną z tych technik jest właśnie metoda ERP. Wykorzystuje ona zjawisko elektroencefalografii, czyli możliwość rejestracji potencjałów elektrycznych za pomocą elektrod umieszczanych na skórze głowy, przy czym źródłem tych potencjałów są komórki nerwowe, czyli neurony. Aby zrozumieć, w jaki sposób przyłożenie elektrody do czaszki umożliwia pomiar aktywności ludzkiego mózgu, należy lepiej poznać podstawowe prawa elektrofizjologii układu nerwowego. Neurony należą do nielicznych komórek w organizmie człowieka, które mają właściwości pobudliwe. Oznacza to, że w wyniku odpowiedniego pobudzenia są one w stanie wytworzyć reakcję, która przenosi się po powierzchni komórki i pobudza kolejne neurony. Jeżeli neuron nie jest pobudzony, na zewnątrz jego błony komórkowej znajduje się nieznaczna przewaga jonów o ładunku dodatnim. Stan ten nazywany jest potencjałem spoczynkowym i jest spowodowany przede wszystkim tendencją dodatnich jonów potasu (K+) do przepływania z wnętrza na zewnątrz błony komórki dzięki sile dyfuzyjnej. Potencjał elektryczny pojedynczej komórki nerwowej w stanie spoczynku wynosi ok. -60 miliwoltów (mV). Pod wpływem działania bodźców o określonej sile pojedyncza komórka nerwowa ze stanu spoczynkowego przechodzi w stan pobudzenia, generując przy tym potencjał czynnościowy, nazywany również impulsem nerwowym. Pod wpływem pobudzenia dochodzi do sytuacji, w której potencjał elektryczny wewnątrz komórki jest wyższy, niż na zewnątrz i osiąga wartość ok. +30 mV (jest to faza depolaryzacji). Podłożem tego zjawiska jest aktywność napięciowozależnych kanałów sodowych, czyli białek, które otwierają się i umożliwiają wpływanie dodatnich jonów sodowych (Na+) do wnętrza komórki. Następnie dochodzi do przywrócenia warunków wyjściowych, czyli powrotu potencjału elektrycznego do stanu spoczynkowego (jest to faza repolaryzacji), a wszystko to dzieje się w czasie krótszym niż 1 milisekunda (Longstaff, 2002). Elektroencefalografia (EEG) to metoda polegająca na pomiarze elektrofizjologicznej aktywności mózgu, której podstawy – na przykładzie pojedynczego neuronu – zostały opisane powyżej. Zapis EEG nigdy nie jest jednak zapisem aktywności pojedynczych komórek nerwowych, ale wypadkowego pola elektrycznego, generowanego przez ogromną liczbę neuronów. Ponadto, źródłem pola elektrycznego rejestrowanego za pomocą EEG nie są potencjały czynnościowe, ale postsynaptyczne potencjały pobudzające i hamujące, które praktycznie się nie przemieszczają i trwają dziesiątki, a nawet setki milisekund. Uważa się, że największy wkład w powstawanie sygnału EEG mają duże komórki piramidalne kory mózgowej. Większość tych komórek charakteryzuje się ułożeniem kolumnowym (czyli prostopadłym do powierzchni czaszki), dzięki czemu powstające pole elektryczne działa idealnie prostopadle w stosunku do elektrod umieszczonych na powierzchni czaszki. Zapis EEG odzwierciedla więc zsumowaną aktywność synchronicznie wyładowujących się populacji neuronów o podobnej orientacji (Luck, 2005). 2. Identyfikacja komponentów w zapisie EEG Zapis sygnału EEG umożliwia dokonanie jego obróbki i analizy na wiele sposobów. Dwa najważniejsze opierają się na analizie częstotliwościowej oraz na uśrednianiu sygnału dla wielu takich samych bądź podobnych prób. Metoda pierwsza polega na wyborze określonego zakresu częstotliwości fal mózgowych, który jest przedmiotem zainteresowania. Np. fale alfa to sygnał EEG o częstości pojawiania się od 8 do 12 cykli na sekundę, czyli o częstotliwości od 8 do 12 herców (Hz). Amplituda tych fal jest stosunkowo duża i waha się od 20 do 60 mikrowoltów (µV). Fale alfa są charakterystyczne dla stanu relaksacji, tzn. można je zaobserwować wówczas, gdy osoba badana jest odprężona i ma zamknięte oczy. W stanie pobudzenia, podczas aktywnego odbioru i przekazywania informacji, pojawiają się fale beta, o większej częstotliwości (od 12 do 30 Hz), ale o mniejszej amplitudzie, od 2 do 20 µV (Herrmann i in., 2005). Druga metoda analizy sygnału EEG polega na wielokrotnym eksponowaniu osobie badanej określonych bodźców. Najczęściej bodźce te różnią się między sobą pewnymi właściwościami lub też osobie badanej przekazywania jest instrukcja dotycząca odmiennego reagowania na różne bodźca. Następnie uśrednia się zapis EEG oddzielnie dla poszczególnych kategorii bodźców. Metoda uśredniania opiera się na założeniu, że na sumaryczną aktywność ludzkiego mózgu (a więc na sumaryczny sygnał EEG zbierany przez elektrody) nakładają się specyficzne wzorce aktywności związane z przetwarzaniem określonych bodźców. Uśrednianie sygnału dla wielu prób spowoduje więc zacieranie się sumarycznego, niespecyficznego sygnału i wysuwanie się na pierwszy plan sygnału specyficznego, związanego z przetwarzaniem określonych bodźców. Jednym z najprostszych przykładów zastosowania tej metody w praktyce jest eksperyment, w którym osobie badanej na monitorze wyświetlane są dwa rodzaje bardzo prostych bodźców (kółka i krzyżyki), przy czym 80% wszystkich prób stanowią kółka, a 20% - krzyżyki. Zadaniem osoby badanej jest reagowanie na ekspozycję krzyżyków poprzez naciśnięcie klawisza oraz powstrzymywanie się od jakiejkolwiek reakcji podczas ekspozycji kółek. Uśrednienie sygnału EEG oddzielnie dla kółek i oddzielnie dla krzyżyków oraz nałożenie na siebie wykresów obydwu fal prowadzi do wniosku, że ok. 300 milisekund po ekspozycji bodźca reakcja ludzkiego mózgu cechuje się o wiele wyższą amplitudą w przypadku krzyżyków niż w przypadku kółek. Takie specyficzne wychylenie fali nazywa się załamkiem, komponentem lub potencjałem wywołanym. Jaśkowski (2009) proponuje nazwę potencjał skorelowany ze zdarzeniem, aby uwypuklić fakt, że przyczyną wychylenia fali jest zawsze określone zdarzenie (w powyższym przykładzie jest to reakcja ruchowa na krzyżyk). Poszczególne komponenty identyfikowane w różnych eksperymentach mają swoje nazwy, które są pochodną kierunku wychylenia fali (amplituda dodatnia lub ujemna) oraz czasu pojawienia się wychylenia. W powyższym przykładzie mamy do czynienia z komponentem P300, ponieważ jego amplituda jest dodatnia (pozytywna) i pojawia się on ok. 300 ms po ekspozycji bodźca (Luck, 2005). W wielu innych eksperymentach identyfikuje się potencjały wywołane, które odzwierciedlają bardziej złożone procesy poznawcze. Przykładem może być komponent N400 związany z przetwarzaniem materiału semantycznego. Jego odkrywcami byli Marta Kutas i Steven Hillyard, a wyniki ich badań w tym zakresie opublikował prestiżowy magazyn Science w 1980 r. Badacze zaprojektowali eksperyment, w którym na ekranie monitora wyświetlały się pojedyncze słowa, które układały się w jakieś sensowne zdanie (np. „Pizza”; „była”; „zbyt”; „gorąca”; „żeby”). Kluczowym elementem była ekspozycja ostatniego słowa, które albo dopełniało sens zdania (np. „jeść”), albo łamało ten sens i czyniło całą dotychczasową sekwencję słów niezrozumiałą (np. „płakać”). Następnie uśredniano sygnał EEG z wielu równoważnych prób, ale tylko w odpowiedzi na ekspozycję ostatniego słowa w każdej sekwencji. Przedmiotem porównania były załamki fali EEG powstające w odpowiedzi na słowa dopełniające sensowny sens zdania oraz powstające w odpowiedzi na słowa łamiące ten sens. Okazało się, że ok. 400 ms po ekspozycji bodźca amplituda komponentu dla słów łamiących semantyczny sens sekwencji słów cechuje się o wiele większym wychyleniem w kierunku wartości ujemnych (stąd określenie tego komponentu jako N400). Autorzy interpretują uzyskane wyniki jako przejaw procesu umysłowego, który zostaje uruchomiony w sytuacji wysokiej niespójności występującej po stronie spostrzeganych bodźców (Kutas i Hillyard, 1980). Co więcej, w przeciwieństwie do poprzedniego eksperymentu, w którym przedmiotem zainteresowania była prosta reakcja ruchowa, tutaj pojawia się element rozumienia materiału semantycznego. Oznacza to, że metoda ERP może być wykorzystywana do rejestracji znacznie bardziej skomplikowanych procesów umysłowych. 3. Metoda potencjałów wywołanych w badaniach nad pamięcią człowieka Szczególną rolę metoda ERP odgrywa w eksperymentalnych badaniach nad pamięcią człowieka. W tym obszarze jest ona stosowana już od końca lat 70. XX wieku (Rugg i Curran, 2007). To wtedy pojawiły się pierwsze doniesienia, że uśrednione załamki EEG cechują się większa amplitudą w przypadku kodowania słów, które później są poprawnie rozpoznawane niż w przypadku słów, które w teście rozpoznawania są poprawnie odrzucane (czyli osoba podejmuje prawidłową decyzję stwierdzając, że dane słowo nie występowało w fazie uczenia się). Istnieje też szeroki nurt badań, w którym identyfikuje się różnice w amplitudzie komponentów podczas kodowania słów w zależności od tego, czy słowa te będą później poprawnie pamiętane, czy też zostaną zapomniane (Wagner, Koutstaal i Schacter, 1999). W innych badaniach przedmiotem zainteresowania są bardziej podstawowe charakterystyki zapamiętywanego materiału, np. konkretność/abstrakcyjność słów (Tolentiono i Tokowicz, 2009), ich długość lub częstość występowania w języku (Hauk i Pulvermüller, 2004). Aby zaobserwować znaczenie metody ERP w eksperymentach nad pamięcią, warto bliżej przyjrzeć się badaniom poświęconym procesom znajomości i pamiętania. Są to dwa różne procesy, choć obydwa prowadzą do tego samego efektu, czyli przypominania sobie jakiejś informacji na etapie rozpoznawania. Proces znajomości (familiarity) opiera się na ogólnym odczuciu, że dana informacja (np. pojedyncze słowo) występujące w teście rozpoznawania było nam prezentowane wcześniej, na etapie uczenia się. Temu poczuciu znajomości nie towarzyszą jednak żadne bardziej szczegółowe wspomnienia. Osoba badana nie jest w stanie przypomnieć sobie detali lub kontekstu, w którym zapamiętywała daną informację. W swoich decyzjach pamięciowych opiera się wyłącznie na zgeneralizowanym poczuciu znajomości. Z kolei proces pamiętania (recollection) bazuje na wyrazistych wspomnieniach, bogatych w szczegółowe charakterystyki zapamiętanych informacji. Osoba badana potrafi przytoczyć pewne detale dotyczące materiału, który był przedmiotem uczenia się, jest również w stanie przypomnieć sobie kontekst zapamiętywania. W wielu psychologicznych badaniach nad procesami znajomości i pamiętania, w których nie wykorzystywano metody ERP, bazowano tylko na wskaźnikach behawioralnych, takich jak czas reakcji czy poprawność odpowiedzi. W eksperymentach takich osoby badane były najpierw uczone, co to znaczy, że ich decyzja pamięciowa może być zaklasyfikowana jako przejaw procesu znajomości lub pamiętania. Następnie badani sami dokonywali oceny swoich wspomnień i zaliczali je albo do kategorii „wiem” (know; odpowiednik procesu znajomości), albo do kategorii „pamiętam” (remember; odpowiednik procesu pamiętania). Twórcą takiej metody klasyfikowania stanów pamięciowych (remember/know judgments) jest wybitny psycholog Endel Tulving (Tulving, 2002). Zastosowanie metody ERP w badaniach nad procesami znajomości i pamiętania pozwala oderwać się od subiektywizmu ocen dokonywanych przez osoby badane i wnioskować o przebiegu różnych procesów pamięciowych na podstawie obiektywnych wskaźników neurofizjologicznych. Przyjrzyjmy się badaniom własnym, które stanowią rozszerzoną replikację klasycznych już badań Tima Currana (Curran, 2000). W eksperymencie pierwszym (Stróżak, 2010) 26 osób oceniło 744 polskie rzeczowniki pod kątem tego, czy są to rzeczowniki konkretne, czy abstrakcyjne. Na podstawie odpowiedzi badanych wybrano 288 rzeczowników, z których połowa osiągnęła najwyższą zgodność ocen co do ich konkretności, a druga połowa – najwyższą zgodność ocen co do ich abstrakcyjności. W eksperymencie drugim 17 osób zapamiętywało te 288 słów, a następnie wykonywało test rozpoznawania (eksperyment drugi składał się z 6 części rozdzielonych przerwami, każda część składała się z 48 słów do zapamiętania i 72 słów do rozpoznania). Połowa zapamiętywanych słów była rzeczownikami w liczbie pojedynczej, a połowa – rzeczownikami w licznie mnogiej. Niektóre słowa z etapu zapamiętywania pojawiała się ponownie na etapie rozpoznawania, ale w innej liczbie (np. na etapie zapamiętywania pojawiło się słowo „kwiat”, a na etapie rozpoznawania słowo „kwiaty”). Osobom badanym przekazano instrukcję, że w takiej sytuacji mają uznać dane słowo za nie występujące na etapie zapamiętywania. W teście rozpoznawania pojawiały się również słowa zupełnie inne od tych prezentowanych wcześniej, które były najczęściej poprawnie odrzucane, czyli osoby badane poprawnie stwierdzały, że słowa te nie pojawiły się na etapie zapamiętywania. Osoby badane, które wzięły udział w eksperymencie drugim, zadanie eksperymentalne wykonywały z jednoczesnym zastosowaniem 128-kanałowego zestawu EEG do rejestracji i analizy potencjałów wywołanych (wszystkie badania przeprowadzono w Laboratorium Psychoneurofizjologicznym, działającym przy Katedrze Psychologii Eksperymentalnej w KUL). Okazało się, że na etapie rozpoznawania, w przypadku części słów, których liczba została zmieniona, badani popełniali błędy fałszywych wspomnień; np. błędnie uznawali, że słowo „kwiaty” występowało na etapie zapamiętywania (podczas gdy tak naprawdę było to słowo „kwiat”). Interesujące obserwacje przyniosło porównanie potencjałów wywołanych, otrzymanych poprzez uśrednianie zapisu EEG oddzielnie dla prawdziwych wspomnień, fałszywych wspomnień oraz poprawnych odrzuceń. Okazało się, że od 400 do 800 ms po ekspozycji słowa w teście rozpoznawania amplituda potencjałów wywołanych jest bardzo podobna zarówno dla prawdziwych, jak i fałszywych wspomnień. Amplituda ta różni się jednak znacznie od amplitudy potencjału towarzyszącego poprawnym odrzuceniom (patrz: Rys. 1). Oznacza to, że na wczesnym etapie podejmowania decyzji pamięciowych nie ma różnicy między procesami umysłowymi, które kryją się za powstawaniem prawdziwych i fałszywych wspomnień. Efekt ten jest neurofizjologicznym wskaźnikiem przebiegu procesu znajomości (familiarity). Jeżeli siła procesu umysłowego jest identyczna dla prawdziwych i fałszywych wspomnień możemy wnioskować, że proces ten odpowiada za ogólne poczucie znajomości. Fałszywym wspomnieniom nie może towarzyszyć przypominanie sobie szczegółowych informacji, są to bowiem błędy pamięciowe powstające w oparciu o złudne odczucie podobieństwa między tym, co sobie przypominamy, a tym, co w rzeczywistości zapamiętaliśmy. Różnice w przebiegu procesów pamięciowych można jednak zaobserwować na nieco późniejszym etapie przetwarzania informacji, od 500 do 1200 ms po ekspozycji bodźca. Wtedy amplituda potencjału wywołanego dla prawdziwych wspomnień jest wyraźnie odmienna od amplitudy dla fałszywych wspomnień, przy czym ta ostatnia nie różni się od amplitudy potencjału towarzyszącego poprawnym odrzuceniom (patrz: Rys. 2). Ten efekt jest z kolei odzwierciedleniem procesu pamiętania (recollection). Siła procesu umysłowego jest wyraźnie wyższa tylko w przypadku prawdziwych wspomnień, ponieważ tylko takim decyzjom może towarzyszyć wydobywanie z pamięci szczegółowych informacji. Rys. 1. Efekt znajomości (familiarity) widoczny na uśrednionym zapisie fal ERP. Od 400 do 800 ms po ekspozycji bodźca aktywność mózgu jest podobna dla prawdziwych i fałszywych wspomnień, a inna dla poprawnych odrzuceń. Zapis pochodzi z elektrody F3 w okolicy czołowej czaszki (źródło: badania własne). Rys. 2. Efekt pamiętania (recollection) widoczny na uśrednionym zapisie fal ERP. Od 500 do 1200 ms po ekspozycji bodźca aktywność mózgu jest podobna dla fałszywych wspomnień i poprawnych odrzuceń, a inna dla prawdziwych wspomnień. Zapis pochodzi z elektrody P3 w okolicy ciemieniowej czaszki (źródło: badania własne). 4. Podsumowanie Opisane powyżej zależności świadczą o tym, że za pomocą metody ERP możemy dotrzeć do obiektywnych wskaźników neurofizjologicznych, które umożliwiają precyzyjne rozróżnienie między procesami umysłowymi prowadzącymi do powstawania prawdziwych i fałszywych wspomnień. Oznacza to, że metoda mózgowych potencjałów wywołanych niesie możliwość wykorzystania jej w praktyce, wszędzie tam, gdzie wnioskowanie o sile i przebiegu różnych procesów pamięciowych ma znaczenie aplikacyjne. W wielu badaniach wykorzystujących metodę ERP zmierza się do zidentyfikowania specyficznych wzorców neuronalnej aktywności, które są charakterystyczne dla osób cierpiących na zaburzenia pamięci. Celem tych badań jest min. stworzenie metod do diagnozy łagodnych zaburzeń poznawczych i wczesnych stadiów choroby Alzheimera. Wyniki pierwszych badań w tym obszarze są obiecujące. Frodl i in. (2002) dowodzą, że amplituda komponentu P300 jest wyraźnie obniżona u osób cierpiących na chorobą Alzheimera w porównaniu do osób z łagodnymi zaburzeniami poznawczymi oraz osób zdrowych. Szeroki przegląd innych badań podejmujących tę tematyką proponują Jackson i Snyder (2008). Podsumowując, należy stwierdzić, że metoda mózgowych potencjałów wywołanych jest doskonałym narzędziem umożliwiającym pomiar aktywności ludzkiego mózgu, znajdującym szerokie zastosowanie we współczesnej neuronauce poznawczej. Nie należy zapominać oczywiście o pewnych ograniczeniach tej metody. Do najważniejszych z nich zalicza się niska rozdzielczość przestrzenna uzyskiwanych danych. Oznacza to, że na podstawie sygnału EEG zbieranego z elektrod umieszczonych na czaszce trudno jest wnioskować o źródle tego sygnału, czyli o tym, jaka dokładnie struktura mózgu odpowiada za interesujący nas proces umysłowy. Wnioskowanie tego typu umożliwiają bardziej zaawansowane metody, zwłaszcza funkcjonalny rezonans magnetyczny (fMRI). Dynamiczny rozwój metody ERP, jak również oprogramowania służącego do obróbki i analizy uzyskiwanego sygnału, pozwalają jednak na przełamywanie tego typu ograniczeń. Ponadto, technika potencjałów wywołanych pozostaje metodą nieinwazyjną dla osób badanych i relatywnie tanią (w porównaniu np. do fMRI), co stwarza możliwości szerokiego jej wykorzystania w praktyce, zwłaszcza w diagnostyce zaburzeń pamięci. Bibliografia Curran, T. (2000). Brain potentials of recollection and familiarity. Memory, 28, 923-938. Frodl, T., Hampel, H., Juckel, G., Bürger, K., Padberg, F., Engel. R. R., Möller, H. J., Hegerl, U. (2002). Value of event-related P300 subcomponents in the clinical diagnosis of mild cognitive impairment and Alzheimer's Disease. Psychophysiology, 39, 175-181. Hauk, O., Pulvermüller, F. (2004). Effects of word length and frequency on the human event-related potential. Clinical Neuropsychology, 115, 1090-1103. Herrmann, C. S., Grigutsch, M., Busch, N. A. (2005). EEG oscillations and wavelet analysis. W: T. C. Handy, (red.), Event-Related Potentials. A Methods Handbook. (s. 229-259). Cambridge, Massachusetts: MIT Press. Jackson, C. E., Snyder, P. J. (2008). Electroencephalography and event-related potentials as biomarkers of mild cognitive impairment and mild Alzheimer’s disease. Alzheimer’s and Dementia, 4, 137-143. Jaśkowski, P. (2009). Neuronauka poznawcza. Jak mózg tworzy umysł. Warszawa: Vizja Press&IT. Kutas, M., Hillyard, S. A. (1980). Reading senseless sentences: Brain potentials reflect semantic incongruity. Science, 207, 203-205. Longstaff, A. (2002). Neurobiologia. Krótkie wykłady. Warszawa: Wydawnictwo Naukowe PWN. Luck, S. J. (2005). An Introduction to Event-Related Potential Technique. Cambridge, Massachussets: MIT Press. Rugg, M. D., Curran, T. (2007). Event-related potentials and recognition memory. Trends in Cognitive Sciences, 11, 251 – 257. Stróżak, P. (2010). The encoding and false recognition of common and abstract nouns. An event-related potentials (ERP) study. Poster zaprezentowany podczas International Neuropsychological Society Mid-Year Meeting w Krakowie. Tolentino, L. C., Tokowicz, N. (2009). Are pumpkins better than heaven? An ERP investigation of order effects in the concrete-word advantage. Brain & Language, 110, 12-22. Tulving, E. (2002). Episodic memory: from mind to brain. Annual Review of Psychology, 53, 1-25. Wagner, A.D., Koutstaal, W., Schacter, D.L. (1999). When encoding yields remembering: Insights from eventrelated neuroimaging. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences, 354, 1307–1324.