Artykuł naukowy

Transkrypt

Artykuł naukowy
Paweł Stróżak
Instytut Psychologii
Katedra Psychologii Eksperymentalnej
Katolicki Uniwersytet Lubelski Jana Pawła II
Metoda potencjałów wywołanych w neuronauce poznawczej
1. Elektrofizjologiczne podstawy metody potencjałów wywołanych
Metoda mózgowych potencjałów wywołanych (event-related potentials, ERP),
nazywana również metodą potencjałów skorelowanych ze zdarzeniami, jest techniką
badawczą szeroko wykorzystywaną w naukach o mózgu i poznaniu, czyli w dziedzinie
określanej terminem neuronauki poznawczej (cognitive neuroscience).
Głównym celem tej dynamicznie rozwijającej się dyscypliny naukowej jest odpowiedź
na pytania dotyczące powiązań między rozmaitymi procesami poznawczymi człowieka
(takimi jak percepcja, pamięć, wyobraźnia, myślenie, samoświadomość) a funkcjonowaniem
biologicznego układu, jakim jest ludzki mózg. Neuronauka poznawcza jest dziedziną
interdyscyplinarną, łączącą w sobie dorobek takich nauk jak psychologia, fizjologia czy
neurobiologia. Korzysta też z wielu technik badawczych, które pozwalają na rejestrację i
analizę aktywności ludzkiego mózgu podczas wykonywania różnych zadań poznawczych.
Jedną z tych technik jest właśnie metoda ERP. Wykorzystuje ona zjawisko
elektroencefalografii, czyli możliwość rejestracji potencjałów elektrycznych za pomocą
elektrod umieszczanych na skórze głowy, przy czym źródłem tych potencjałów są komórki
nerwowe, czyli neurony. Aby zrozumieć, w jaki sposób przyłożenie elektrody do czaszki
umożliwia pomiar aktywności ludzkiego mózgu, należy lepiej poznać podstawowe prawa
elektrofizjologii układu nerwowego.
Neurony należą do nielicznych komórek w organizmie człowieka, które mają
właściwości pobudliwe. Oznacza to, że w wyniku odpowiedniego pobudzenia są one w stanie
wytworzyć reakcję, która przenosi się po powierzchni komórki i pobudza kolejne neurony.
Jeżeli neuron nie jest pobudzony, na zewnątrz jego błony komórkowej znajduje się
nieznaczna przewaga jonów o ładunku dodatnim. Stan ten nazywany jest potencjałem
spoczynkowym i jest spowodowany przede wszystkim tendencją dodatnich jonów potasu
(K+) do przepływania z wnętrza na zewnątrz błony komórki dzięki sile dyfuzyjnej. Potencjał
elektryczny pojedynczej komórki nerwowej w stanie spoczynku wynosi ok. -60 miliwoltów
(mV). Pod wpływem działania bodźców o określonej sile pojedyncza komórka nerwowa ze
stanu spoczynkowego przechodzi w stan pobudzenia, generując przy tym potencjał
czynnościowy, nazywany również impulsem nerwowym. Pod wpływem pobudzenia
dochodzi do sytuacji, w której potencjał elektryczny wewnątrz komórki jest wyższy, niż na
zewnątrz i osiąga wartość ok. +30 mV (jest to faza depolaryzacji). Podłożem tego zjawiska
jest aktywność napięciowozależnych kanałów sodowych, czyli białek, które otwierają się i
umożliwiają wpływanie dodatnich jonów sodowych (Na+) do wnętrza komórki. Następnie
dochodzi do przywrócenia warunków wyjściowych, czyli powrotu potencjału elektrycznego
do stanu spoczynkowego (jest to faza repolaryzacji), a wszystko to dzieje się w czasie
krótszym niż 1 milisekunda (Longstaff, 2002).
Elektroencefalografia (EEG) to metoda polegająca na pomiarze elektrofizjologicznej
aktywności mózgu, której podstawy – na przykładzie pojedynczego neuronu – zostały opisane
powyżej. Zapis EEG nigdy nie jest jednak zapisem aktywności pojedynczych komórek
nerwowych, ale wypadkowego pola elektrycznego, generowanego przez ogromną liczbę
neuronów. Ponadto, źródłem pola elektrycznego rejestrowanego za pomocą EEG nie są
potencjały czynnościowe, ale postsynaptyczne potencjały pobudzające i hamujące, które
praktycznie się nie przemieszczają i trwają dziesiątki, a nawet setki milisekund. Uważa się, że
największy wkład w powstawanie sygnału EEG mają duże komórki piramidalne kory
mózgowej. Większość tych komórek charakteryzuje się ułożeniem kolumnowym (czyli
prostopadłym do powierzchni czaszki), dzięki czemu powstające pole elektryczne działa
idealnie prostopadle w stosunku do elektrod umieszczonych na powierzchni czaszki. Zapis
EEG odzwierciedla więc zsumowaną aktywność synchronicznie wyładowujących się
populacji neuronów o podobnej orientacji (Luck, 2005).
2. Identyfikacja komponentów w zapisie EEG
Zapis sygnału EEG umożliwia dokonanie jego obróbki i analizy na wiele sposobów.
Dwa najważniejsze opierają się na analizie częstotliwościowej oraz na uśrednianiu sygnału
dla wielu takich samych bądź podobnych prób. Metoda pierwsza polega na wyborze
określonego zakresu częstotliwości fal mózgowych, który jest przedmiotem zainteresowania.
Np. fale alfa to sygnał EEG o częstości pojawiania się od 8 do 12 cykli na sekundę, czyli o
częstotliwości od 8 do 12 herców (Hz). Amplituda tych fal jest stosunkowo duża i waha się
od 20 do 60 mikrowoltów (µV). Fale alfa są charakterystyczne dla stanu relaksacji, tzn.
można je zaobserwować wówczas, gdy osoba badana jest odprężona i ma zamknięte oczy. W
stanie pobudzenia, podczas aktywnego odbioru i przekazywania informacji, pojawiają się fale
beta, o większej częstotliwości (od 12 do 30 Hz), ale o mniejszej amplitudzie, od 2 do 20 µV
(Herrmann i in., 2005).
Druga metoda analizy sygnału EEG polega na wielokrotnym eksponowaniu osobie
badanej określonych bodźców. Najczęściej bodźce te różnią się między sobą pewnymi
właściwościami lub też osobie badanej przekazywania jest instrukcja dotycząca odmiennego
reagowania na różne bodźca. Następnie uśrednia się zapis EEG oddzielnie dla
poszczególnych kategorii bodźców. Metoda uśredniania opiera się na założeniu, że na
sumaryczną aktywność ludzkiego mózgu (a więc na sumaryczny sygnał EEG zbierany przez
elektrody) nakładają się specyficzne wzorce aktywności związane z przetwarzaniem
określonych bodźców. Uśrednianie sygnału dla wielu prób spowoduje więc zacieranie się
sumarycznego, niespecyficznego sygnału i wysuwanie się na pierwszy plan sygnału
specyficznego, związanego z przetwarzaniem określonych bodźców.
Jednym z najprostszych przykładów zastosowania tej metody w praktyce jest
eksperyment, w którym osobie badanej na monitorze wyświetlane są dwa rodzaje bardzo
prostych bodźców (kółka i krzyżyki), przy czym 80% wszystkich prób stanowią kółka, a 20%
- krzyżyki. Zadaniem osoby badanej jest reagowanie na ekspozycję krzyżyków poprzez
naciśnięcie klawisza oraz powstrzymywanie się od jakiejkolwiek reakcji podczas ekspozycji
kółek. Uśrednienie sygnału EEG oddzielnie dla kółek i oddzielnie dla krzyżyków oraz
nałożenie na siebie wykresów obydwu fal prowadzi do wniosku, że ok. 300 milisekund po
ekspozycji bodźca reakcja ludzkiego mózgu cechuje się o wiele wyższą amplitudą w
przypadku krzyżyków niż w przypadku kółek. Takie specyficzne wychylenie fali nazywa się
załamkiem, komponentem lub potencjałem wywołanym. Jaśkowski (2009) proponuje
nazwę potencjał skorelowany ze zdarzeniem, aby uwypuklić fakt, że przyczyną wychylenia
fali jest zawsze określone zdarzenie (w powyższym przykładzie jest to reakcja ruchowa na
krzyżyk). Poszczególne komponenty identyfikowane w różnych eksperymentach mają swoje
nazwy, które są pochodną kierunku wychylenia fali (amplituda dodatnia lub ujemna) oraz
czasu pojawienia się wychylenia. W powyższym przykładzie mamy do czynienia z
komponentem P300, ponieważ jego amplituda jest dodatnia (pozytywna) i pojawia się on ok.
300 ms po ekspozycji bodźca (Luck, 2005).
W wielu innych eksperymentach identyfikuje się potencjały wywołane, które
odzwierciedlają bardziej złożone procesy poznawcze. Przykładem może być komponent
N400 związany z przetwarzaniem materiału semantycznego. Jego odkrywcami byli Marta
Kutas i Steven Hillyard, a wyniki ich badań w tym zakresie opublikował prestiżowy magazyn
Science w 1980 r. Badacze zaprojektowali eksperyment, w którym na ekranie monitora
wyświetlały się pojedyncze słowa, które układały się w jakieś sensowne zdanie (np. „Pizza”;
„była”; „zbyt”; „gorąca”; „żeby”). Kluczowym elementem była ekspozycja ostatniego słowa,
które albo dopełniało sens zdania (np. „jeść”), albo łamało ten sens i czyniło całą
dotychczasową sekwencję słów niezrozumiałą (np. „płakać”). Następnie uśredniano sygnał
EEG z wielu równoważnych prób, ale tylko w odpowiedzi na ekspozycję ostatniego słowa w
każdej sekwencji. Przedmiotem porównania były załamki fali EEG powstające w odpowiedzi
na słowa dopełniające sensowny sens zdania oraz powstające w odpowiedzi na słowa łamiące
ten sens. Okazało się, że ok. 400 ms po ekspozycji bodźca amplituda komponentu dla słów
łamiących semantyczny sens sekwencji słów cechuje się o wiele większym wychyleniem w
kierunku wartości ujemnych (stąd określenie tego komponentu jako N400). Autorzy
interpretują uzyskane wyniki jako przejaw procesu umysłowego, który zostaje uruchomiony
w sytuacji wysokiej niespójności występującej po stronie spostrzeganych bodźców (Kutas i
Hillyard, 1980). Co więcej, w przeciwieństwie do poprzedniego eksperymentu, w którym
przedmiotem zainteresowania była prosta reakcja ruchowa, tutaj pojawia się element
rozumienia materiału semantycznego. Oznacza to, że metoda ERP może być wykorzystywana
do rejestracji znacznie bardziej skomplikowanych procesów umysłowych.
3. Metoda potencjałów wywołanych w badaniach nad pamięcią człowieka
Szczególną rolę metoda ERP odgrywa w eksperymentalnych badaniach nad pamięcią
człowieka. W tym obszarze jest ona stosowana już od końca lat 70. XX wieku (Rugg i
Curran, 2007). To wtedy pojawiły się pierwsze doniesienia, że uśrednione załamki EEG
cechują się większa amplitudą w przypadku kodowania słów, które później są poprawnie
rozpoznawane niż w przypadku słów, które w teście rozpoznawania są poprawnie odrzucane
(czyli osoba podejmuje prawidłową decyzję stwierdzając, że dane słowo nie występowało w
fazie uczenia się). Istnieje też szeroki nurt badań, w którym identyfikuje się różnice w
amplitudzie komponentów podczas kodowania słów w zależności od tego, czy słowa te będą
później poprawnie pamiętane, czy też zostaną zapomniane (Wagner, Koutstaal i Schacter,
1999). W innych badaniach przedmiotem zainteresowania są bardziej podstawowe
charakterystyki
zapamiętywanego
materiału,
np.
konkretność/abstrakcyjność
słów
(Tolentiono i Tokowicz, 2009), ich długość lub częstość występowania w języku (Hauk i
Pulvermüller, 2004).
Aby zaobserwować znaczenie metody ERP w eksperymentach nad pamięcią, warto
bliżej przyjrzeć się badaniom poświęconym procesom znajomości i pamiętania. Są to dwa
różne procesy, choć obydwa prowadzą do tego samego efektu, czyli przypominania sobie
jakiejś informacji na etapie rozpoznawania. Proces znajomości (familiarity) opiera się na
ogólnym odczuciu, że dana informacja (np. pojedyncze słowo) występujące w teście
rozpoznawania było nam prezentowane wcześniej, na etapie uczenia się. Temu poczuciu
znajomości nie towarzyszą jednak żadne bardziej szczegółowe wspomnienia. Osoba badana
nie jest w stanie przypomnieć sobie detali lub kontekstu, w którym zapamiętywała daną
informację. W swoich decyzjach pamięciowych opiera się wyłącznie na zgeneralizowanym
poczuciu znajomości. Z kolei proces pamiętania (recollection) bazuje na wyrazistych
wspomnieniach, bogatych w szczegółowe charakterystyki zapamiętanych informacji. Osoba
badana potrafi przytoczyć pewne detale dotyczące materiału, który był przedmiotem uczenia
się, jest również w stanie przypomnieć sobie kontekst zapamiętywania.
W wielu psychologicznych badaniach nad procesami znajomości i pamiętania, w
których nie wykorzystywano metody ERP, bazowano tylko na wskaźnikach behawioralnych,
takich jak czas reakcji czy poprawność odpowiedzi. W eksperymentach takich osoby badane
były najpierw uczone, co to znaczy, że ich decyzja pamięciowa może być zaklasyfikowana
jako przejaw procesu znajomości lub pamiętania. Następnie badani sami dokonywali oceny
swoich wspomnień i zaliczali je albo do kategorii „wiem” (know; odpowiednik procesu
znajomości), albo do kategorii „pamiętam” (remember; odpowiednik procesu pamiętania).
Twórcą takiej metody klasyfikowania stanów pamięciowych (remember/know judgments) jest
wybitny psycholog Endel Tulving (Tulving, 2002). Zastosowanie metody ERP w badaniach
nad procesami znajomości i pamiętania pozwala oderwać się od subiektywizmu ocen
dokonywanych przez osoby badane i wnioskować o przebiegu różnych procesów
pamięciowych na podstawie obiektywnych wskaźników neurofizjologicznych.
Przyjrzyjmy się badaniom własnym, które stanowią rozszerzoną replikację
klasycznych już badań Tima Currana (Curran, 2000). W eksperymencie pierwszym (Stróżak,
2010) 26 osób oceniło 744 polskie rzeczowniki pod kątem tego, czy są to rzeczowniki
konkretne,
czy
abstrakcyjne.
Na
podstawie
odpowiedzi
badanych
wybrano
288
rzeczowników, z których połowa osiągnęła najwyższą zgodność ocen co do ich konkretności,
a druga połowa – najwyższą zgodność ocen co do ich abstrakcyjności. W eksperymencie
drugim 17 osób zapamiętywało te 288 słów, a następnie wykonywało test rozpoznawania
(eksperyment drugi składał się z 6 części rozdzielonych przerwami, każda część składała się z
48 słów do zapamiętania i 72 słów do rozpoznania). Połowa zapamiętywanych słów była
rzeczownikami w liczbie pojedynczej, a połowa – rzeczownikami w licznie mnogiej. Niektóre
słowa z etapu zapamiętywania pojawiała się ponownie na etapie rozpoznawania, ale w innej
liczbie (np. na etapie zapamiętywania pojawiło się słowo „kwiat”, a na etapie rozpoznawania
słowo „kwiaty”). Osobom badanym przekazano instrukcję, że w takiej sytuacji mają uznać
dane słowo za nie występujące na etapie zapamiętywania. W teście rozpoznawania pojawiały
się również słowa zupełnie inne od tych prezentowanych wcześniej, które były najczęściej
poprawnie odrzucane, czyli osoby badane poprawnie stwierdzały, że słowa te nie pojawiły się
na etapie zapamiętywania. Osoby badane, które wzięły udział w eksperymencie drugim,
zadanie eksperymentalne wykonywały z jednoczesnym zastosowaniem 128-kanałowego
zestawu EEG do rejestracji i analizy potencjałów wywołanych (wszystkie badania
przeprowadzono w Laboratorium Psychoneurofizjologicznym, działającym przy Katedrze
Psychologii Eksperymentalnej w KUL).
Okazało się, że na etapie rozpoznawania, w przypadku części słów, których liczba
została zmieniona, badani popełniali błędy fałszywych wspomnień; np. błędnie uznawali, że
słowo „kwiaty” występowało na etapie zapamiętywania (podczas gdy tak naprawdę było to
słowo „kwiat”). Interesujące obserwacje przyniosło porównanie potencjałów wywołanych,
otrzymanych poprzez uśrednianie zapisu EEG oddzielnie dla prawdziwych wspomnień,
fałszywych wspomnień oraz poprawnych odrzuceń. Okazało się, że od 400 do 800 ms po
ekspozycji słowa w teście rozpoznawania amplituda potencjałów wywołanych jest bardzo
podobna zarówno dla prawdziwych, jak i fałszywych wspomnień. Amplituda ta różni się
jednak znacznie od amplitudy potencjału towarzyszącego poprawnym odrzuceniom (patrz:
Rys. 1). Oznacza to, że na wczesnym etapie podejmowania decyzji pamięciowych nie ma
różnicy między procesami umysłowymi, które kryją się za powstawaniem prawdziwych i
fałszywych wspomnień. Efekt ten jest neurofizjologicznym wskaźnikiem przebiegu procesu
znajomości (familiarity). Jeżeli siła procesu umysłowego jest identyczna dla prawdziwych i
fałszywych wspomnień możemy wnioskować, że proces ten odpowiada za ogólne poczucie
znajomości. Fałszywym wspomnieniom nie może towarzyszyć przypominanie sobie
szczegółowych informacji, są to bowiem błędy pamięciowe powstające w oparciu o złudne
odczucie podobieństwa między tym, co sobie przypominamy, a tym, co w rzeczywistości
zapamiętaliśmy.
Różnice w przebiegu procesów pamięciowych można jednak zaobserwować na nieco
późniejszym etapie przetwarzania informacji, od 500 do 1200 ms po ekspozycji bodźca.
Wtedy amplituda potencjału wywołanego dla prawdziwych wspomnień jest wyraźnie
odmienna od amplitudy dla fałszywych wspomnień, przy czym ta ostatnia nie różni się od
amplitudy potencjału towarzyszącego poprawnym odrzuceniom (patrz: Rys. 2). Ten efekt jest
z kolei odzwierciedleniem procesu pamiętania (recollection). Siła procesu umysłowego jest
wyraźnie wyższa tylko w przypadku prawdziwych wspomnień, ponieważ tylko takim
decyzjom może towarzyszyć wydobywanie z pamięci szczegółowych informacji.
Rys. 1. Efekt znajomości (familiarity) widoczny na uśrednionym zapisie fal ERP. Od 400 do 800 ms po
ekspozycji bodźca aktywność mózgu jest podobna dla prawdziwych i fałszywych wspomnień, a inna
dla poprawnych odrzuceń. Zapis pochodzi z elektrody F3 w okolicy czołowej czaszki (źródło: badania
własne).
Rys. 2. Efekt pamiętania (recollection) widoczny na uśrednionym zapisie fal ERP. Od 500 do 1200 ms
po ekspozycji bodźca aktywność mózgu jest podobna dla fałszywych wspomnień i poprawnych
odrzuceń, a inna dla prawdziwych wspomnień. Zapis pochodzi z elektrody P3 w okolicy ciemieniowej
czaszki (źródło: badania własne).
4. Podsumowanie
Opisane powyżej zależności świadczą o tym, że za pomocą metody ERP możemy
dotrzeć do obiektywnych wskaźników neurofizjologicznych, które umożliwiają precyzyjne
rozróżnienie między procesami umysłowymi prowadzącymi do powstawania prawdziwych i
fałszywych wspomnień. Oznacza to, że metoda mózgowych potencjałów wywołanych niesie
możliwość wykorzystania jej w praktyce, wszędzie tam, gdzie wnioskowanie o sile i
przebiegu różnych procesów pamięciowych ma znaczenie aplikacyjne. W wielu badaniach
wykorzystujących metodę ERP zmierza się do zidentyfikowania specyficznych wzorców
neuronalnej aktywności, które są charakterystyczne dla osób cierpiących na zaburzenia
pamięci. Celem tych badań jest min. stworzenie metod do diagnozy łagodnych zaburzeń
poznawczych i wczesnych stadiów choroby Alzheimera. Wyniki pierwszych badań w tym
obszarze są obiecujące. Frodl i in. (2002) dowodzą, że amplituda komponentu P300 jest
wyraźnie obniżona u osób cierpiących na chorobą Alzheimera w porównaniu do osób z
łagodnymi zaburzeniami poznawczymi oraz osób zdrowych. Szeroki przegląd innych badań
podejmujących tę tematyką proponują Jackson i Snyder (2008).
Podsumowując, należy stwierdzić, że metoda mózgowych potencjałów wywołanych
jest doskonałym narzędziem umożliwiającym pomiar aktywności ludzkiego mózgu,
znajdującym szerokie zastosowanie we współczesnej neuronauce poznawczej. Nie należy
zapominać oczywiście o pewnych ograniczeniach tej metody. Do najważniejszych z nich
zalicza się niska rozdzielczość przestrzenna uzyskiwanych danych. Oznacza to, że na
podstawie sygnału EEG zbieranego z elektrod umieszczonych na czaszce trudno jest
wnioskować o źródle tego sygnału, czyli o tym, jaka dokładnie struktura mózgu odpowiada za
interesujący nas proces umysłowy. Wnioskowanie tego typu umożliwiają bardziej
zaawansowane metody, zwłaszcza funkcjonalny rezonans magnetyczny (fMRI). Dynamiczny
rozwój metody ERP, jak również oprogramowania służącego do obróbki i analizy
uzyskiwanego sygnału, pozwalają jednak na przełamywanie tego typu ograniczeń. Ponadto,
technika potencjałów wywołanych pozostaje metodą nieinwazyjną dla osób badanych i
relatywnie tanią (w porównaniu np. do fMRI), co stwarza możliwości szerokiego jej
wykorzystania w praktyce, zwłaszcza w diagnostyce zaburzeń pamięci.
Bibliografia
Curran, T. (2000). Brain potentials of recollection and familiarity. Memory, 28, 923-938.
Frodl, T., Hampel, H., Juckel, G., Bürger, K., Padberg, F., Engel. R. R., Möller, H. J., Hegerl, U. (2002). Value
of event-related P300 subcomponents in the clinical diagnosis of mild cognitive impairment and Alzheimer's
Disease. Psychophysiology, 39, 175-181.
Hauk, O., Pulvermüller, F. (2004). Effects of word length and frequency on the human event-related potential.
Clinical Neuropsychology, 115, 1090-1103.
Herrmann, C. S., Grigutsch, M., Busch, N. A. (2005). EEG oscillations and wavelet analysis. W: T. C. Handy,
(red.), Event-Related Potentials. A Methods Handbook. (s. 229-259). Cambridge, Massachusetts: MIT Press.
Jackson, C. E., Snyder, P. J. (2008). Electroencephalography and event-related potentials as biomarkers of mild
cognitive impairment and mild Alzheimer’s disease. Alzheimer’s and Dementia, 4, 137-143.
Jaśkowski, P. (2009). Neuronauka poznawcza. Jak mózg tworzy umysł. Warszawa: Vizja Press&IT.
Kutas, M., Hillyard, S. A. (1980). Reading senseless sentences: Brain potentials reflect semantic incongruity.
Science, 207, 203-205.
Longstaff, A. (2002). Neurobiologia. Krótkie wykłady. Warszawa: Wydawnictwo Naukowe PWN.
Luck, S. J. (2005). An Introduction to Event-Related Potential Technique. Cambridge, Massachussets: MIT
Press.
Rugg, M. D., Curran, T. (2007). Event-related potentials and recognition memory. Trends in Cognitive Sciences,
11, 251 – 257.
Stróżak, P. (2010). The encoding and false recognition of common and abstract nouns. An event-related
potentials (ERP) study. Poster zaprezentowany podczas International Neuropsychological Society Mid-Year
Meeting w Krakowie.
Tolentino, L. C., Tokowicz, N. (2009). Are pumpkins better than heaven? An ERP investigation of order effects
in the concrete-word advantage. Brain & Language, 110, 12-22.
Tulving, E. (2002). Episodic memory: from mind to brain. Annual Review of Psychology, 53, 1-25.
Wagner, A.D., Koutstaal, W., Schacter, D.L. (1999). When encoding yields remembering: Insights from eventrelated neuroimaging. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences,
354, 1307–1324.

Podobne dokumenty