Zastosowanie wielowymiarowej analizy danych w

Transkrypt

Zastosowanie wielowymiarowej analizy danych w
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
ZASTOSOWANIE WIELOWYMIAROWEJ ANALIZY DANYCH
W BADANIU WPŁYWU RÓŻNYCH CZYNNIKÓW
NA AKTYWNOŚĆ ALDH W ŚLINIE
Joanna Giebułtowicz, Zakład Bioanalizy i Analizy Leków,
Wydział Farmaceutyczny, Warszawski Uniwersytet Medyczny
Celem badań było opisanie wpływu różnych czynników środowiskowych na aktywność
ślinowej ALDH oraz oszacowanie przydatności tego enzymu jako samodzielnego
wskaźnika diagnostycznego raka jamy ustnej.
Aldehydy — właściwości i występowanie
Aldehydy ze względu na swoją wysoką reaktywność są związkami potencjalnie szkodliwymi, a niektóre z nich mają udowodnioną cytotoksyczność, genotoksyczność, mutagenność
lub kancerogenność. Występują one dosyć powszechnie w środowisku, najczęściej w niewielkich stężeniach. Stanowią dodatki smakowo-zapachowe, zanieczyszczenia bądź naturalne składniki żywności, a także powstają w procesach jej przetwarzania (np. aldehyd
anyżowy, cytral, wanilina, nonanal, aldehyd cynamonowy, formaldehyd, aldehyd dimalonowy). Są także składnikami kosmetyków, środków myjących, leków, mebli, dywanów,
tkanin, farb, spalin (np. formaldehyd, acetaldehyd) oraz emitowane są do środowiska przez
przemysł, pożary lasów czy łąk [1].
Aldehydy powstają także w organizmie człowieka w wyniku przemian chemicznych endogennych i egzogennych prekursorów, np. aminokwasów, węglowodanów, lipidów, amin
(w tym biogennych), witamin [2]. Około 200 różnych aldehydów powstaje w procesie
peroksydacji lipidów.
ALDH — rola w jamie ustnej
Najważniejszymi enzymami metabolizującymi aldehydy są S-transferaza glutationowa
i dehydrogenaza aldehydowa (ALDH).
ALDH3A1 jest jedynym izoenzymem dehydrogenazy aldehydowej wykrytym w ślinie.
Może on pełnić pewną rolę m.in. w ochronie jamy ustnej przed aldehydami występującymi
Copyright © StatSoft Polska 2012
www.statsoft.pl/czytelnia.html
35
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
w pokarmie czy powstającymi w jamie ustnej na skutek stresu oksydacyjnego, zapobiegając tym samym rozwojowi raka jamy ustnej [3-6].
ALDH jest enzymem bardzo podatnym na utlenianie, nawet tlenem z powietrza. W ślinie
w około 70% występuje w postaci utlenionej. Postać ta jest nieaktywna katalitycznie.
W warunkach in vitro dodatek tioli, takich jak ditiotreitol (DTT), powoduje reaktywację
enzymu [7]. Procent enzymu występujący w postaci utlenionej zwany jest procentem lub
stopniem inaktywacji, a aktywność enzymu w środowisku DTT— aktywnością całkowitą
enzymu.
Wyodrębnianie grup różniących się aktywnością ALDH
Metody eksploracyjnej analizy danych wydają się być bardzo przydatne, szczególnie
w badaniach biologicznych, gdzie spotykamy się z dużą zmiennością międzyosobniczą
i dużą liczbą czynników na nią wpływających. Metody te pozwalają między innymi opisać
strukturę próby badanej i jej podgrup, wykryć czynniki, które wpływają na zmienność
analizowanych danych w próbie, oraz wskazać kierunek dalszych badań.
Materiał do niniejszych badań stanowiła ślina mieszana 118 osób. Dodatkowo od osób tych
zbierano dane obejmujące liczbę wypijanych filiżanek kawy i jednostek alkoholu oraz
liczbę wypalonych papierosów w tygodniu poprzedzającym badanie, a także: wiek, płeć,
zażywane leki, choroby metaboliczne i inne.
Osoby wchodzące w skład badanej próby grupowano pod względem aktywności ślinowej
ALDH (aktywność całkowita [U/g], inaktywacja [%]), wykorzystując metodę Warda. Wyniki przedstawiono na rys. 1.
Odległ. euklidesowa
45
40
35
Odległość wiąz.
30
25
20
15
10
5
0
Rys. 1. Dendrogram dla aktywności ALDH (całkowita aktywność [U/g] i inaktywacja [%])
w próbie badanej.
36 www.statsoft.pl/czytelnia.html
Copyright © StatSoft Polska 2012
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
W toku analizy z badanej grupy wyodrębniono cztery podgrupy. Standaryzowane aktywności w poszczególnych podgrupach przedstawiono na rys. 2. Podgrupa 1 charakteryzowała się przeciętną aktywnością całkowitą i procentem inaktywacji enzymu, podgrupa 2
przeciętną aktywnością całkowitą i niższym niż przeciętny procentem inaktywacji, podgrupa 3 wyższą niż przeciętna aktywnością całkowitą i przeciętnym procentem inaktywacji,
podczas gdy podgrupa 4 niższą niż przeciętna aktywnością całkowitą i wyższym niż
przeciętny procentem inaktywacji enzymu.
3
2
1
0
-1
-2
1
2
3
4
Skupienie
standaryzowana aktywność całkowita ALDH3A1 [U/g]
standaryzowana inaktywacja ALDH3A1 [%]
Rys. 2. Średnie i błędy standardowe standaryzowanych aktywności całkowitych ALDH [U/g]
i inaktywacji [%] w czterech skupieniach, powstałych metodą k-średnich.
Wyodrębnianie czynników wpływających na aktywność ALDH
W następnym kroku analizy badano zależności pomiędzy przynależnością do podgrup,
a występowaniem pewnych czynników, o które pytano w ankiecie. W tym opracowaniu
przedstawiony zostanie jedynie fragment dotyczący takich czynników, jak palenie
papierosów oraz picie kawy i alkoholu.
Osoby pijące powyżej 7 jednostek alkoholu na tydzień opisano, jako osoby pijące dużo
alkoholu. Jedna jednostka odpowiadała około 20 g czystego etanolu. Osoby pijące powyżej
10 kaw tygodniowo oznaczono, jako osoby pijące dużo kawy, a palące więcej niż 4 paczki
papierosów tygodniowo — jako palące dużo.
Zależność pomiędzy przynależnością do podgrup a paleniem papierosów, piciem alkoholu
i kawy badano z wykorzystaniem analizy korespondencji, a wyniki przedstawiono na
rys. 3. Redukcja przestrzeni wielowymiarowej do trójwymiarowej pozwoliła na wyjaśnienie 56% całkowitej bezwładności.
Copyright © StatSoft Polska 2012
www.statsoft.pl/czytelnia.html
37
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
W ykre s 2 W w s p ó ł rzę d n yc h ko l u m n ; w ym i a r
1 x 2
2 ; W . w ła s n a : ,3 2 5 7 6 (1 4 ,4 8 % b e z w ła d n . )
-0 ,5
W y m ia r
1 ,5
-1 ,0
ka w a :d u żo
1 ,0
p a p i e ro s y:d u żo
GR U P A :2
a l ko h o l :d u żo
GR U P A :3
0 ,5
a l ko h o l :n i e
GR U P A :4
p a p i e ro s y:n i e
0 ,0
ka w a :m a ł o
ka w a :n i e
a l ko h o l :m a ł o
GR U P A :1
p a p i e ro s y:m a ł o
-1 ,5
-1 ,5
-1 ,0
-0 ,5
0 ,0
W ym i a r
0 ,5
1 ,0
1 ,5
2 ,0
1 ; W . w ł a s n a : ,4 2 8 4 6 (1 9 ,0 4 % b e zw ł a d n . )
W ykre s 2 W w s p ó ł rzę d n yc h ko l u m n ; w ym i a r
1 x 3
3 ; W . w ła s n a : ,2 7 6 8 4 (1 2 ,3 0 % b e z w ła d n . )
1 ,5
1 ,0
GR U P A :4
a l ko h o l :m a ł o
ka w a :d u żo
0 ,5
ka w a :m a ł o
p a p i e ro s y:d u żo
p a p i e ro s y:n i e
0 ,0
GR U P A :1
a l ko h o l :n i e
a l ko h o l :d u żo
-0 ,5
W y m ia r
ka w a :n i e
p a p i e ro s y:m a ł o
GR U P A :3
-1 ,0
GR U P A :2
-1 ,5
-1 ,5
-1 ,0
-0 ,5
0 ,0
W ym i a r
0 ,5
1 ,0
1 ,5
2 ,0
1 ; W . w ł a s n a : ,4 2 8 4 6 (1 9 ,0 4 % b e zw ł a d n . )
W ykre s 2 W w s p ó ł rzę d n yc h ko l u m n ; w ym i a r
2 x 3
W y m ia r
3 ; W . w ła s n a : ,2 7 6 8 4 (1 2 ,3 0 % b e z w ła d n . )
1 ,5
1 ,0
GR U P A :4
a l ko h o l :m a ł o
ka w a :d u żo
0 ,5
ka w a :m a ł o
p a p i e ro s y:d u żo
p a p i e ro s y:n i e
0 ,0
-0 ,5
GR U P A :1
a l ko h o l :n i e
a l ko h o l :d u żo
p a p i e ro s y:m a ł o
ka w a :n i e
GR U P A :3
-1 ,0
GR U P A :2
-1 ,5
-1 ,5
-1 ,0
-0 ,5
W ym i a r
0 ,0
0 ,5
1 ,0
1 ,5
2 ; W . w ł a s n a : ,3 2 5 7 6 (1 4 ,4 8 % b e zw ł a d n . )
Rys. 3. Połączone wykresy dwuwymiarowe powstałe z rozbicia wykresu 3W współrzędnych
kolumn (podgrupa (skupienie), status palenia papierosów, picia alkoholu i kawy) uzyskanego
metodą analizy korespondencji. Zmienne określające jedną kategorię (np. alkohol) połączono
linią tak, aby kody grupujące były uszeregowane (np. nie, mało, dużo).
38 www.statsoft.pl/czytelnia.html
Copyright © StatSoft Polska 2012
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
Metoda analizy korespondencji służyła zobrazowaniu relacji między różnymi zmiennymi
i stanowiła element wyjściowy do dalszych analiz. Dlatego też czasami, mimo stosunkowo
małego procentu wyjaśnianej bezwładności, nie decydowano się na zwiększenie liczby
wymiarów powyżej trzech.
Analizując wzajemne położenie punktów na wykresie korespondencji można m.in. zauważyć, że istnieje tendencja do współwystępowania kategorii: palący duże ilości papierosów
i kategorii: Grupa 3 oraz kategorii: niepalący, niepijący kawy, niepijący alkoholu i kategorii Grupa 2 i Grupa 4.
Statystycznie istotna różnica pod względem ilości wypalanych tygodniowo papierosów
wystąpiła pomiędzy podgrupą 3 a 4 (p=0,0038). W podgrupie 1 wystąpiło największe średnie spożycie alkoholu i najmniejsze średnie spożycie kawy. W podgrupie 3 najmniejszy był
procentowy udział osób pijących alkohol, a największy pijących kawę i palących papierosy. Średnia ilość wypalonych papierosów była w tej podgrupie największa (p=0,02568
dla 1; p=0,00762 dla 2; p=0,00025 dla 4 podgrupy). Najmniej papierosów w tygodniu
poprzedzającym badanie wypaliły osoby z podgrupy 4.
Wpływ wybranych czynników na aktywność ALDH
W wyniku kilku analiz statystycznych (nie zamieszczonych w tym opracowaniu) stwierdzono, że najsilniejszy wpływ na aktywność ALDH ma: wiek, picie kawy, alkoholu oraz
palenie papierosów.
W celu zbadania zakresu i kierunku zależności pomiędzy grupami zmiennych (aktywność
całkowita, procent inaktywacji) oraz (liczba wypalonych papierosów, ilość wypitego alkoholu, ilość wypitej kawy, wiek) posłużono się analizą kanoniczną. Tylko pierwsza zmienna
kanoniczna okazała się statystycznie istotna (p=0,00021).
Tabela 2.Wyniki analizy kanonicznej.
Zmienne kanoniczne
Zmienne jednego zbioru
U1
U2
Wiek
-0,65
-0,51
Ilość wypitego alkoholu
0,36
-0,34
[jednostki/tydz]
Ilość wypitej kawy [jednostki/tydz]
-0,02
-0,63
Liczba wypalonych papierosów
0,58
-0,11
[paczki/tydz]
0,20
0,48
Korelacje kanoniczne
(p=0,00021)
(p=0,25159)
8,20%
Redundancja całkowita
6,9%
1,3%
Redundancje drugiego zbioru
Zmienne kanoniczne
Zmienne drugiego zbioru
V1
V2
Procent inaktywacji ALDH
-0,11
-1,02
Całkowita aktywność ALDH
0,97
-0,32
Copyright © StatSoft Polska 2012
www.statsoft.pl/czytelnia.html
39
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
Wyniki analizy kanonicznej przedstawiono w tabeli 2, a wykres rozrzutu dla pierwszej
korelacji kanonicznej na rys. 4. Wartość redundancji całkowitej jest mała, co sugeruje, że
należałoby w modelu uwzględnić dodatkowe zmienne.
4
3
2
V1
1
0
-1
-2
-3
-3
-2
-1
0
1
2
3
U1
Rys. 4. Wykres rozrzutu pierwszej korelacji kanonicznej.
Analiza wykazała, że badane czynniki silniej niż na inaktywację wpływają na aktywność
całkowitą enzymu. Najwyraźniej zaznaczał się wpływ wieku i palenia. Na procent
inaktywacji najsilniej wpływała ilość wypitej kawy w tygodniu poprzedzającym badanie.
Na rys. 5 i 6 przedstawiono zależności pomiędzy całkowitą aktywnością ALDH w ślinie
i zmiennymi niezależnymi, które najsilniej na nią wpływają: wiekiem, liczbą wypalonych
papierosów i ilością wypitego alkoholu w tygodniu poprzedzającym badanie.
Rys. 5. Zależność całkowitej aktywności ALDH w ślinie od wieku i ilości wypitego
alkoholu w tygodniu poprzedzającym badanie.
40 www.statsoft.pl/czytelnia.html
Copyright © StatSoft Polska 2012
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
Rys. 6. Zależność całkowitej aktywności ALDH w ślinie od ilości wypitego alkoholu
i liczby wypalonych papierosów w tygodniu poprzedzającym badanie.
ALDH - wskaźnik diagnostyczny raka jamy ustnej?
Materiałem do badań była ślina pacjentów z nowotworami i torbielami jamy ustnej.
Aktywność ślinowej ALDH zbadano u 173 osób w tym: 59 osób z rakami płaskonabłonkowymi jamy ustnej, 74 osób z torbielami zębopochodnymi, 11 osób
z zębopochodnym guzem keratocystycznym, 23 osoby z innymi nowotworami łagodnymi
jamy ustnej (szkliwiaki, zębiaki, guzy z komórek ziarnistych, nadziąślaki, śluzaki zębopochodne). Grupę kontrolną stanowiło 116 osób zdrowych.
Celem tej analizy było określenie przydatności całkowitej aktywności ALDH w ślinie jako
samodzielnego wskaźnika diagnostycznego umożliwiającego przyporządkowanie osoby
badanej do dwóch klas: 1) chory na raka jamy ustnej, 2) chory z inną patologią jamy ustnej
lub zdrowy. Wartość AUC dla badanego modelu wynosiła 0,823 (SE=0,036). Optymalnym
punktem odcięcia wybrano 0,708 U/g. Punkt ten cechował się czułością 0,57
i specyficznością 0,90.
Analiza wykazała, że całkowita aktywność ślinowej ALDH może być predyktorem raka
jamy ustnej, jednak wnioskowanie na podstawie tylko tego wskaźnika jest niepolecane ze
względu na niską czułość testu. Należy zatem poszukać większej liczby predyktorów
(np. wiek, stężenie neutrofili) w celu stworzenia dokładniejszych reguł decyzyjnych oraz
przeprowadzić dodatkowe analizy na większej grupie badanych.
Copyright © StatSoft Polska 2012
www.statsoft.pl/czytelnia.html
41
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl
Wykres ROC
1,0
Czulosc
0,8
0,6
0.708
0,4
0,2
0,0
0,0
0,2
0,4
0,6
0,8
1,0
1-Specyficznosc
Rys. 7. Krzywa ROC opisująca przydatność całkowitej aktywności ślinowej ALDH
jako predyktora raka jamy ustnej.
Literatura
1. Feron VJ, Til HP, de Vrijer F, Woutersen RA, Cassee FR, van Bladeren PJ. Aldehydes:
occurrence, carcinogenic potential, mechanism of action and risk assessment. Mutation
Research/Genetic Toxicology. 1991;259(3–4):363-385.
2. O’Brien PJ, Siraki AG, Shangari N. Aldehyde sources, metabolism, molecular toxicity
mechanisms, and possible effects on human health. Crit Rev Toxicol. 2005; 35(7):63.
3. Esterbauer H, Schaur RJ, Zollner H. Chemistry and biochemistry of 4-hydroxynonenal,
malonaldehyde and related aldehydes. Free Radical Biology and Medicine.
1991;11(1):81-128.
4. Lassen N, Bateman JB, Estey T, Kuszak JR, Nees DW, Piatigorsky J, et al. Multiple
and Additive Functions of ALDH3A1 and ALDH1A1. Journal of Biological
Chemistry. 2007 August 31, 2007;282(35):25668-25676.
5. Pappa A, Estey T, Manzer R, Brown D, Vasiliou V. Human aldehyde dehydrogenase
3A1 (ALDH3A1): biochemical characterization and immunohistochemical localization
in the cornea. Biochemical Journal. 2003;376(3):615-623.
6. Giebułtowicz J, Wolinowska R, Sztybor A, Pietrzak M, Wroczyński P, Wierzchowski
J. Salivary Aldehyde Dehydrogenase: Activity towards Aromatic Aldehydes and
Comparison with Recombinant ALDH3A1. Molecules. 2009;14(7):2363-2372.
7. Giebułtowicz J, Dziadek M, Wroczyński P, Woznicka K, Wojno B, Pietrzak M, et al.
Salivary aldehyde dehydrogenase - temporal and population variability, correlations
with drinking and smoking habits and activity towards aldehydes contained in food.
Acta Biochimica Polonica. 2010;57(3):361-368.
42 www.statsoft.pl/czytelnia.html
Copyright © StatSoft Polska 2012