Zastosowanie wielowymiarowej analizy danych w
Transkrypt
Zastosowanie wielowymiarowej analizy danych w
StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl ZASTOSOWANIE WIELOWYMIAROWEJ ANALIZY DANYCH W BADANIU WPŁYWU RÓŻNYCH CZYNNIKÓW NA AKTYWNOŚĆ ALDH W ŚLINIE Joanna Giebułtowicz, Zakład Bioanalizy i Analizy Leków, Wydział Farmaceutyczny, Warszawski Uniwersytet Medyczny Celem badań było opisanie wpływu różnych czynników środowiskowych na aktywność ślinowej ALDH oraz oszacowanie przydatności tego enzymu jako samodzielnego wskaźnika diagnostycznego raka jamy ustnej. Aldehydy — właściwości i występowanie Aldehydy ze względu na swoją wysoką reaktywność są związkami potencjalnie szkodliwymi, a niektóre z nich mają udowodnioną cytotoksyczność, genotoksyczność, mutagenność lub kancerogenność. Występują one dosyć powszechnie w środowisku, najczęściej w niewielkich stężeniach. Stanowią dodatki smakowo-zapachowe, zanieczyszczenia bądź naturalne składniki żywności, a także powstają w procesach jej przetwarzania (np. aldehyd anyżowy, cytral, wanilina, nonanal, aldehyd cynamonowy, formaldehyd, aldehyd dimalonowy). Są także składnikami kosmetyków, środków myjących, leków, mebli, dywanów, tkanin, farb, spalin (np. formaldehyd, acetaldehyd) oraz emitowane są do środowiska przez przemysł, pożary lasów czy łąk [1]. Aldehydy powstają także w organizmie człowieka w wyniku przemian chemicznych endogennych i egzogennych prekursorów, np. aminokwasów, węglowodanów, lipidów, amin (w tym biogennych), witamin [2]. Około 200 różnych aldehydów powstaje w procesie peroksydacji lipidów. ALDH — rola w jamie ustnej Najważniejszymi enzymami metabolizującymi aldehydy są S-transferaza glutationowa i dehydrogenaza aldehydowa (ALDH). ALDH3A1 jest jedynym izoenzymem dehydrogenazy aldehydowej wykrytym w ślinie. Może on pełnić pewną rolę m.in. w ochronie jamy ustnej przed aldehydami występującymi Copyright © StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 35 StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl w pokarmie czy powstającymi w jamie ustnej na skutek stresu oksydacyjnego, zapobiegając tym samym rozwojowi raka jamy ustnej [3-6]. ALDH jest enzymem bardzo podatnym na utlenianie, nawet tlenem z powietrza. W ślinie w około 70% występuje w postaci utlenionej. Postać ta jest nieaktywna katalitycznie. W warunkach in vitro dodatek tioli, takich jak ditiotreitol (DTT), powoduje reaktywację enzymu [7]. Procent enzymu występujący w postaci utlenionej zwany jest procentem lub stopniem inaktywacji, a aktywność enzymu w środowisku DTT— aktywnością całkowitą enzymu. Wyodrębnianie grup różniących się aktywnością ALDH Metody eksploracyjnej analizy danych wydają się być bardzo przydatne, szczególnie w badaniach biologicznych, gdzie spotykamy się z dużą zmiennością międzyosobniczą i dużą liczbą czynników na nią wpływających. Metody te pozwalają między innymi opisać strukturę próby badanej i jej podgrup, wykryć czynniki, które wpływają na zmienność analizowanych danych w próbie, oraz wskazać kierunek dalszych badań. Materiał do niniejszych badań stanowiła ślina mieszana 118 osób. Dodatkowo od osób tych zbierano dane obejmujące liczbę wypijanych filiżanek kawy i jednostek alkoholu oraz liczbę wypalonych papierosów w tygodniu poprzedzającym badanie, a także: wiek, płeć, zażywane leki, choroby metaboliczne i inne. Osoby wchodzące w skład badanej próby grupowano pod względem aktywności ślinowej ALDH (aktywność całkowita [U/g], inaktywacja [%]), wykorzystując metodę Warda. Wyniki przedstawiono na rys. 1. Odległ. euklidesowa 45 40 35 Odległość wiąz. 30 25 20 15 10 5 0 Rys. 1. Dendrogram dla aktywności ALDH (całkowita aktywność [U/g] i inaktywacja [%]) w próbie badanej. 36 www.statsoft.pl/czytelnia.html Copyright © StatSoft Polska 2012 StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl W toku analizy z badanej grupy wyodrębniono cztery podgrupy. Standaryzowane aktywności w poszczególnych podgrupach przedstawiono na rys. 2. Podgrupa 1 charakteryzowała się przeciętną aktywnością całkowitą i procentem inaktywacji enzymu, podgrupa 2 przeciętną aktywnością całkowitą i niższym niż przeciętny procentem inaktywacji, podgrupa 3 wyższą niż przeciętna aktywnością całkowitą i przeciętnym procentem inaktywacji, podczas gdy podgrupa 4 niższą niż przeciętna aktywnością całkowitą i wyższym niż przeciętny procentem inaktywacji enzymu. 3 2 1 0 -1 -2 1 2 3 4 Skupienie standaryzowana aktywność całkowita ALDH3A1 [U/g] standaryzowana inaktywacja ALDH3A1 [%] Rys. 2. Średnie i błędy standardowe standaryzowanych aktywności całkowitych ALDH [U/g] i inaktywacji [%] w czterech skupieniach, powstałych metodą k-średnich. Wyodrębnianie czynników wpływających na aktywność ALDH W następnym kroku analizy badano zależności pomiędzy przynależnością do podgrup, a występowaniem pewnych czynników, o które pytano w ankiecie. W tym opracowaniu przedstawiony zostanie jedynie fragment dotyczący takich czynników, jak palenie papierosów oraz picie kawy i alkoholu. Osoby pijące powyżej 7 jednostek alkoholu na tydzień opisano, jako osoby pijące dużo alkoholu. Jedna jednostka odpowiadała około 20 g czystego etanolu. Osoby pijące powyżej 10 kaw tygodniowo oznaczono, jako osoby pijące dużo kawy, a palące więcej niż 4 paczki papierosów tygodniowo — jako palące dużo. Zależność pomiędzy przynależnością do podgrup a paleniem papierosów, piciem alkoholu i kawy badano z wykorzystaniem analizy korespondencji, a wyniki przedstawiono na rys. 3. Redukcja przestrzeni wielowymiarowej do trójwymiarowej pozwoliła na wyjaśnienie 56% całkowitej bezwładności. Copyright © StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 37 StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl W ykre s 2 W w s p ó ł rzę d n yc h ko l u m n ; w ym i a r 1 x 2 2 ; W . w ła s n a : ,3 2 5 7 6 (1 4 ,4 8 % b e z w ła d n . ) -0 ,5 W y m ia r 1 ,5 -1 ,0 ka w a :d u żo 1 ,0 p a p i e ro s y:d u żo GR U P A :2 a l ko h o l :d u żo GR U P A :3 0 ,5 a l ko h o l :n i e GR U P A :4 p a p i e ro s y:n i e 0 ,0 ka w a :m a ł o ka w a :n i e a l ko h o l :m a ł o GR U P A :1 p a p i e ro s y:m a ł o -1 ,5 -1 ,5 -1 ,0 -0 ,5 0 ,0 W ym i a r 0 ,5 1 ,0 1 ,5 2 ,0 1 ; W . w ł a s n a : ,4 2 8 4 6 (1 9 ,0 4 % b e zw ł a d n . ) W ykre s 2 W w s p ó ł rzę d n yc h ko l u m n ; w ym i a r 1 x 3 3 ; W . w ła s n a : ,2 7 6 8 4 (1 2 ,3 0 % b e z w ła d n . ) 1 ,5 1 ,0 GR U P A :4 a l ko h o l :m a ł o ka w a :d u żo 0 ,5 ka w a :m a ł o p a p i e ro s y:d u żo p a p i e ro s y:n i e 0 ,0 GR U P A :1 a l ko h o l :n i e a l ko h o l :d u żo -0 ,5 W y m ia r ka w a :n i e p a p i e ro s y:m a ł o GR U P A :3 -1 ,0 GR U P A :2 -1 ,5 -1 ,5 -1 ,0 -0 ,5 0 ,0 W ym i a r 0 ,5 1 ,0 1 ,5 2 ,0 1 ; W . w ł a s n a : ,4 2 8 4 6 (1 9 ,0 4 % b e zw ł a d n . ) W ykre s 2 W w s p ó ł rzę d n yc h ko l u m n ; w ym i a r 2 x 3 W y m ia r 3 ; W . w ła s n a : ,2 7 6 8 4 (1 2 ,3 0 % b e z w ła d n . ) 1 ,5 1 ,0 GR U P A :4 a l ko h o l :m a ł o ka w a :d u żo 0 ,5 ka w a :m a ł o p a p i e ro s y:d u żo p a p i e ro s y:n i e 0 ,0 -0 ,5 GR U P A :1 a l ko h o l :n i e a l ko h o l :d u żo p a p i e ro s y:m a ł o ka w a :n i e GR U P A :3 -1 ,0 GR U P A :2 -1 ,5 -1 ,5 -1 ,0 -0 ,5 W ym i a r 0 ,0 0 ,5 1 ,0 1 ,5 2 ; W . w ł a s n a : ,3 2 5 7 6 (1 4 ,4 8 % b e zw ł a d n . ) Rys. 3. Połączone wykresy dwuwymiarowe powstałe z rozbicia wykresu 3W współrzędnych kolumn (podgrupa (skupienie), status palenia papierosów, picia alkoholu i kawy) uzyskanego metodą analizy korespondencji. Zmienne określające jedną kategorię (np. alkohol) połączono linią tak, aby kody grupujące były uszeregowane (np. nie, mało, dużo). 38 www.statsoft.pl/czytelnia.html Copyright © StatSoft Polska 2012 StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl Metoda analizy korespondencji służyła zobrazowaniu relacji między różnymi zmiennymi i stanowiła element wyjściowy do dalszych analiz. Dlatego też czasami, mimo stosunkowo małego procentu wyjaśnianej bezwładności, nie decydowano się na zwiększenie liczby wymiarów powyżej trzech. Analizując wzajemne położenie punktów na wykresie korespondencji można m.in. zauważyć, że istnieje tendencja do współwystępowania kategorii: palący duże ilości papierosów i kategorii: Grupa 3 oraz kategorii: niepalący, niepijący kawy, niepijący alkoholu i kategorii Grupa 2 i Grupa 4. Statystycznie istotna różnica pod względem ilości wypalanych tygodniowo papierosów wystąpiła pomiędzy podgrupą 3 a 4 (p=0,0038). W podgrupie 1 wystąpiło największe średnie spożycie alkoholu i najmniejsze średnie spożycie kawy. W podgrupie 3 najmniejszy był procentowy udział osób pijących alkohol, a największy pijących kawę i palących papierosy. Średnia ilość wypalonych papierosów była w tej podgrupie największa (p=0,02568 dla 1; p=0,00762 dla 2; p=0,00025 dla 4 podgrupy). Najmniej papierosów w tygodniu poprzedzającym badanie wypaliły osoby z podgrupy 4. Wpływ wybranych czynników na aktywność ALDH W wyniku kilku analiz statystycznych (nie zamieszczonych w tym opracowaniu) stwierdzono, że najsilniejszy wpływ na aktywność ALDH ma: wiek, picie kawy, alkoholu oraz palenie papierosów. W celu zbadania zakresu i kierunku zależności pomiędzy grupami zmiennych (aktywność całkowita, procent inaktywacji) oraz (liczba wypalonych papierosów, ilość wypitego alkoholu, ilość wypitej kawy, wiek) posłużono się analizą kanoniczną. Tylko pierwsza zmienna kanoniczna okazała się statystycznie istotna (p=0,00021). Tabela 2.Wyniki analizy kanonicznej. Zmienne kanoniczne Zmienne jednego zbioru U1 U2 Wiek -0,65 -0,51 Ilość wypitego alkoholu 0,36 -0,34 [jednostki/tydz] Ilość wypitej kawy [jednostki/tydz] -0,02 -0,63 Liczba wypalonych papierosów 0,58 -0,11 [paczki/tydz] 0,20 0,48 Korelacje kanoniczne (p=0,00021) (p=0,25159) 8,20% Redundancja całkowita 6,9% 1,3% Redundancje drugiego zbioru Zmienne kanoniczne Zmienne drugiego zbioru V1 V2 Procent inaktywacji ALDH -0,11 -1,02 Całkowita aktywność ALDH 0,97 -0,32 Copyright © StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 39 StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl Wyniki analizy kanonicznej przedstawiono w tabeli 2, a wykres rozrzutu dla pierwszej korelacji kanonicznej na rys. 4. Wartość redundancji całkowitej jest mała, co sugeruje, że należałoby w modelu uwzględnić dodatkowe zmienne. 4 3 2 V1 1 0 -1 -2 -3 -3 -2 -1 0 1 2 3 U1 Rys. 4. Wykres rozrzutu pierwszej korelacji kanonicznej. Analiza wykazała, że badane czynniki silniej niż na inaktywację wpływają na aktywność całkowitą enzymu. Najwyraźniej zaznaczał się wpływ wieku i palenia. Na procent inaktywacji najsilniej wpływała ilość wypitej kawy w tygodniu poprzedzającym badanie. Na rys. 5 i 6 przedstawiono zależności pomiędzy całkowitą aktywnością ALDH w ślinie i zmiennymi niezależnymi, które najsilniej na nią wpływają: wiekiem, liczbą wypalonych papierosów i ilością wypitego alkoholu w tygodniu poprzedzającym badanie. Rys. 5. Zależność całkowitej aktywności ALDH w ślinie od wieku i ilości wypitego alkoholu w tygodniu poprzedzającym badanie. 40 www.statsoft.pl/czytelnia.html Copyright © StatSoft Polska 2012 StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl Rys. 6. Zależność całkowitej aktywności ALDH w ślinie od ilości wypitego alkoholu i liczby wypalonych papierosów w tygodniu poprzedzającym badanie. ALDH - wskaźnik diagnostyczny raka jamy ustnej? Materiałem do badań była ślina pacjentów z nowotworami i torbielami jamy ustnej. Aktywność ślinowej ALDH zbadano u 173 osób w tym: 59 osób z rakami płaskonabłonkowymi jamy ustnej, 74 osób z torbielami zębopochodnymi, 11 osób z zębopochodnym guzem keratocystycznym, 23 osoby z innymi nowotworami łagodnymi jamy ustnej (szkliwiaki, zębiaki, guzy z komórek ziarnistych, nadziąślaki, śluzaki zębopochodne). Grupę kontrolną stanowiło 116 osób zdrowych. Celem tej analizy było określenie przydatności całkowitej aktywności ALDH w ślinie jako samodzielnego wskaźnika diagnostycznego umożliwiającego przyporządkowanie osoby badanej do dwóch klas: 1) chory na raka jamy ustnej, 2) chory z inną patologią jamy ustnej lub zdrowy. Wartość AUC dla badanego modelu wynosiła 0,823 (SE=0,036). Optymalnym punktem odcięcia wybrano 0,708 U/g. Punkt ten cechował się czułością 0,57 i specyficznością 0,90. Analiza wykazała, że całkowita aktywność ślinowej ALDH może być predyktorem raka jamy ustnej, jednak wnioskowanie na podstawie tylko tego wskaźnika jest niepolecane ze względu na niską czułość testu. Należy zatem poszukać większej liczby predyktorów (np. wiek, stężenie neutrofili) w celu stworzenia dokładniejszych reguł decyzyjnych oraz przeprowadzić dodatkowe analizy na większej grupie badanych. Copyright © StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 41 StatSoft Polska, tel. 12 428 43 00, 601 41 41 51, [email protected], www.StatSoft.pl Wykres ROC 1,0 Czulosc 0,8 0,6 0.708 0,4 0,2 0,0 0,0 0,2 0,4 0,6 0,8 1,0 1-Specyficznosc Rys. 7. Krzywa ROC opisująca przydatność całkowitej aktywności ślinowej ALDH jako predyktora raka jamy ustnej. Literatura 1. Feron VJ, Til HP, de Vrijer F, Woutersen RA, Cassee FR, van Bladeren PJ. Aldehydes: occurrence, carcinogenic potential, mechanism of action and risk assessment. Mutation Research/Genetic Toxicology. 1991;259(3–4):363-385. 2. O’Brien PJ, Siraki AG, Shangari N. Aldehyde sources, metabolism, molecular toxicity mechanisms, and possible effects on human health. Crit Rev Toxicol. 2005; 35(7):63. 3. Esterbauer H, Schaur RJ, Zollner H. Chemistry and biochemistry of 4-hydroxynonenal, malonaldehyde and related aldehydes. Free Radical Biology and Medicine. 1991;11(1):81-128. 4. Lassen N, Bateman JB, Estey T, Kuszak JR, Nees DW, Piatigorsky J, et al. Multiple and Additive Functions of ALDH3A1 and ALDH1A1. Journal of Biological Chemistry. 2007 August 31, 2007;282(35):25668-25676. 5. Pappa A, Estey T, Manzer R, Brown D, Vasiliou V. Human aldehyde dehydrogenase 3A1 (ALDH3A1): biochemical characterization and immunohistochemical localization in the cornea. Biochemical Journal. 2003;376(3):615-623. 6. Giebułtowicz J, Wolinowska R, Sztybor A, Pietrzak M, Wroczyński P, Wierzchowski J. Salivary Aldehyde Dehydrogenase: Activity towards Aromatic Aldehydes and Comparison with Recombinant ALDH3A1. Molecules. 2009;14(7):2363-2372. 7. Giebułtowicz J, Dziadek M, Wroczyński P, Woznicka K, Wojno B, Pietrzak M, et al. Salivary aldehyde dehydrogenase - temporal and population variability, correlations with drinking and smoking habits and activity towards aldehydes contained in food. Acta Biochimica Polonica. 2010;57(3):361-368. 42 www.statsoft.pl/czytelnia.html Copyright © StatSoft Polska 2012