Barbara Uszczyńska
Transkrypt
Barbara Uszczyńska
„Optymalizacja ścieżek analizy niestandardowych danych uzyskiwanych przy użyciu mikromacierzy DNA” Barbara Uszczyńska Stypendystka projektu pt. „Wsparcie stypendialne dla doktorantów na kierunkach uznanych za strategiczne z punktu widzenia rozwoju Wielkopolski”, Poddziałanie 8.2.2 Programu Operacyjnego Kapitał Ludzki Mikromacierze są aktualnie jedną z najbardziej popularnych technik we współczesnej biologii molekularnej. Choć mikromacierze DNA mają dużą konkurencję w postaci mikromacierzy RNA, białkowych, lipidowych, cukrowych czy nawet aktualnie już tkankowych, wciąż cieszą się ogromnym zainteresowaniem. Najczęściej wykorzystywane są one do: analizy struktury genomu, wykrywanie pojedynczych mutacji, analiza liczby kopii genów oraz badanie aktywności transkrypcyjnej genomu. Przy czym należy zaznaczyć, że każdy rodzaj zastosowania mikromacierzy charakteryzuje się odrębnym scenariuszem analizy danych, a zastosowanie innej ścieżki analizy danych może skutkować otrzymaniem odmiennych wyników. Eksperymenty z użyciem mikromacierzy DNA generują olbrzymie ilości danych, o ściśle określonej strukturze, a ich obróbka wymaga użycia wyrafinowanych metod bioinformatycznych. Trudność analizy danych nie tyle wynika z liczności zestawów, co raczej z ich struktury. Dane uzyskiwane za pomocą mikromacierzy DNA wraz z informacjami pomocniczymi (ułatwiającymi biologiczną interpretację wyników), często charakteryzują się większą złożonością niż dane uzyskiwane w procesie sekwencjonowania genomów. Poziom trudności analizy danych ściśle zależy także od rodzaju stosowanych mikromacierzy. Mikromacierze DNA dostępne komercyjne często posiadają opracowany i zoptymalizowany scenariusz analizy danych, który najczęściej zamknięty jest w przyjaznym użytkownikowi interfejsie graficznym. Kwestia analizy danych ulega znacznej komplikacji w przypadku danych pochodzących z tzw. mikromacierzy drukowanych lub dedykowanych (ang. boutique microarrays). Mikromacierze dedykowane są szczególnym przypadkiem mikromacierzy DNA do profilowania ekspresji genów, zaprojektowanym z myślą o badaniu pojedynczego procesu biologicznego lub chorobotwórczego. Mikromacierze tego typu z założenia są znacznie mniejsze, niż mikromacierze genomowe, gdyż zawierają zestaw sond ograniczony jedynie do genów potencjalnie zaangażowanych w dany proces oraz niewielki zestaw sond kontrolnych. W porównaniu z mikromacierzami genomowymi, charakteryzującymi się zawartością od kilkunastu tysięcy do nawet kilku milionów, jest to jedynie niewielki procent. Pomimo szerokiej oferty gotowych do użycia komercyjnych mikromacierzy DNA, nadal istnieje potrzeba tworzenia specyficznych mikromacierzy. Dedykowane mikromacierze DNA często projektowane są w ramach badań nad mniej poznanymi organizmami biologicznymi, dla których nie ma gotowych mikromacierzy. Ponadto ten rodzaj mikromacierzy stosowany jest również w celu dokładniejszego poznania danego problemu biologicznego lub biomedycznego. Szczególnym przypadkiem mikromacierzy dedykowanych są testy diagnostyczne np. do identyfikacji mutacji punktowych, czy chorób wirusowych. Takie zestawy danych często są asymetryczne (brak danej mutacji), a sondy na mikromacierzy nie są ulokowane w sposób losowy (łatwość w interpretacji wyników). Istnieją także mikromacierze służące do identyfikacji pojedynczych mutacji, gdzie stosuje się cztery różne barwniki fluorescencyjne. Pojedynczy barwnik odpowiada danemu rodzajowi nukleotydu. Wówczas otrzymuje się bardziej skomplikowany zestaw danych, którego obróbka nie jest osiągalna dla większości popularnych algorytmów do analizy danych. Wszystkie dane pochodzące z eksperymentów z użyciem mikromacierzy dedykowanych, uznawane są za dane niestandardowe i wymagają dodatkowego, specyficznego etapu w analizie danych, co ma na celu minimalizację błędów statystycznych otrzymanych wyników. Opracowanie nowych oraz optymalizacja aktualnie istniejących ścieżek analizy niestandardowych danych uzyskiwanych za pomocą mikromacierzy DNA pozwoli na popularyzację w Wielkopolsce mikromacierzy jako techniki biologii molekularnej. Statystycznie poprawna analiza takich testów diagnostycznych, zwiększy ich wiarygodność, a tym samym rozwój. W Wielkopolsce prowadzonych jest szereg projektów wykorzystujących mikromacierze w tym: projekty obejmujące opracowanie metody konstrukcji mikromacierzy, projektowanie testów diagnostycznych, poszukiwania markerów, czy badania nad roślinami. Większość prac dedykowanych mikromacierzom prowadzona w Wielkopolsce koncentruje się raczej na aspektach konstrukcyjnych, niż na metodach ich analizy, a to właśnie ten etap dla większości użytkowników mikromacierzy jest najbardziej problematyczny.