Analiza naturalnych populacji – ekologia molekularna
Transkrypt
Analiza naturalnych populacji – ekologia molekularna
dr Paweł Golik dr Ana Stanković mgr Mateusz Baca mgr Martyna Molak Analiza naturalnych populacji – ekologia molekularna. Analiza DNA w archeologii. Genetyka w Kryminalistyce. Na ostatnich ćwiczeniach z cyklu „Genetyka z inżynierią genetyczną” chcielibyśmy przedstawić pojęcie markera genetycznego i opowiedzieć o jego wykorzystywaniu w różnych dyscyplinach: genetyce populacji (ludzi zwierząt i roślin), genetyce ochronnej, archeologii i kryminalistyce. Marker genetyczny Markerem genetycznym nazywamy każdą sekwencję nukleotydową, której polimorfizm (zmienność pomiędzy osobnikami lub grupami taksonomicznymi) pozwala ocenić różnorodność genetyczną. Rodzaje markerów genetycznych SNPs (ang. Single Nucleotide Polimorphisms) – mutacje punktowe (substytucje: tranzycje i transwersje) w sekwencji nukleotydowej. Zaletą ich analizy jest ich ogromna liczba w genomie - u człowieka kilka milionów. Wykrywanie SNPs opiera się na analizie hybrydyzacji z oligonukleotydami (krótkie zsyntetyzowane chemicznie jednoniciowe cząsteczki DNA (poniżej 50 pz), które będą hybrydyzowały jedynie w sytuacji całkowitej komplementarności z badaną sekwencją DNA). 1 SSLP (ang. simple sequence length polimorphism) są szeregami powtórzeń sekwencji - a więc różnymi allelami zawierającymi różną liczbę jednostek powtarzalnych. Podstawą zmienności są indele. [Indel – delecja lub insercja. Aby ustalić homologię dwóch sekwencji nukleotydowych wykonujemy ich przyrównanie (uliniowanie), czyli tzw. ang. alingment. Podczas przyrównania sekwencji nie można odróżnić od siebie delecji od insercji. Nadaje im się zatem wspólną nazwę indele]. Minisatelity-VNTR (ang. variable number of tandem repeats) – złożone są z jednostek powtarzających się, złożonych z kilkudziesięciu nukleotydów (10-100 pz). Mikrosatelity – STR, msDNA (ang. simple tandem repeats), czyli proste powtórzenia tandemowe, w których powtarzalny motyw złożony jest z 2 do 6 pz (np. CAAG, TGA lub CA). Typowe loci mikrosatelitarne zawierają 10-30 (maksymalnie 50) powtórzeń motywu i osiągają długość 100 do 400 pz. Zlokalizowane są najczęściej w regionach niekodujących genomu. osobnik1 Rys 1. Budowa loci mikrosatelitarnych osobnik2 osobnik3 Powtarzający się motyw np. ATCG Allele mikrosatelitów (warianty długości jednego locus) są kodominujące i dziedziczą się w sposób mendlowski. Ze względu na ich budowę, w mikrosatelitach często zachodzą mutacje. Powtórzenia tandemowe powodują, że polimeraza DNA „ślizga się” (ang. polimerase slippage), dodając lub opuszczając najczęściej pojedyncze powtórzenie, wydłużając lub skracając tym samym sekwencję mikrosatelitarną. Oblicza się, że częstość występowania mutacji w tych markerach u ssaków wynosi ok. 10-2 – 10-4/na pokolenie. Jest ona zmienna u różnych grup organizmów i wyższa u zwierząt niż u 2 roślin. Im więcej powtórzeń znajduje się w danym allelu mikrosatelitarnym, tym większe prawdopodobieństwo jego mutacji. Stąd po pewnym czasie dla danego locus (odcinka DNA) występować będzie wiele alleli. Mikrosatelity, w związku z szybkim tempem mutacji, są bardzo dobrym markerem do badań populacyjnych. Replikacja Poślizg Nowy cykl replikacji + 1 motyw - 1 motyw Rys 3. Przykład poślizgu polimerazy podczas replikacji (http://www.scielo.br/img/revistas/gmb/v29n2/a18fig02.gif) Zastosowanie badań genetycznych w ekologii Od około 20 lat techniki genetyczne są wykorzystywane w badaniach ekologicznych, przede wszystkim do ustalania polimorfizmu genetycznego populacji. Czynniki i procesy ekologiczne determinują strukturę genetyczną. W latach 70. i 80. XX wieku badano przede wszystkim polimorfizm allozymów. W latach 90. nastąpił gwałtowny rozwój zastosowania techniki PCR i sekwencjonowania. Obecnie w badaniach populacyjnych wykorzystuje się najczęściej niekodujące sekwencje DNA, podlegające minimalnie lub wcale presji selekcyjnej (doborowi naturalnemu). Sekwencje te są z reguły wysoce polimorficzne. Należą do nich w jądrze sekwencje mikrosatelitarne (msDNA). Z sekwencji mitochondrialnych w badaniach głównie filogeograficznych i populacyjnych wykorzystuje się cytochrom b (będący wysoce polimorficznym genem) oraz pętlę D. Pętla D – (ang. displacement loop, D-loop) zwana też regionem kontrolnym, (ang. control region) jest najbardziej zmiennym odcinkiem genomu mitochodrialnego. Ma on długość około 1000 pz. Cechą tego markera genetycznego jest jego neutralność selekcyjna. W obrębie pętli D mieszczą się trzy hiperzmienne regiony (ang. hipervariable region) HVR1, 3 HVR2 oraz rzadziej wykorzystywany w analizach HVR3, w których mutacje powstają znacznie częściej aniżeli w pozostałej części regionu kontrolnego. Funkcją D-loop jest rozpoczęcie replikacji genomu mitochondrialnego. Tutaj mieści się region ori. Informacje uzyskane w oparciu o analizę sekwencji mtDNA i msDNA wykorzystuje się w badaniach nad migracjami gatunków, określaniu efektywnej wielkości populacji, jej heterozygotyczności, pokrewieństwa osobników, dystansu genetycznego między populacjami, przejścia populacji przez wąskie gardło itd. Pamiętać należy, że mitochondrialny DNA dziedziczy się wyłącznie w linii matczynej, w związku z czym jego analiza dostarcza informacji dotyczących jedynie części populacji (samic lub kobiet). W zależności od charakteru badań wykorzystuje się jeden lub obydwa wyżej opisane markery molekularne. Genetyka ochronna (ang. Conservation genetics). Zgodnie z powszechnie akceptowanymi zasadami ekologii na świecie, restytucję bądź ochronę gatunków powinna poprzedzać staranna analiza genetyczna, której wyniki pozwalają ocenić, czy zakres polimorfizmu genetycznego introdukowanych lub zachowywanych populacji jest wystarczający dla powodzenia projektów ochronnych. Zastosowanie metod genetycznych pozwala poznać różnorodność (polimorfizm genetyczny) populacji, jak i określić przepływ genów między populacjami. Możliwe jest także ustalenie stopnia i obecności hybrydyzacji pomiędzy gatunkami autochtonicznymi a pokrewnymi, introdukowanymi przez człowieka. Wiedza ta jest niezbędna dla prawidłowej odbudowy populacji gatunku, który na danym obszarze kiedyś występował lub umożliwienie naturalnego jej odrodzenia się. Wyżej opisane działania zyskały nazwę conservation genetics – w wolnym tłumaczeniu „genetyka ochronna” (Hedrik, 2001). Genetyka ochronna to połączenie ekologii, genetyki populacyjnej, modelowania matematycznego, taksonomii i mikroewolucjonizmu. Poznanie dokładnie struktury ekologicznej i genetycznej pomaga w aktywnej ochronie gatunków. 4 Genetyka w kryminalistyce. Identyfikacja osób i określanie pokrewieństwa. W ostatnich latach, rozwój technik izolacji DNA oraz namnażania i analizy wielu loci mikrosatelitarnych jednocześnie, dostarczyły niezawodnego narzędzia do ustalania identyczności lub stopnia pokrewieństwa osobników. Możliwości te wykorzystywane są dzisiaj w wielu zagadnieniach medycyny sądowej (ang. forensic science) takich jak określanie związku pomiędzy śladami biologicznymi, identyfikacja ofiar katastrof, ustalanie ojcostwa lub pokrewieństwa dla celów spadkowych czy imigracyjnych. Identyfikacja osób – podstawy teoretyczne: Aby stwierdzić, że przykładowo, plama krwi znaleziona na miejscu morderstwa pochodzi od konkretnego podejrzanego, trzeba porównać profile mikrosatelitarne uzyskane z krwi oraz od podejrzanego. Aby uzyskane wyniki były wiarygodne i porównywalne np. pomiędzy bazami danych w różnych krajach, na potrzeby takich organizacji jak FBI w USA czy ISFS (ang. International Society of Forensic Science) w Europie stworzono zestawy autosomalnych loci mikrosatelitarnych (położonych na chromosomach autosomalnych) wykorzystywane do celów identyfikacyjnych. W USA zestaw ten nazwano CODIS (ang. Combined DNA Identification System) i zawiera on 13 loci mikrostaelitarnych (CSF1PO, FGA, TH01, TPOX, VWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11) oraz fragment genu amelogeniny pozwalający na określenie płci. W Europie funkcjonuje kilka systemów zawierających podobne zestawy, obejmujące tzw. ang. European Core Loci set (FGA, TH01, VWA, D2S1338, D3S1358, D8S1179, D16S539, D18S51, D19S433, D21S11 oraz fragment genu amelogeniny)*. Analiza zestawu loci mikrosatelitarnych, w wyniku której otrzymuje się profil mikrosatelitarny danej osoby nazywa się DNA fingerprinting (genetycznym odciskiem palca). Jeżeli obydwa uzyskane profile są jednakowe (tzn. posiadają identyczne allele we wszystkich loci), mamy podstawy by sądzić, że pochodzą one od jednej osoby. Jednak możliwe jest, że 2 lub więcej niespokrewnionych osób w populacji posiada taki sam profil * znajomość nazw loci wykorzystywanych w opisanych zestawach nie jest wymagana 5 genetyczny zupełnie przypadkowo. Prawdopodobieństwo takiego zdarzenia określane jest jako random match probability (mp, prawdopodobieństwo przypadkowej zgodności). Takie prawdopodobieństwo obliczane jest za każdym razem dla danego profilu genetycznego na podstawie danych populacyjnych z danego regionu. Prawdopodobieństwo przypadkowego pojawienia się danego profilu u dwóch niespokrewnionych osób w populacji zależy do ilości wykorzystanych loci oraz ich zmienności w populacji. Dla zestawu CODIS wynosi ono średnio 5 x 10-15 a dla dostępnych komercyjnie zestawów sięga nawet 7,2 x 10-19. Innymi słowy oznacza to, że konkretny profil genetyczny wystąpi raz na miliony miliardów osób, a jest to liczba znacznie większa niż kiedykolwiek żyło ludzi na Ziemi. Zapewnia to prawie 100% pewność, że zgodne (identyczne) profile należą do jednej osoby. Jednak tak, jak z całkowitą pewnością można stwierdzić, że profile nie należą do tej samej osoby (nie są zgodne), tak prawdopodobieństwo, że profile pochodzą od jednej osoby nigdy nie osiąga 100%. W kryminalistyce często wykorzystuje się mikrosatelity zlokalizowane na chromosomie Y. Takie analizy wykonuje się szczególnie w przypadku przestępstw na tle seksualnym, kiedy uzyskana próbka jest mieszaniną materiału pochodzącego od kobiety i od mężczyzny i nie udaje się uzyskać czystego profilu mikrosatelitów autosomalnych sprawcy. Specyficzna amplifikacja mikrosatelitów zlokalizowanych na chromosomie Y pozwala na uzyskanie profilu, który można porównać z profilami podejrzanych. Wadą markerów na chromosomie Y jest to, że dziedziczą się niezmienione z ojca na syna, przez co nie można odróżnić krewnych w linii męskiej. Z tego powodu z reguły traktuje się je jako tzw. markery wykluczające. Oznacza to, że można jedynie wykluczyć podejrzanego, kiedy profile są niezgodne. Określanie pokrewieństwa Jeżeli dwie osoby są ze sobą spokrewnione, to posiadają pewną część jednakowych alleli. Allele jednakowe u dwóch osób, kiedy ich identyczność wynika z pokrewieństwa (czyli odziedziczenia tego samego allelu po wspólnym przodku), określa się jako IBD (ang. Identity-by-descent, identyczne poprzez pochodzenie). Przeciwieństwem takiej sytuacji jest występowanie identycznych alleli u dwóch osób, kiedy to allele te nie pochodzą od jednego przodka/chromosomu. O takich allelach mówimy, że są IBS (ang. Identity-by-state). 6 Posiadając profile genetyczne dwóch osób, można określić na podstwie frekwencji poszczególnych alleli w populacji, jaka część ich alleli jest wspólna ze względu na pochodzenie (IBD) i na tej podstawie określić stopień pokrewieństwa pomiędzy tymi osobami. Określanie pokrewieństwa jest wykorzystywane przy testowaniu ojcostwa, sprawach imigracyjnych czy identyfikacji zmarłych. Wykorzystuje się je także w badaniach nad restytucją gatunków. Przykładowo ważne jest określenie stopnia pokrewieństwa narybku, którym prowadzi się zarybienia. Ponadto zaplanować można dokładny schemat krzyżowań osobników przeznaczonych do rozrodu, by uniknąć chowu wsobnego. Przypomnieć sobie: Jądrowy i mitochondrialny DNA (charakterystyka ogólna, szczególnie człowieka), prawo Hardy’ego-Weinberga Literatura: „Genomy” T.A. Brown, PWN (2009) str. 598-622 (rozd. 19) lub PWN (2001) str. 400-421 (rozd. 15) „Genetyka molekularna” P. Węgleński i in., PWN (2006) str. 430-474 (rozd. 11) – szczególnie zwrócić uwagę na koncepcję „Pożegnania z Afryką” (ang. „out of Africa”, rozd. 11.3.8) Literatura uzupełniająca – mini i mikrosatelity: „Genomy” T.A. Brown – PWN (2001) – str. 20-22, 136-137 lub (2009) str. 68-72, 217-218. 7 MATERIAŁ DODATKOWY: Na podstawie zmian mutacyjnych (substytucji oraz indeli) - przede wszystkim w obrębie HVR1, utworzono haplogrupy, czyli grupy sekwencji (haplotypów) o pewnym wspólnym wzorze nukleotydów (np. u ludzi: haplogrupy A,B,C,D itd.). Wewnątrz każdej haplogrupy istnieją haplotypy, zawierające pewne wspólne podstawienia nukeotydowe, specyficzne dla danej haplogrupy. Haplotyp jest właściwym określeniem w stosunku do mtDNA (nie allel!). Wszystkie geny genomu mtDNA są dziedziczone wspólnie, zatem odmiany sekwencji są haplotypami. Ponadto na podstawie danych tysięcy sekwencji nukleotydowych ludzi stworzono mapę migracji ludzkości na świecie. Podobne badania przeprowadza się na innych gatunkach rekonstruując ich historię i ewolucję. Mogą to być badania filogeograficzne (np. rozprzestrzenianie się populacji po zlodowaceniach) oraz filogenetyczne (czyli rekonstrukcja pokrewieństwa różnych taksonów). Wykorzystanie loci mikrosatelitarnych w badaniach populacyjnych Mikrosatelity znajdują zastosowanie w badaniach mechanizmów ewolucyjnych, które zachodzą w stosunkowo krótkim czasie. Za ich pomocą analizuje się dystans genetyczny pomiędzy populacjami. Ponadto bada się procesy demograficzne, takie jak gwałtowne wahania liczebności. Mogą one być spowodowane efektem wąskiego gardła (ang. bottleneck) lub efektem założyciela (ang. founder effect), czyli kolonizacją małą liczbą osobników. Na takie populacje silnie działa dryf genetyczny (losowe utrwalanie się – fiksacja (ang. fixation) lub eliminacja części alleli oraz zmiana ich frekwencji) ze względu na odtwarzanie populacji z małej liczby przypadkowych osobników. Z kolei czynniki behawioralne, do których należy dobór płciowy, terytorializm, decydują o tym, które genotypy (określone zestawy alleli danych genów w osobniku) będą uczestniczyły w rozrodzie, a tym samym zostaną przekazane do kolejnych pokoleń. Na tym poziomie rozgrywa się tzw. selekcja określonych fenotypów, które jednak mają swoje odzwierciedlenie w konkretnym genotypie. Poligamia również jest źródłem ograniczenia polimorfizmu danej populacji, szczególnie mało liczebnej. Szczególne zastosowanie znajdują badania polimorfizmu mikrosatelitów u gatunków zagrożonych wymarciem, które często są populacjami izolowanymi o ograniczonym polimorfizmie i przepływie genów. Poznanie dokładnie ich struktury ekologicznej i genetycznej pomaga w aktywnej ochronie tych gatunków. Migracyjność osobników 8 przeciwdziała wsobności (ang. inbreeding) i sprzyja wymianie materiału genetycznego (ang. outbreeding). Wykorzystując sekwencje mikrosatelitarne, możliwe jest wykrycie migrantów lub ich potomstwa w danej populacji oraz wskazanie, z jakiej populacji prawdopodobnie pochodziły. Z czynników środowiskowych, które silnie oddziałują na strukturę genetyczną wymienić można stopień izolacji, którego wpływ skutkuje ograniczeniem polimorfizmu populacji, jeśli jest ona mało liczebna, w związku z ograniczonym przepływem genów. Na taką izolowaną populację będą silniej oddziaływać czynniki losowe, takie jak np. dryf genetyczny. Nasilone kojarzenie wsobne w tych populacjach może prowadzić do załamania się populacji (ang. inbreeding depression). Możliwe jest określenie efektywniej wielkości populacji (NE), która jest wyznacznikiem kondycji genetycznej danej populacji. Jej wartość zwykle drastycznie maleje w wyniku wspomnianych wyżej efektów wąskiego gardła, założyciela czy występowania wsobności. Czasami jednak kojarzenie wsobne może mieć działanie korzystne dla populacji (ang. puring selection). Jako że w takiej populacji większość osobników to homozygoty pod względem wielu genów, w wyniku selekcji pozostaną jedynie osobniki najlepiej przystosowane do lokalnych warunków środowiska. Większe jest też prawdopodobieństwo wyeliminowania alleli genów powodujących choroby genetyczne. Krzyżowanie się w takiej sytuacji osobników z dwóch populacji przystosowanych do odmiennych warunków środowiska, może mieć skutek w gorszym dostosowaniu potomstwa poprzez rozrywanie korzystnych kombinacji alleli różnych genów (ang. outbreeding depression). Z drugiej strony, taka pozbawiona polimorfizmu populacja jest mało odporna na zmiany warunków środowiska, np. pojawienie się nowego czynnika chorobotwórczego. Poza tym łatwiej dochodzi do ujawniania się recesywnych chorób genetycznych. Analiza mikrosatelitów Obecnie mikrosatelity analizuje się za pomocą elektroforezy kapilarnej (ang. capilary electrophoresis) w sekwenatorze. W tym celu jeden z 2 starterów znakuje się barwnikiem fluorescencyjnym. Ustalanie długości produktów PCR polega na rejestrze czasu, jaki upływa od rozpoczęcia elektroforezy w żelu, do momentu otrzymania sygnału świetlnego, pochodzącego od fluorescencyjnie znakowanych nukleotydów. Za pomocą standardu, oblicza się długość analizowanych fragmentów DNA (czas migracji produktu w żelu jest proporcjonalny do jego długości). Istnieje wiele programów, dzięki którym można ustalić długości alleli (np. Peak Scanner). Przed analiza statystyczną, należy wykluczyć obecność: 9 tzw. ang. allelic dropout – ADO, obecność tylko 1 allelu (z 2) mającego źródło w jego preferencyjnym namnażaniu się, najczęściej krótszego (dotyczy to zwykle alleli powyżej 300 pz), fałszywych alleli (ang. false alleles, FA) powstających w wyniku błędów analizy artefaktów elektroforetycznych (ang. electrophoresis artefacts, EA) powstających między innymi na skutek błędów sekwenatora, alleli zerowych (ang. null alleles, NA) – braku odczytu istniejącego allelu mającego źródło w wyniku zmiany sekwencji w miejscu przyłączania się startera, na skutek mutacji. Wykonuje się też analizę ewentualnego sprzężenia loci mikrosatelitarnych ze sobą (ang. linked loci) czyli nielosowej dystrybucji alleli (ang. linkage disequilibrium). Może być ona zaburzona, jeśli dwa loci leżą blisko siebie na jednym chromosomie. W przypadku obliczeń wykonanych na loci sprzężonych ze sobą można otrzymać fałszywe wyniki. Wykonuje się analizy używając sprzężonych loci, ale wykorzystuje się wówczas inne algorytmy. Wymienione artefakty (poza FA) oraz sprzężenie doprowadzają do przeszacowania liczby homozygot (ang. false homozygote, FH). Równowaga Hardy’ego-Weinberga (HWE) a analizy struktury genetycznej populacji W populacjach znajdujących się w stanie równowagi zgodnie z prawem Hardy’ego-Weinberga nie obserwuje się wysokiej częstości mutacji oraz zjawisk selekcji, migracji i dryfu genetycznego. Warunkiem dochodzenia do stanu tej równowagi jest także losowość kojarzenia się osobników oraz ich wystarczająco duża liczba. Odstępstwa od HWE świadczą o obecności procesów demograficznych, które zmieniają (zaburzają) frekwencje i rozkład alleli. Polimorfizm loci: W badaniach zmienności (polimorfizmu) loci mikrosatelitarnych wykorzystuje się następujące wskaźniki: Liczba alleli w danym locus (Na) Bogactwo alleliczne (R) – uwzględnia wielkość próby, przyrównując do populacji o najmniejszej liczebności 10 Liczba alleli prywatnych (Np) – liczba alleli charakterystyczna tylko dla danej populacji. Heterozygotyczność o oczekiwana (HE) – dla frekwencji alleli danego locus w populacji szacuje się, jaki powinien być udział heterozygot w warunkach równowagi Hardy’ego-Weinberga. Heterozygotyczność obserwowana (HO) – oblicza się rzeczywista frekwencje heterozygot występujących w populacji. Statystyka Wrighta Współczynnik wsobności (ang. inbred, fixation index): FIS = 1 – (HO/ HE) - wsp. inbredu – określa stopień wsobność, czyli proporcję heterozygotyczności obserwowanej do oczekiwanej w obrębie populacji, losowość kojarzenia się osobników (panmiksje). Wartości FIS < -1; 1 >: o Nieistotne wartości FIS oraz FIS = 0 oznaczają, że populacja jest w równowadze Hardy’ego Weinberga i brak jest struktury wewnętrznej w tej populacji. o Istotne statystycznie wartości FIS > 0 mogą wskazywać na: efekty wsobności (ang. inbreeding), istnienie struktury wewnętrznej w populacji (subpopulacji – efekt Wahlunda), dryf genetyczny, istnienie doboru płciowego, fizyczne sprzężenie loci, jako że w populacji występuje nadmiar homozygot. o Znaczące wartości FIS < 0 oznaczają, iż w populacji występuje nadmiar heterozygot, który może być wynikiem selekcji na heterozygoty albo efektem wąskiego gardła. Współczynnik FST – wsp. utrwalenia - określa spadek heterozygotyczności w subpopulacji w stosunku do całej populacji, na skutek np. selekcji lub dryfu genetycznego. Jego wartości wskazują, jak intensywny jest przepływ genów pomiędzy subpopulacjami. Mówi o dystansie genetycznym pomiędzy subpopulacjami lub populacjami. Wartości: o 0 - 0,05 – małe genetyczne zróżnicowanie populacji o 0,05 - 0,15 – średnie genetyczne zróżnicowanie populacji o 0,15 - 0,25 – duże genetyczne zróżnicowanie populacji o 0,25 – bardzo duże genetyczne zróżnicowanie populacji 11