wachowiak witold
Transkrypt
wachowiak witold
The use of DNA polymorphisms in population history and adaptive variation studies in pines (Wykorzystanie polimorfizmu DNA w badaniach historii populacji i zmienności adaptacyjnej sosen) Wachowiak Witold Cavers Stephen Żukowska Weronika Wójkiewicz Błażej Przegląd P. mugo complex i P. sylvestris jako eksperymentalny system w badaniach lokalnej adaptacji Analiza polimorfizmu nukleotydowego (struktury populacji, identyfikacji loci poddanych działaniu selekcji) Nowe zasoby genomowe Pinus mugo complex i P. sylvestris P. sylvestris P. mugo P. uncinata P. uliginosa Gradient czynników środowiskowych w zasięgu występowania P. mugo P. uncinata P. uliginosa P. sylvestris -5 M1 M2 M3 M4 M5 M6 M7 M8 M9 PS1 PS2 PS3 PS4 PS5 PS6 PS7 PS8 PS9 PS10 PS11 PS12 PS13 PS14 PS15 PUG1 PUG2 PUG3 PUN1 PUN2 PUN3 PUN4 PUN5 PUN6 M1 M2 M3 M4 M5 M6 M7 M8 M9 PS1 PS2 PS3 PS4 PS5 PS6 PS7 PS8 PS9 PS10 PS11 PS12 PS13 PS14 PS15 PUG1 PUG2 PUG3 PUN1 PUN2 PUN3 PUN4 PUN5 PUN6 M1 M2 M3 M4 M5 M6 M7 M8 M9 PS1 PS2 PS3 PS4 PS5 PS6 PS7 PS8 PS9 PS10 PS11 PS12 PS13 PS14 PS15 PUG1 PUG2 PUG3 PUN1 PUN2 PUN3 PUN4 PUN5 PUN6 -10 M1 M2 M3 M4 M5 M6 M7 M8 M9 PS1 PS2 PS3 PS4 PS5 PS6 PS7 PS8 PS9 PS10 PS11 PS12 PS13 PS14 PS15 PUG1 PUG2 PUG3 PUN1 PUN2 PUN3 PUN4 PUN5 PUN6 70 Longitude Temp_mean Latitude 50 30 10 Altitude 2000 1500 1000 500 0 Temp_February mean 15 5 -15 Prec. [mm/month] 150 100 50 0 Pytanie natury ogólnej: Czy potrafimy zidentyfikować geny poddane działaniu naturalnej selekcji potencjalnie związane z różnicowaniem się tych taksonów i lokalną adaptacją ? Cechy genomu warunkujące podejście badawcze (przynajmniej dotychczas…) • genom ogromnych rozmiarów (~ 25 000 MBP) • niski poziom LD ograniczenie na poziomie analiz całego genomu analiza ściśle określonych rejonów (np. CG) i próba korelacji polimorfizmu ze zmiennością np. fenotypową, geograficzną, ekologiczną … • • • • • • • Analiza struktury populacji i zmienności adaptacyjnej 4 gatunków sosen • analiza polimorfizmu ~100 genów nDNA (genes related to metabolisms, transport, expression regulation, signal transduction etc.) • 30 populacji z zasięgu Europejskiego Pytania: Jaki jest poziom zróżnicowania genetycznego pomiędzy gatunkami? Jaka jest struktura populacji ? Czy potrafimy zidentyfikować geny, których zmienność jest wynikiem działania naturalnej selekcji. Poziom polimorfizmu nukleotydowego • homogenne tło genetyczne, niska dywergencja (<1%) 90 80 70 60 50 40 30 20 10 0 % total % species 1 % species 2 SNPs haplotypes SNPs PM (1) vs PS (2) haplotypes SNPs PM (1) vs PUG (2) haplotypes PM (1) vs PUN (2) SNPs PS (1) vs PUG (2) • jednakowy polimorfizm nukleotydowy • • • • • • • • • • Multilocus θW = 4Ne = 0.006-0.007 (Watterson 1975) haplotypes SNPs haplotypes PS (1) vs PUN (2) SNPs haplotypes PUG (1) vs PUN (2) Brak dowodów na istnienie struktury populacji Analiza na podstawie 1680 SNPs P. mugo (80 individuals) main mountain chains in Europe P. sylvestris (135 individuals) south – north of Europe P. uliginosa (24) P. uncinata (50) EU_C Iberian Peninsula Net divergence PM-PS Selection within species: P. mugo PM-UG ; Pr1_11 Pr1_12 Pr1_13 Pr1_14 Pr1_15 Pr1_16 Pr1_17 Pr1_18 Pr1_19 Pr1_21 Pr1_22 Pr1_24 Pr1_26 Pr2_35 Pr2_38 Pr2_41 Pr2_42 Pr2_44 Pr2_45 Pr2_47 Pr2_48 eph phy Pr175 rps4 rps10 PM-Un P. sylvestris PS_UG ; PS-UN UG-UN P. uliginosa Pr4_41 Pr4_38 Pr4_34 Pr4_27 Pr4_21 Pr4_19 Pr4_18 Pr4_17 Pr4_12 Pr4_11 Pr4_10 Pr4_5 Pr4_4 Pr4_1 phytP dhn2pp chcs ccoam abaR a3ip Pr2_25 Pr2_23 Pr2_20 Pr2_17 Pr2_16 Pr2_12 Pr2_11 Pr2_9 Pr2_7 Pr2_5 Pr2_4 Pr2_3 Pr1_48 Pr1_47 Pr1_46 Pr1_45 Pr1_43 Pr1_40 Pr1_36 Pr1_31 Pr1_29 Pr1_28 Pr1_10 Pr2_34 umn927 Pr1_9 0 Pr2_32 0,002 Pr1_5 0,004 Pr2_30 0,006 Pr1_3 0,008 Pr2_29 0,01 Pr1_1 0,012 Pr2_28 Net divergence Geny poddane działaniu selekcji - potencjalnie w wyniku lokalnej adaptacji populacji 0,012 0,01 0,008 0,006 0,004 0,002 0 polimorfizm genów zgodny z modelem selekcji w wyniku lokalnej adaptacji Accron. Pr1_1 Pr1_12 Pr1_15 Pr1_17 Pr1_28 Pr1_46 Pr2_3 Pr2_44 Pr2_45 ccoam eph phy Pr4-1 Pr4-5 Pr4-12 Pr4-19 Gene function/name [category] putative beta-alanine ligase [M] NAD(P)-linked oxidoreductase protein [M] mitogen-activated protein-kinase [ST] glutamate transporter [T] translation initiation factor-4G-like [E] alpha-N-acetylglucosaminidase [M] 2-3 ethylene-resp.transcription factor 1B [E] DNA repair helicase XPB1-like [M] hypothetical protein [UN] Caffeoyl CoA O-methyltransferase [M] putative epoxide hydrolase [M] putative phytocyanin [T] Peroxidase [ST] calcium dependent proteokinase [ST] proton myo-inositol transporter [T] laccase [M] P. mugo P. sylvestris X X X X P. uliginosa X X X X X X X X X X X X X Wachowiak W., Telford A., Zucca GM, González-Martínez SC, Cavers. Signatures of local adaptation and divergence in four closely related pine species. Heredity, submitted P. uncinata Dostępne zasoby genomowe do analiz polimorfizmu i struktury genetycznej populacji ~ 100 genów nDNA - 1680 SNPs (projekt NERC) Loci mikrosatelitarne cpDNA i nDNA (35 loci) (projekt NCN) Vendramin i in.(1996), Provan i in.(1999), Sebastiani i in.(2012), Elsik i Williams (2001), Soranzo i in. (1998), Elsik et al. (2000), Zhou i in. (2002) cpDNA 1 cpDNA 2 nDNA 1 nDNA 2 nDNA 3 nDNA 4 Pt15169 Pt26081 Pt30204 Pt36480 Pt71936 PCP1289 PCP26106 PCP30277 PCP36567 PCP41131 PCP45071 PCP87314 PCP102652 psyl44 psyl42 psyl2 psyl57 psyl16 psyl25 psyl19 psyl18 psyl36 PtTX3116 Spac 11.6 Spac 12.5 Spac 11.8 psyl17 ptTX 3107 Spag 7.14 PtTX2146 PtTX4001 PtTX4011 Spac 11.4 PtTX3032 PtTX3025 Wójkiewicz B, Żukowska W, Wachowiak W. Multiplexed chloroplast and nuclear mikrosatellite loci for genetic studies in pines. W przygotowaniu Opracowanie nowych zasobów genomowych – sekwencjonowanie transkryptomu (Illumina) Ekstrakcja RNA dla 17 osobników (P. sylvestris 5, P. mugo 5, P. uncinata 4, P. uliginosa 3) Spectrum™ Plant Total RNA Kit (Sigma) ● P. sylvestris ■ P. mugo ▲P. uncinata ♦ P. uliginosa ● biblioteki cDNA (® TruSeq™ RNA Sample Preparation Kit (Illumina)) 100bp pair-end Sequencing ● (llumina HiSeq 2000 platform at Edinburgh Genomics, the University of Edinburgh, Scotland) ♦♦ ● ■ Złożenie de novo tranksryptomu dla P. sylvestris (Trinity - version r2012-06-08) ♦ ■ ▲ ▲▲ ▲ ● ■ ■ ■ Tranksryptom P. sylvestris 20000 15000 10000 5000 Biological processes cellular process pathogenesis motor activity ligase activity antioxidant activity lyase activity signal transducer activity oxidoreductase activity isomerase activity enzyme regulator activity catalytic activity binding structural molecule activity transferase activity transporter activity membrane cell extracellular region intracellular • przypisane do 19659 unikatowych genów i znanych białek 0 cell death • 40798 z wyłączeniem retrotranspozonów • 9529 genów przypisanych do 2130 ścieżek enzymatycznych Unigene set 40968 61,246,267 42.5 1501.2 25000 cell communication • 40968 transkryptów Raw assembly 151932 119,849,194 41.8 788.8 cellular membrane fusion response to stimulus behavior transport metabolic process cell differentiation Podstawowe statystyki : Transcripts Nr. Assembly metric Num contigs >100 Total bases in contigs >100 GC contigs >100 Mean length for contigs >100 Molecular function Cellular component Statystyki mapowania: Sample Nr, 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. Species P. sylvestris P. sylvestris P. sylvestris P. sylvestris P. sylvestris P. mugo P. mugo P. mugo P. mugo P. mugo P. uncinata P. uncinata P. uncinata P. uncinata P. uliginosa P. uliginosa P. uliginosa Total reads 31,116,472 258,401,512 37,849,782 38,970,706 45,140,044 43,752,078 32,600,000 40,104,880 52,934,684 69,248,828 34,805,254 30,291,214 45,834,740 48,550,644 52,718,596 40,729,720 69,457,322 % Mapped reads 84.14% 85.34% 80.21% 79.47% 81.73% 78.50% 78.40% 78.19% 78.67% 80.03% 79.34% 78.06% 77.85% 79.12% 78.55% 80.38% 79.37% Statystyki SNPs : • SNPs zidentyfikowane w 54-59% trankryptów (u 22041 genów dla P. sylvestris, 24096 dla P. mugo, 22416 dla P. uncinata oraz 22710 dla P. uliginosa) • 259,087 SNPs odpowiednich do genotypowania (odległość pomiędzy SNPs minimum 50bp) Number of SNPs 67817 81519 63874 94021 95814 116762 103818 100602 130942 138989 102037 87181 118800 115050 127068 116297 147646 Polimorfizm nukleotydowy dla 676 homologicznych rejonów genomowych (nDNA) Species P. sylvestris P. mugo P. uncinata P. uliginosa Total/Aver. N 5 5 4 3 17 L 1364676 1364676 1364676 1364676 1364676 SNPs 12920 13129 13420 9581 27929 Sing. 8674 8710 10374 9581 12181 Πtot 0.0044 0.0045 0.0053 0.0047 0.0047 D -0.243 -0.221 -0.169 -0.211 Analiza PCA: 676 contigów - 27,929 SNPs 79 genów kandydatów - 1680 SNPs UN2 PUN17 PUN24 PUN23 PUN18 PUN28 M5 M2 M1 UG3 M4 Coord. 2 Coord. 2 PS2 PUG1PUG3 PUG2 M3 UG1 UG2 UN3 PS3 PS1 PS4 PS5 UN4 UN1 Coord. 1 PM12 PM14 PM16 PM8 PM1 PM7 PM5 PM4 PS37-45 PS46 Coord. 1 Biorą pod uwagę fakt: • dane z analiz sekwencjonowania DNA nowej generacji nie dostarczają zwyczajnie większej liczby miejsc polimorficznych poprzez dostęp do większych fragmentów genomu • wielkość i charakterystyka genomu szpikowych → większość SNPs przydatna do genotypowania Podziękowania Thank you!