wachowiak witold

Transkrypt

wachowiak witold
The use of DNA polymorphisms in population
history and adaptive variation studies in pines
(Wykorzystanie polimorfizmu DNA w badaniach historii populacji i
zmienności adaptacyjnej sosen)
Wachowiak Witold
Cavers Stephen
Żukowska Weronika
Wójkiewicz Błażej
Przegląd
P. mugo complex i P. sylvestris jako eksperymentalny
system w badaniach lokalnej adaptacji
Analiza polimorfizmu nukleotydowego
(struktury populacji, identyfikacji loci poddanych działaniu selekcji)
Nowe zasoby genomowe
Pinus mugo complex i P. sylvestris
P. sylvestris
P. mugo
P. uncinata
P. uliginosa
Gradient czynników środowiskowych w zasięgu występowania
P. mugo
P. uncinata
P. uliginosa
P. sylvestris
-5
M1
M2
M3
M4
M5
M6
M7
M8
M9
PS1
PS2
PS3
PS4
PS5
PS6
PS7
PS8
PS9
PS10
PS11
PS12
PS13
PS14
PS15
PUG1
PUG2
PUG3
PUN1
PUN2
PUN3
PUN4
PUN5
PUN6
M1
M2
M3
M4
M5
M6
M7
M8
M9
PS1
PS2
PS3
PS4
PS5
PS6
PS7
PS8
PS9
PS10
PS11
PS12
PS13
PS14
PS15
PUG1
PUG2
PUG3
PUN1
PUN2
PUN3
PUN4
PUN5
PUN6
M1
M2
M3
M4
M5
M6
M7
M8
M9
PS1
PS2
PS3
PS4
PS5
PS6
PS7
PS8
PS9
PS10
PS11
PS12
PS13
PS14
PS15
PUG1
PUG2
PUG3
PUN1
PUN2
PUN3
PUN4
PUN5
PUN6
-10
M1
M2
M3
M4
M5
M6
M7
M8
M9
PS1
PS2
PS3
PS4
PS5
PS6
PS7
PS8
PS9
PS10
PS11
PS12
PS13
PS14
PS15
PUG1
PUG2
PUG3
PUN1
PUN2
PUN3
PUN4
PUN5
PUN6
70
Longitude
Temp_mean
Latitude
50
30
10
Altitude
2000
1500
1000
500
0
Temp_February mean
15
5
-15
Prec. [mm/month]
150
100
50
0
Pytanie natury ogólnej:
Czy potrafimy zidentyfikować geny poddane działaniu naturalnej
selekcji potencjalnie związane z różnicowaniem się tych taksonów
i lokalną adaptacją ?
Cechy genomu warunkujące podejście badawcze
(przynajmniej dotychczas…)
• genom ogromnych rozmiarów (~ 25 000 MBP)
• niski poziom LD
 ograniczenie na poziomie analiz całego genomu
 analiza ściśle określonych rejonów (np. CG) i próba korelacji polimorfizmu
ze zmiennością np. fenotypową, geograficzną, ekologiczną …
•
•
•
•
•
•
•
Analiza struktury populacji i zmienności adaptacyjnej
4 gatunków sosen
• analiza polimorfizmu ~100 genów nDNA
(genes related to metabolisms, transport, expression
regulation, signal transduction etc.)
• 30 populacji z zasięgu Europejskiego
Pytania:
 Jaki jest poziom zróżnicowania genetycznego pomiędzy gatunkami?
 Jaka jest struktura populacji ?
 Czy potrafimy zidentyfikować geny, których zmienność jest wynikiem
działania naturalnej selekcji.
Poziom polimorfizmu nukleotydowego
• homogenne tło genetyczne, niska dywergencja (<1%)
90
80
70
60
50
40
30
20
10
0
% total
% species 1
% species 2
SNPs
haplotypes
SNPs
PM (1) vs PS (2)
haplotypes
SNPs
PM (1) vs PUG (2)
haplotypes
PM (1) vs PUN (2)
SNPs
PS (1) vs PUG (2)
• jednakowy polimorfizm nukleotydowy
•
•
•
•
•
•
•
•
•
•
Multilocus θW = 4Ne = 0.006-0.007
(Watterson 1975)
haplotypes
SNPs
haplotypes
PS (1) vs PUN (2)
SNPs
haplotypes
PUG (1) vs PUN (2)
Brak dowodów na istnienie struktury populacji
Analiza na podstawie 1680 SNPs
P. mugo (80 individuals)
main mountain chains in Europe
P. sylvestris (135 individuals)
south – north of Europe
P. uliginosa (24) P. uncinata (50)
EU_C
Iberian Peninsula
Net divergence
PM-PS
Selection within species:
P. mugo
PM-UG
;
Pr1_11
Pr1_12
Pr1_13
Pr1_14
Pr1_15
Pr1_16
Pr1_17
Pr1_18
Pr1_19
Pr1_21
Pr1_22
Pr1_24
Pr1_26
Pr2_35
Pr2_38
Pr2_41
Pr2_42
Pr2_44
Pr2_45
Pr2_47
Pr2_48
eph
phy
Pr175
rps4
rps10
PM-Un
P. sylvestris
PS_UG
;
PS-UN
UG-UN
P. uliginosa
Pr4_41
Pr4_38
Pr4_34
Pr4_27
Pr4_21
Pr4_19
Pr4_18
Pr4_17
Pr4_12
Pr4_11
Pr4_10
Pr4_5
Pr4_4
Pr4_1
phytP
dhn2pp
chcs
ccoam
abaR
a3ip
Pr2_25
Pr2_23
Pr2_20
Pr2_17
Pr2_16
Pr2_12
Pr2_11
Pr2_9
Pr2_7
Pr2_5
Pr2_4
Pr2_3
Pr1_48
Pr1_47
Pr1_46
Pr1_45
Pr1_43
Pr1_40
Pr1_36
Pr1_31
Pr1_29
Pr1_28
Pr1_10
Pr2_34
umn927
Pr1_9
0
Pr2_32
0,002
Pr1_5
0,004
Pr2_30
0,006
Pr1_3
0,008
Pr2_29
0,01
Pr1_1
0,012
Pr2_28
Net divergence
Geny poddane działaniu selekcji - potencjalnie w wyniku lokalnej
adaptacji populacji
0,012
0,01
0,008
0,006
0,004
0,002
0
 polimorfizm genów zgodny z modelem selekcji w wyniku lokalnej adaptacji
Accron.
Pr1_1
Pr1_12
Pr1_15
Pr1_17
Pr1_28
Pr1_46
Pr2_3
Pr2_44
Pr2_45
ccoam
eph
phy
Pr4-1
Pr4-5
Pr4-12
Pr4-19
Gene function/name [category]
putative beta-alanine ligase [M]
NAD(P)-linked oxidoreductase protein [M]
mitogen-activated protein-kinase [ST]
glutamate transporter [T]
translation initiation factor-4G-like [E]
alpha-N-acetylglucosaminidase [M]
2-3 ethylene-resp.transcription factor 1B [E]
DNA repair helicase XPB1-like [M]
hypothetical protein [UN]
Caffeoyl CoA O-methyltransferase [M]
putative epoxide hydrolase [M]
putative phytocyanin [T]
Peroxidase [ST]
calcium dependent proteokinase [ST]
proton myo-inositol transporter [T]
laccase [M]
P. mugo
P. sylvestris
X
X
X
X
P. uliginosa
X
X
X
X
X
X
X
X
X
X
X
X
X
Wachowiak W., Telford A., Zucca GM, González-Martínez SC, Cavers.
Signatures of local adaptation and divergence in four closely related pine species.
Heredity, submitted
P. uncinata
Dostępne zasoby genomowe do analiz polimorfizmu
i struktury genetycznej populacji
~ 100 genów nDNA - 1680 SNPs (projekt NERC)
Loci mikrosatelitarne cpDNA i nDNA (35 loci) (projekt NCN)
Vendramin i in.(1996), Provan i in.(1999), Sebastiani i in.(2012), Elsik i Williams (2001),
Soranzo i in. (1998), Elsik et al. (2000), Zhou i in. (2002)
cpDNA 1
cpDNA 2
nDNA 1
nDNA 2
nDNA 3
nDNA 4
Pt15169
Pt26081
Pt30204
Pt36480
Pt71936
PCP1289
PCP26106
PCP30277
PCP36567
PCP41131
PCP45071
PCP87314
PCP102652
psyl44
psyl42
psyl2
psyl57
psyl16
psyl25
psyl19
psyl18
psyl36
PtTX3116
Spac 11.6
Spac 12.5
Spac 11.8
psyl17
ptTX 3107
Spag 7.14
PtTX2146
PtTX4001
PtTX4011
Spac 11.4
PtTX3032
PtTX3025
Wójkiewicz B, Żukowska W, Wachowiak W. Multiplexed chloroplast and
nuclear mikrosatellite loci for genetic studies in pines. W przygotowaniu
Opracowanie nowych zasobów genomowych –
sekwencjonowanie transkryptomu (Illumina)
Ekstrakcja RNA dla 17 osobników
(P. sylvestris 5, P. mugo 5, P. uncinata 4, P. uliginosa 3)
Spectrum™ Plant Total RNA Kit (Sigma)
● P. sylvestris
■ P. mugo
▲P. uncinata
♦ P. uliginosa
●
biblioteki cDNA
(® TruSeq™ RNA Sample Preparation Kit (Illumina))
100bp pair-end Sequencing
●
(llumina HiSeq 2000 platform at Edinburgh Genomics, the
University of Edinburgh, Scotland)
♦♦ ●
■
Złożenie de novo tranksryptomu dla
P. sylvestris (Trinity - version r2012-06-08)
♦ ■
▲
▲▲
▲
●
■
■
■
Tranksryptom P. sylvestris
20000
15000
10000
5000
Biological processes
cellular process
pathogenesis
motor activity
ligase activity
antioxidant activity
lyase activity
signal transducer activity
oxidoreductase activity
isomerase activity
enzyme regulator activity
catalytic activity
binding
structural molecule activity
transferase activity
transporter activity
membrane
cell
extracellular region
intracellular
• przypisane do 19659 unikatowych genów
i znanych białek
0
cell death
• 40798 z wyłączeniem retrotranspozonów
• 9529 genów przypisanych do 2130
ścieżek enzymatycznych
Unigene set
40968
61,246,267
42.5
1501.2
25000
cell communication
• 40968 transkryptów
Raw assembly
151932
119,849,194
41.8
788.8
cellular membrane fusion
response to stimulus
behavior
transport
metabolic process
cell differentiation
Podstawowe statystyki :
Transcripts Nr.
Assembly metric
Num contigs >100
Total bases in contigs >100
GC contigs >100
Mean length for contigs >100
Molecular function
Cellular
component
Statystyki mapowania:
Sample Nr,
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
Species
P. sylvestris
P. sylvestris
P. sylvestris
P. sylvestris
P. sylvestris
P. mugo
P. mugo
P. mugo
P. mugo
P. mugo
P. uncinata
P. uncinata
P. uncinata
P. uncinata
P. uliginosa
P. uliginosa
P. uliginosa
Total reads
31,116,472
258,401,512
37,849,782
38,970,706
45,140,044
43,752,078
32,600,000
40,104,880
52,934,684
69,248,828
34,805,254
30,291,214
45,834,740
48,550,644
52,718,596
40,729,720
69,457,322
% Mapped reads
84.14%
85.34%
80.21%
79.47%
81.73%
78.50%
78.40%
78.19%
78.67%
80.03%
79.34%
78.06%
77.85%
79.12%
78.55%
80.38%
79.37%
Statystyki SNPs :
• SNPs zidentyfikowane w 54-59% trankryptów
(u 22041 genów dla P. sylvestris, 24096 dla P. mugo,
22416 dla P. uncinata oraz 22710 dla P. uliginosa)
• 259,087 SNPs odpowiednich do genotypowania
(odległość pomiędzy SNPs minimum 50bp)
Number of SNPs
67817
81519
63874
94021
95814
116762
103818
100602
130942
138989
102037
87181
118800
115050
127068
116297
147646
Polimorfizm nukleotydowy dla 676 homologicznych rejonów genomowych (nDNA)
Species
P. sylvestris
P. mugo
P. uncinata
P. uliginosa
Total/Aver.
N
5
5
4
3
17
L
1364676
1364676
1364676
1364676
1364676
SNPs
12920
13129
13420
9581
27929
Sing.
8674
8710
10374
9581
12181
Πtot
0.0044
0.0045
0.0053
0.0047
0.0047
D
-0.243
-0.221
-0.169
-0.211
Analiza PCA:
676 contigów - 27,929 SNPs
79 genów kandydatów - 1680 SNPs
UN2
PUN17
PUN24
PUN23
PUN18
PUN28
M5
M2
M1 UG3
M4
Coord. 2
Coord. 2
PS2
PUG1PUG3
PUG2
M3
UG1
UG2
UN3
PS3
PS1
PS4
PS5
UN4
UN1
Coord. 1
PM12
PM14
PM16
PM8 PM1
PM7
PM5
PM4
PS37-45
PS46
Coord. 1
Biorą pod uwagę fakt:
• dane z analiz sekwencjonowania DNA nowej generacji nie dostarczają zwyczajnie większej liczby
miejsc polimorficznych poprzez dostęp do większych fragmentów genomu
• wielkość i charakterystyka genomu szpikowych
→ większość SNPs przydatna do genotypowania
Podziękowania
Thank you!