Mapowanie genów

Transkrypt

Mapowanie genów
Mapowanie genów
10 maja 2004
1
Co daje identyfikacja genów?
• poszerzenie wiedzy podstawowej
• perspektywy przyspieszenia i zwie, kszenia efektywności selekcji
• precyzyjne wprowadzanie obych genów do populacji (introgresja)
2
Klonowanie pozycyjne genów kandydujacych
,
Najbardziej preferowana metoda identyfikacji genów
Etapy:
1. określenie pozycji genu na chromosomie wzgledem
markerów
,
2. określenie genów kandydatów we wskazanym rejonie (mapy transkrypcyjne)
3. zidentyfikowanie zmienności ksztaltuja,cej ceche,
3
Markery genetyczne
Trzy wlasności markera:
1. specyficzny dla danego locus
2. polimorficzny w danej populacji
3. latwy do oznaczenia
4
Typy markerów genetycznych
• markery fenotypowe
• grupy krwi
• polimorfizm biochemiczny
• RFLPs
• Minisatelity (VNTR)
• Mikrosatelity (SSR)
• SNPs
5
RFLPs
RFLPs
AA Aa aa
A
• kodominuja,ce
• potrzebna wlaściwa kombinacja enzym-sonda
a
restriction site
probe
1 2 3
resulting gel
• tylko 200 enzymów,
liczba sond nieograniczona
6
RFLPs
• mutacja punktowa
• insercja35
• zmienna
powtórzeń
liczba
7
RAPDs
RAPDs
AA Aa aa
A
PCR product
a
• dominuja,ce
1 2 3
resulting gel
• wiele loci jednocześnie
8
Mikrosatelity
Microsatellites
GCCGCCGCC
GCCGCCGCCGCCGCC
AA Aa aa
A
a
• kodominuja,ce
• duża obfitość
1 2 3
resulting gel
• równomiernie rozlożone
w genomie
• pólautomatyczne wykrywanie
9
Strategie mapowania
• Linkage Analysis (analiza sprzeż
, eniowa)
• DNA Pooling / Bulk Segregant Analysis
• Genetically Directed Representational Difference Analysis
• analiza asocjacji i mapowanie genów i.p.p
• Genome Mismatch Scanning
10
Tempo rekombinacji
49 mejoz bez crossing−over
A
B
B
A
B
a
b
b
b
a
b
A
B
A
b
b
1+1
1 mejoza z crossing−over
A
B
tempo rekombinacji
A
B
A
b
A
b
a
B
a
B
a
b
a
b
49+49+49+49+1+1+1+1
= 0.01
11
Ukryte crossing-over
A
B
a
b
A
a
B
b
B
A
A
B
a
a
a
b
b
A B
a
b
A B
a
b
A
B
A
B
a
a
b
b
12
Odleglość genetyczna
• mierzona cze, stościa, (prawdopodobieństwem) crossing-over
• jednostka, jest Morgan
• 1 centiMorgan - prawdopodobieństwo crossing-over wynosi 0.01
• addytywna (rAC = rAB + rBC )
• określana na podstawie rekombinacji
13
Funkcje mapowe
Pozwalaja, ’przeliczyć’ obserwowane tempo rekombinacji na odleglość genetyczna,
Najcześ
, ciej używane:
• Morgana
• Haldane’a
• Kosambiego
14
Funkcja Kosambiego
1 + 2θ
x = 0.25 × ln
1 − 2θ
exp(4x) − 1
θ = 0.5 ×
exp(4x) + 1
• x odleglość genetyczna (w Morganach)
• θ tempo rekombinacji
15
Funkcje mapowe
1
Haldane
0.8
odleglosc
Kosambi
0.6
0.4
Morgan
0.2
0
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
tempo rekombinacji
0.4
0.45
16
Odleglość genetyczna i fizyczna
1 cM ˜ 1 M p.z.
17
Skad
uzyskać tempo rekombinacji?
,
• bezpośrednie genotypowanie plemników i oocytów (tylko markery genetyczne)
• genotypowanie rodziców i potomstwa
? jedyna możliwość dla cech fenotypowych
? wymaga podwójnych heterozygot
18
Informatywność markera
A1 A2
A1 A1
1 1
potomstwo A A
A1 A1
A1 A1
A1 A2
potomstwo
A1 A2
potomstwo
A1 A1
A1 A2
A2A2
A1 A1
1
A A2
A1 A3
1 4
AA
potomstwo 2 3
AA
2 4
A3 A4
A A
A1A2
19
Miary informatywności markera
• Heterozygotyczność
H =1−
X
p2i
• Polymorphism Information Content (PIC)
P IC = 1 −
n
X
i=1
p2i −
n−1
X
n
X
i=1 j=i+1
p2i p2j
20
Test lod score
• Test statystyczny weryfikuja,cy hipoteze, o niezależnej segregacji genów z
różnych loci
• Hipotezy:
? H0: brak sprzeż
, enia (θ = 0.5)
? H1: sprzeż
, enie loci (θ < 0.5)
• Wiarogodność (Likelihood)
? miara sily dowodów na rzecz hipotezy
? prawdopodobieństwo danych obliczone przy danej hipotezie
21
• Iloraz wiarygodności (likelihood ratio)
L(dane | θ)
LR =
L(dane | θ = 0.5)
• Lod score
Z = log10(LR)
• Interpretacja
? Z > 3 geny sa, sprzeż
, one
? Z < −2 brak sprzeż
, enia
? −2 < Z < 3 brak informacji
22
Test lod score
A1 A2 B1 B2
potomstwo
A1 A1 B1 B1
gamety
ojcowska
matczyna
N
A1 A1 B1 B1
A1 B1
A1 B1
9
A1 A2 B1 B1
A1 A1 B1 B2
A1 A2 B1 B2
A2 B1
A1 B2
A2 B2
A1 B1
A1 B1
A1 B1
1
1
9
23
Test lod score
• najprawdopodobniej u ojca wyste, puje sprzeżenie A1-B1 oraz A2-B2
• oszacowane tempo rekombinacji θb = 2/20 = 0.1
• wiarogodność przy θ = 0.1
L(0.1) =
20
2
(1 − 0.1)18 ∗ 0.12
• wiarogodność przy braku sprzeż
, enia (θ = 0.5)
24
L(0.5) =
20
2
(1 − 0.5)18 ∗ 0.52
• lod score
L(0.1)
Z(0.1) = log10
' 3.2
L(0.5)
25
Test lod score
max−1
3
Z
0
−2
0
tempo rekombinacji
0.5
26
Programy komputerowe
• LINKAGE
• FASTLINK
• VITESSE
• CRIMAP - pozwala oszacować uszeregowanie genów!
27
Mapy sprzeżeniowe
,
Fragment mapy sprzeż
, eniowej chromosomu 6 świni.
28
Mapy sprzeżeniowe
(1999)
,
Gatunek
Bydlo
Świnia
Owca
Koń
Pies
liczba markerów
1240
1042
519
162
276
przecie, tna odleglość
mie, dzy markerami
2,5
2,2
6,4
14,2
10,0
29
Mapowanie choroby monogenicznej
22
12
2|2
d|d
12
22
12
12
22
22 12
22 22
2|1 2|2
d|d d|D
2|1 1|2
D|d D|d
2|2
d|D
2|1
d|d
30
Mapowanie choroby monogenicznej
LI (θ) = (1 − θ)4
LII (θ) = θ4
L(θ) = 12 [(1 − θ)4 + θ4]
h
4
i
0.5 (1 − 0.25) + 0.254
h
i ' 0.79
Z(0.25) = log10
4
0.5 (1 − 0.5) + 0.54
31
Mapowanie choroby monogenicznej
5
lod score
4
3
2
1
0
−1
−2
0
0.15
0.25
0.35
tempo rekombinacji
0.45
32
Cechy zlożone
A H a
disease
loci
Aa
bb
aa
Bb
locus
heterogeneity
Aa
bb
Ha
bb
allelic
heterogeneity
Aa
bb
Aa
Bb
epistasis
B b
Aa
bb
aa
bb
incomplete
penetrance
phenocopy
33
Geny cech ilościowych
• QTL (Quantitative Trait Locus) to locus genu cechy ilościowej.
• Gen glówny (major gene) - to QTL o bardzo dużym efekcie.
34
czestosc
Model poligeniczny
abc
ABc
AbC
aBc
abC
genotyp
ABC
35
Model mieszany - QTL + poligeny
czestosc
Qq
QQ
qq
abc
ABc
AbC
aBc
abC
ABc
AbC
aBc
abC
ABc
ABc
AbC
aBc
genotyp
ABC
36
Mapowanie QTL
Glówna strategia
1. (utworzenie populacji w nierównowadze gametycznej)
2. śledzenie (przy pomocy markerów) przekazywania fragmentów chromosomowych od rodziców do potomstwa
3. porównanie wydajności zwierza,t, które odziedziczyly różne fragmenty chromosomowe
37
Nierównowaga gametyczna
A
pA
a
pa
B qB
pA q B + D p a q B − D
b
pA q b − D
qb
pa q b + D
38
nierownowaga gametyczna (D)
Nierównowaga gametyczna
1
0.9
r=0.01
0.8
0.7
0.6
0.5
0.4
r=0.05
r=0.1
0.3
0.2
0.1
0
r=0.5
2
4
6
pokolenie
r=0.3
8
10
39
Nierównowaga gametyczna
Mm
D=0.0
mm
frequency
Qq
MM
Qq
qq
Qq
qq
QQ
QQ
QQ
qq
Mm
mm
frequency
D=0.1
qq
MM
QQ
qq
Qq
Qq
qq
QQ
Qq
QQ
40
Mapowanie QTL
Uklady doświadczalne:
• krzyżówki mie, dzy liniami, rasami i gatunkami
? nierównowaga gametyczna w populacji
? duża szansa wykrycia QTL
? ale tylko tych odpowiedzialnych za różnice mie, dzy rasami
• zwierze, ta czystorasowe
? nierównowaga gametyczna w rodzinach
? mniejsza szansa wykrycia QTL
? QTL odpowiedzialne za zmienność osobnicza,
41
Uklad doświadczalny F2
• świnie
? dzik × świnie ras szlachetnych
? Meishan × świnie ras szlachetnych
? zlotnicka pstra × wielka biala polska
• drób
? Red Jungle Fowl × White Leghorn
? Sasumadorri × White Plymouth Rock
• bydlo
? bydlo holsztyńsko-fryzyjskie × charolais
42
Uklad doświadczalny F2
F0
rasa A
rasa B
M −− Q
m −− q
M −− Q
m −− q
F1
F2
genotypowanie
M −− Q
m −− q
M
M
m
M
m
m
pomiar cech
43
Uklad doświadczalny F2
MMQQ
mmqq
MmQq
MM
1/4
Mm
1/2
gamety
mm
1/4
P(MQ)=P(mq)=0.5(1−r)
P(Mq)=P(mQ)=0.5r
P(QQ|MM) = P(MQ)*P(MQ)/4=(1−r)*(1−r)
P(Qq|MM) = 2r(1−r)
P(qq|MM) = r*r
44
Uklad doświadczalny F2
L(z|M M ) =
P (QQ|M M ) × f (z, µQQ, σ)
+P (Qq|M M ) × f (z, µQq , σ)
+P (qq|M M ) × f (z, µqq , σ)
f (z, µQQ, σ) =
√ 1
2πσ
2
(z−µQQ)
exp
2
2σ 2
45
Mapowanie przedzialowe
A
Q
B
46
W populacji F2, po krzyżowaniu
knurów Meishan z lochami
holenderskimi, badano grubość
sloniny. Zlokalizowano QTL na
chromosomie 17, którego efekt
addytywny wynosi a = 2.1mm
(De Koning 2001). Strzalki
wskazuja, pozycje markerów.
statystyka testowa
Mapowanie QTL
wartosc krytyczna
0
30
chromosom 17 swini
70 80
150 cM
47
Mapowanie w populacjach hodowlanych
Trudniejsze niż u mieszańców:
• selekcja prowadzi do utrwalenia korzystnych alleli i redukcji zmiennośći genetycznej
• także mniejsza zmienność markerów
• w poszczególnych rodzinach
? segreguja, różne QTL i allele
? różne fazy sprzeż
, enia
• pomiar fenotypów mniej doskonaly
Latwiejsze niż u czlowieka - duże grupy (pól)rodzeństwa
48
Daughter design
Pozwala wykryć QTL w czystych
Mm
rasach. Porównywane sa, córki
krowy, które odziedziczyly po
ojcu alterantywne allele
markerowe. Genotypowane sa,
buhaje, matki i córki.
M*
m*
49
Granddaughter design
genotypowanie
Genotypowane sa, tylko buhaje
(duża oszczedność).
Zamiast
,
fenotypów bada sie, wartość
hodowlana, buhajów, oceniona, na
podstawie dużej liczby córek.
“h2“ wartości hodowlanej aż 80%.
ocena potomstwa
50
Genotypowanie wybiórcze
20%
1 S.D.
20%
Genotypowanie osobników
odbiegajacych
1 S.D. od średniej
,
pozwala zredukować liczbe,
osobników o 60% bez straty
mocy doświadczenia.
51
Dokladność analizy sprzeżeniowej
,
• Wymagana - 1cM (klonowanie pozycyjne genów kandydatów)
• Ograniczona
? doste, pnościa, loci markerowych
? ilościa, i rozkladem crossing-over w badanej rodzinie
• Osia,gana
? cechy proste - kilka cM (400 mejoz daje 90% szans na lokalizacje genu z
dokladnościa, 1cM)
? cechy zlożone - kilkadziesia,t cM
52
Mapowanie porównawcze
• Pozwala zawe, zić grupe, genów kandydatów we wskazanym regionie (50cM to
setki genów).
• Wykorzystuje zjawisko konserwatyzmu genetycznego - tu podobieństwa ulożenia genów u różnych gatunków.
• Najważniejsze źródla informacji to mapy czlowieka i myszy.
53
Mapowanie genów i.p.p.
• Przy b. bliskim sa,siedztwie markera i genu crossing-over prawie nie zachodzi,
co daje duża, nierównowage, gametyczna,.
• Jeżeli przyczyna, choroby jest 1 zmutowany gen, chorzy be, da, dzielili sa,siaduja,ce
markery i.p.p.
54
Mapowanie genów i.p.p.
1 2
3 4
1 3
5 6
3 5
r=1/8
r=1/4
55
Mapowanie genów i.p.p.
para
1
2
4
3
5
spokrew.
1
4
1/8
1
5
1/8
2
3
1/4
2
5
1/8
3
4
1/8
4
5
1/16
13/16
13/16
56
Asocjacja allel-cecha
• test χ2 dla danego allelu
gr. dośw.
gr. kontrolna
testowany allel
obecny brak
n1
n3
n2
n4
• sila asocjacji - ryzyko relatywne
R=
n1×(n2+n4)
n2×(n1+n3)
57
Przypadek cukrzycy
Badano plemiona Pima i Tohono O’odham
(pd. Arizona) w których czesto
wystepuje
,
,
cukrzyca typu 2. Wykonano proste porównanie udzialu cukrzyków w dwóch grupach haplotypowych. Badanie wykazalo,
że pewien allel Gm+ jest negatywnie skorelowany z cukrzyca.,
Gm+
obecny
brak
ogólem
293
4627
% cukrzyków
8%
29%
58
Populacje laczone
,
Populacja A - 100 osobników
allel
N chorych % chorych
obecny 80
16
20%
brak
20
4
20%
Populacja B - 100 osobników
allel
N chorych % chorych
obecny 30
15
50%
brak
70
35
50%
A+B - 200 osobników
allel
N
chorych
% chorych
obecny 110 16+15=31
28%
brak
90
4+35=39
43%
59
Przypadek cukrzycy - c.d.
Dalsze badanie wykazalo, że asocjacja jest
spowodowana przemieszaniem plemion z
Kaukazami. U Kaukazów allel Gm+ wystepuje
z czestoci
a, 67%, a u rodowitych
,
,
Pima i Tohono <1%. Badania ograniczone
do rodowitych Pima i Tohono nie wykazaly
asocjacji.
Gm+
obecny
brak
ogólem
17
1764
% cukrzyków
59%
60%
60
Test TDT
przekazany
Transmission disequlibrium test
• porównuje ile razy dany allel
zostal przekazany (T) chorym a
ile nie (NT)
33
12
• przy braku sprzeż
, enia T' NT
• χ21 = (T − N T )2/(T + N T )
nie przekazany
31
61
Test TDT
a b
b c
T +1
T +0
NT +1
NT +0
b c
a b
c c
T +1
NT +0
b c
62
Test TDT
Przetestowano 21 markerów u 455
rodzin cukrzyków typu 1. Jeden
z trzech alleli markera D2S152 jest
mocno powia,zany z cukrzyca,. Obecność tego allelu może wskazywać na
ryzyko zachorowania.
allel
228
230
240
T
81
59
36
NT
45
73
24
χ2
10.29
1.48
2.40
p
0.001
0.223
0.121
63
Podsumowanie
• Określenie pozycji genu jest pierwszym krokiem do jego identyfikacji.
• Najlatwiej określić pozycje, genów wzgle, dem genów markerowych.
• Dla wielu gatunków powstaly (markerowe) mapy sprzeż
, eniowe stanowia,ce matryce, do lokalizacji ważnych genów.
• Najważniejsze źródla markerów genetycznych to RFLP, mikro- i minisatelity
oraz SNP.
• Analiza sprzeż
, eniowa jest najważniejszym narze, dziem mapowania. Bazuje na
obserwacji rekombinacji genów.
64
• Geny sprzeż
, one maja, tempo rekombinacji < 0.5.
• Funkcja mapowa pozwala wyliczyć odleglość genetyczna, (cM) z oszacowanego
tempa rekombinacji.
• Test lod score testuje czy dwa geny sa, sprzeż
, one.
• QTL można wykryć analizuja,c mieszańce mocno zróżnicowanych ras lub badaja,c poszczególne rodziny.
• Do zmapowania QTL potrzeba setek osobników, dla cech prostej tylko kilkanaście.
• Wste, pna lokalizacja QTL daje bardzo niedokladny wynik. Dokladna lokalizacja
QTL stanowi poważne wyzwanie.
65
• Informacja genomowa może może być przenoszona mie, dzy gatunkami przez
mapowanie porównawcze.
• Bliskie sprzeż
, enie utrzymuje asocjacje allel (markerowy) - cecha przez wiele
pokoleń.