+ e - theta.edu.pl

Transkrypt

+ e - theta.edu.pl
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE
HODOWLĘ
Detekcja genów głównych w populacjach zwierząt
hodowlanych – wprowadzenie
WSTĘP
1. Modelowanie zmienności genetycznej
2. Modele statystyczne
3. Analiza sprzężeń i analiza asocjacyjna
Copyright ©2012, Joanna Szyda
MODELOWANIE ZMIENNOŚCI GENETYCZNEJ
FENOTYPOWA
WARTOŚĆ
CECHY
=
EFEKTY WSPÓLNE DLA
WSZYSTKICH OSOBNIKÓW
+
EFEKTY ŚRODOWISKOWE
+
EFEKTY GENETYCZNE
+
EFEKTY INTERAKCJI
ŚRODOWISKA I GENÓW
+
EFEKTY BŁĘDU
Copyright ©2012, Joanna Szyda
MODELOWANIE ZMIENNOŚCI GENETYCZNEJ
y=+s+g+i+e
efekt pojedynczego genu
GENY
GŁÓWNE
POLIGENY
granica między genem
głównym, a poligenem nie
jest ściśle określona
liczba genów
Copyright ©2012, Joanna Szyda
MODELOWANIE ZMIENNOŚCI GENETYCZNEJ
POWIĄZANIE WARTOŚCI FENOTYPOWEJ CECHY Z SEGREGACJĄ
MARKERÓW
• wartość fenotypowa cechy
• genotypy markerów
• spokrewnienie osobników
Copyright ©2012, Joanna Szyda
MODELOWANIE ZMIENNOŚCI GENETYCZNEJ
Copyright ©2012, Joanna Szyda
ANALIZA SPRZĘŻEŃ
ANALIZA SPRZĘŻEŃ - definicja
ANALIZA SPRZĘŻEŃ
1. Statystyczna procedura poszukiwania genów
2. Poszukiwanie najbardziej prawdopodobnej lokalizacji
QTL na chromosomie
3. Wykorzystująca prawdopodobieństwo dziedziczenia
(niewidzialnego) genu głównego
4. Obliczone na podstawie częstości rekombinacji
pomiędzy (widzialnymi) markerami
Copyright ©2012, Joanna Szyda
ANALIZA SPRZĘŻEŃ - źródła informacji
ANALIZA SPRZĘŻEŃ
wartości
cechy
genotypy
markerów
spokrewnienie
Copyright ©2012, Joanna Szyda
MODELE STATYSTYCZNE
y=+s+g+i+e
LICZBA QTL
• pojedynczy
• kilka sprzężonych QTL
• epistaza pomiędzy genami
WPŁYW QTL
• wpływa na jedną cechę
• wpływa na kilka cech
• efekty epistatyczne
OKREŚLENIE POŁOŻENIA QTL
• na podstawie pojedynczego markera
• na podstawie dwu sąsiadujących markerów (przedział
markerowy)
• na podstawie kilku markerów
Copyright ©2012, Joanna Szyda
MODELOWANIE ZMIENNOŚCI GENETYCZNEJ
POSZUKIWANIE NAJBARDZIEJ PRAWDOPODOBNEJ LOKALIZACJI
GENU GŁÓWNEGO NA CHROMOSOMIE
1)
M1
M2
M3 M4 M5
M6
M7
0 cM
2)
100 cM
QTL
M1 M2
M3 M4 M5
M6
lokalizacja: 1 cM
M7
0 cM
100 cM
lokalizacja: 2 cM
QTL
...
n)
0 cM
M1
M2
M3 M4 M5
M6
M7
100 cM
lokalizacja: 99 cM
QTL
Copyright ©2012, Joanna Szyda
MODELE STATYSTYCZNE
POSZUKIWANIE NAJBARDZIEJ PRAWDOPODOBNEJ LOKALIZACJI
GENU GŁÓWNEGO NA CHROMOSOMIE
1)
y =  + q1 + e
 prawdopodobieństwo
2)
y =  + q2 + e
 prawdopodobieństwo
...
n)
y =  + q99 + e  prawdopodobieństwo
ELEMENTY MODELU:
y
wartość cechy

efekty wspólne dla wszystkich osobników
e
efekty niemierzalne (błąd)
qi
efekt genu głównego zlokalizowanego w
pozycji " i "
Copyright ©2012, Joanna Szyda
MODELE STATYSTYCZNE
y =  + qi + e
1.17
2.01
1.56
1.93
1
1
1
1
0.95
0.35
0.84
1.00
• prawdopodobieństwo, że dany osobnik odziedziczył
określony genotyp genu głównego (QQ, Qq, qq)
• prawdopodobieństwo jest obliczone na podstawie
genotypu markerów
Copyright ©2012, Joanna Szyda
ANALIZA SPRZĘŻEŃ
1) y =  + q1 + e
 prawdopodobieństwo
2) y =  + q2 + e
 prawdopodobieństwo
...
 prawdopodobieństwo
-271
ln ( prawdopod. )
n) y =  + q99 + e
-274
maks.
prawd.
80 cM
-277
-280
-283
-286
0
25
50
75
100
125
lokalizacja genu
Copyright ©2012, Joanna Szyda
ANALIZA SPRZĘŻEŃ
HIPOTEZY
• H0: w pozycji "i" brak genu głównego
• H1: w pozycji "i" występuje gen główny
 qi = 0
 qi  0
MODELE STATYSTYCZNE
• MODEL0:
• MODEL1:
y=+e
y =  + qi + e
TEST
• LRT (likelihood ratio test)
LRT = -2 [ lnPr ( MODEL 0 ) - lnPr ( MODEL 1 ) ] ~ c2M1-M0
Copyright ©2012, Joanna Szyda
ANALIZA SPRZĘŻEŃ
• najbardziej prawdopodobna lokalizacja genu: 80 cM
• dla pozycji 80 cM TLR = 25.46
• założone maksymalne prawdopodobieństwo błędu aMAX = 0.01
• prawdopodobieństwo błędu dla LRT=25.46 wynosi aT=0.0000045
• aMAX > aT
30
 H1
25
 na dziedziczenie cechy ma
wpływ gen główny
20
 gen jest zlokalizowany
na chrom. 6 ok. 80 cM
od pierwszego markera
maks.
prawd.
80 cM
LRT 15
10
5
0
0
25
50
75
100
125
lokalizacja genu
Copyright ©2012, Joanna Szyda
ANALIZA SPRZĘŻEŃ
http://www.animalgenome.org/cgi-bin/QTLdb/index
Copyright ©2012, Joanna Szyda
ANALIZA ASOCJACYJNA
ANALIZA ASOCJACYJNA - definicja
ANALIZA ASOCJACYJNA
1. Statystyczna procedura poszukiwania genów
2. Poszukiwanie markerów powiązanych z genem
głównym
3. Wykorzystująca zaburzenie równowagi HW pomiędzy
(widzialnymi) markerami, a (niewidzialnym) genem
głównym
4. Obliczone na podstawie korelacji pomiędzy
zmiennością cechy, a zmiennością genotypów
markerów
Copyright ©2012, Joanna Szyda
ANALIZA ASOCJACYJNA - źródła informacji
ANALIZA ASOCJACYJNA
wartości
cechy
genotypy
markerów
spokrewnienie
Copyright ©2012, Joanna Szyda
ANALIZA ASOCJACYJNA - poszukiwanie genów
POSZUKIWANIE MARKERA O NAJWYŻSZEJ KORELACJI ZE
ZMIENNOŚCIĄ CECHY
1)
M1
M2
M3 M4 M5
M6
M7
0 cM
2)
100 cM
QTL
M1 M2
M3 M4 M5
M6
lokalizacja: 1 Marker
M7
0 cM
100 cM
lokalizacja: 2 Marker
QTL
...
7)
0 cM
M1
M2
M3 M4 M5
M6
M7
100 cM
lokalizacja: 7 marker
QTL
Copyright ©2012, Joanna Szyda
ANALIZA ASOCJACYJNA - poszukiwanie genów
POSZUKIWANIE MARKERA O NAJWYŻSZEJ KORELACJI ZE
ZMIENNOŚCIĄ CECHY
1)
y =  + m1 + e
 prawdopodobieństwo
2)
y =  + m2 + e
 prawdopodobieństwo
...
7)
y =  + m7 + e
 prawdopodobieństwo
ELEMENTY MODELU:
y
wartość cechy

efekty wspólne dla wszystkich osobników
e
efekty niemierzalne (błąd)
mi
efekt markera " i "
Copyright ©2012, Joanna Szyda
ANALIZA ASOCJACYJNA – model statystyczny
y =  + mi + e
1.17
2.01
1.56
1.93
1
1
1
1
1
0
-1
0
• Kod genotypu markera (11, 12, 22)
Copyright ©2012, Joanna Szyda
TESTOWANIE - prawdopodobieństwa dla każdego markera
1)
y =  + m1 + e  prawdopodobieństwo
2)
y =  + m2 + e  prawdopodobieństwo
...
y =  + m7 + e  prawdopodobieństwo
-275
ln ( prawdopod. )
7)
-280
-285
-290
-295
1
2
3
4
5
6
7
marker
Copyright ©2012, Joanna Szyda
TESTOWANIE - hipotezy i test
HIPOTEZY
• H0: marker "i" nieskorelowany z QTL
•
 mi = 0
 brak asocjacji
H1: marker "i" skorelowany z QTL
 mi  0
 występuje asocjacja
MODELE STATYSTYCZNE
• MODEL0:
• MODEL1:
y=+e
y =  + mi + e
TEST
•
LRT (likelihood ratio test)
LRT = -2 [ lnPr ( MODEL0 ) - lnPr ( MODEL1 ) ] ~ c2M1-M0
Copyright ©2012, Joanna Szyda
TESTOWANIE - wnioskowanie
• najbardziej prawdopodobna lokalizacja genu: marker 5
• LRT = 18.72
• założone maksymalne prawdopodobieństwo błędu aMAX = 0.01
• prawdopodobieństwo błędu dla LRT=25.46 wynosi aT=0.000015
20
• aMAX > aT
 H1
 na dziedziczenie cechy ma
wpływ gen główny
15
LRT 10
 gen jest w LD z markerem 5
5
0
1
2
3
4
5
6
7
lokalizacja genu
Copyright ©2012, Joanna Szyda
1. Modelowanie zmienności genetycznej
2. Modele statystyczne
3. Analiza sprzężeń i analiza asocjacyjna

Podobne dokumenty