+ e - theta.edu.pl

Transkrypt

+ e - theta.edu.pl

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE
HODOWLĘ
Detekcja genów głównych w populacjach zwierząt
hodowlanych – wprowadzenie
WSTĘP
1. Modelowanie zmienności genetycznej
2. Modele statystyczne
3. Analiza sprzężeń i analiza asocjacyjna
Copyright ©2012, Joanna Szyda
MODELOWANIE ZMIENNOŚCI GENETYCZNEJ
FENOTYPOWA
WARTOŚĆ
CECHY
=
EFEKTY WSPÓLNE DLA
WSZYSTKICH OSOBNIKÓW
+
EFEKTY ŚRODOWISKOWE
+
EFEKTY GENETYCZNE
+
EFEKTY INTERAKCJI
ŚRODOWISKA I GENÓW
+
EFEKTY BŁĘDU
y=+s+g+i+e
efekt pojedynczego genu
GENY
GŁÓWNE
POLIGENY
granica między genem
głównym, a poligenem nie
jest ściśle określona
liczba genów
POWIĄZANIE WARTOŚCI FENOTYPOWEJ CECHY Z SEGREGACJĄ
MARKERÓW
• wartość fenotypowa cechy
• genotypy markerów
• spokrewnienie osobników
ANALIZA SPRZĘŻEŃ
ANALIZA SPRZĘŻEŃ - definicja
ANALIZA SPRZĘŻEŃ
1. Statystyczna procedura poszukiwania genów
2. Poszukiwanie najbardziej prawdopodobnej lokalizacji
QTL na chromosomie
3. Wykorzystująca prawdopodobieństwo dziedziczenia
(niewidzialnego) genu głównego
4. Obliczone na podstawie częstości rekombinacji
pomiędzy (widzialnymi) markerami
ANALIZA SPRZĘŻEŃ - źródła informacji
ANALIZA SPRZĘŻEŃ
wartości
cechy
genotypy
markerów
spokrewnienie
MODELE STATYSTYCZNE
y=+s+g+i+e
LICZBA QTL
• pojedynczy
• kilka sprzężonych QTL
• epistaza pomiędzy genami
WPŁYW QTL
• wpływa na jedną cechę
• wpływa na kilka cech
• efekty epistatyczne
OKREŚLENIE POŁOŻENIA QTL
• na podstawie pojedynczego markera
• na podstawie dwu sąsiadujących markerów (przedział
markerowy)
• na podstawie kilku markerów
POSZUKIWANIE NAJBARDZIEJ PRAWDOPODOBNEJ LOKALIZACJI
GENU GŁÓWNEGO NA CHROMOSOMIE
1)
M1
M2
M3 M4 M5
M6
M7
0 cM
2)
100 cM
QTL
M1 M2
M3 M4 M5
M6
lokalizacja: 1 cM
M7
0 cM
100 cM
lokalizacja: 2 cM
QTL
...
n)
0 cM
M1
M2
M3 M4 M5
M6
M7
100 cM
lokalizacja: 99 cM
QTL
MODELE STATYSTYCZNE
POSZUKIWANIE NAJBARDZIEJ PRAWDOPODOBNEJ LOKALIZACJI
GENU GŁÓWNEGO NA CHROMOSOMIE
1)
y =  + q1 + e
 prawdopodobieństwo
2)
y =  + q2 + e
...
n)
y =  + q99 + e  prawdopodobieństwo
ELEMENTY MODELU:
y
wartość cechy

efekty wspólne dla wszystkich osobników
e
efekty niemierzalne (błąd)
qi
efekt genu głównego zlokalizowanego w
pozycji " i "
MODELE STATYSTYCZNE
y =  + qi + e
1.17
2.01
1.56
1.93
1
1
1
1
0.95
0.35
0.84
1.00
• prawdopodobieństwo, że dany osobnik odziedziczył
określony genotyp genu głównego (QQ, Qq, qq)
• prawdopodobieństwo jest obliczone na podstawie
genotypu markerów
ANALIZA SPRZĘŻEŃ
1) y =  + q1 + e
2) y =  + q2 + e
...
-271
ln ( prawdopod. )
n) y =  + q99 + e
-274
maks.
prawd.
80 cM
-277
-280
-283
-286
0
25
50
75
100
125
lokalizacja genu
ANALIZA SPRZĘŻEŃ
HIPOTEZY
• H0: w pozycji "i" brak genu głównego
• H1: w pozycji "i" występuje gen główny
 qi = 0
 qi  0
MODELE STATYSTYCZNE
• MODEL0:
• MODEL1:
y=+e
y =  + qi + e
TEST
• LRT (likelihood ratio test)
LRT = -2 [ lnPr ( MODEL 0 ) - lnPr ( MODEL 1 ) ] ~ c2M1-M0
ANALIZA SPRZĘŻEŃ
• najbardziej prawdopodobna lokalizacja genu: 80 cM
• dla pozycji 80 cM TLR = 25.46
• założone maksymalne prawdopodobieństwo błędu aMAX = 0.01
• prawdopodobieństwo błędu dla LRT=25.46 wynosi aT=0.0000045
• aMAX > aT
30
 H1
25
 na dziedziczenie cechy ma
wpływ gen główny
20
 gen jest zlokalizowany
na chrom. 6 ok. 80 cM
od pierwszego markera
maks.
prawd.
80 cM
LRT 15
10
5
0
0
25
50
75
100
125
lokalizacja genu
ANALIZA SPRZĘŻEŃ
http://www.animalgenome.org/cgi-bin/QTLdb/index
ANALIZA ASOCJACYJNA
ANALIZA ASOCJACYJNA - definicja
ANALIZA ASOCJACYJNA
1. Statystyczna procedura poszukiwania genów
2. Poszukiwanie markerów powiązanych z genem
głównym
3. Wykorzystująca zaburzenie równowagi HW pomiędzy
(widzialnymi) markerami, a (niewidzialnym) genem
głównym
4. Obliczone na podstawie korelacji pomiędzy
zmiennością cechy, a zmiennością genotypów
markerów
ANALIZA ASOCJACYJNA - źródła informacji
ANALIZA ASOCJACYJNA
wartości
cechy
genotypy
markerów
spokrewnienie
ANALIZA ASOCJACYJNA - poszukiwanie genów
POSZUKIWANIE MARKERA O NAJWYŻSZEJ KORELACJI ZE
ZMIENNOŚCIĄ CECHY
1)
M1
M2
M3 M4 M5
M6
M7
0 cM
2)
100 cM
QTL
M1 M2
M3 M4 M5
M6
lokalizacja: 1 Marker
M7
0 cM
100 cM
lokalizacja: 2 Marker
QTL
...
7)
0 cM
M1
M2
M3 M4 M5
M6
M7
100 cM
lokalizacja: 7 marker
QTL
ANALIZA ASOCJACYJNA - poszukiwanie genów
POSZUKIWANIE MARKERA O NAJWYŻSZEJ KORELACJI ZE
ZMIENNOŚCIĄ CECHY
1)
y =  + m1 + e
2)
y =  + m2 + e
...
7)
y =  + m7 + e
ELEMENTY MODELU:
y
wartość cechy

efekty wspólne dla wszystkich osobników
e
efekty niemierzalne (błąd)
mi
efekt markera " i "
ANALIZA ASOCJACYJNA – model statystyczny
y =  + mi + e
1.17
2.01
1.56
1.93
1
1
1
1
1
0
-1
0
• Kod genotypu markera (11, 12, 22)
TESTOWANIE - prawdopodobieństwa dla każdego markera
1)
y =  + m1 + e  prawdopodobieństwo
2)
...
-275
ln ( prawdopod. )
7)
-280
-285
-290
-295
1
2
3
4
5
6
7
marker
TESTOWANIE - hipotezy i test
HIPOTEZY
• H0: marker "i" nieskorelowany z QTL
•
 mi = 0
 brak asocjacji
H1: marker "i" skorelowany z QTL
 mi  0
 występuje asocjacja
MODELE STATYSTYCZNE
• MODEL0:
• MODEL1:
y=+e
y =  + mi + e
TEST
•
LRT (likelihood ratio test)
LRT = -2 [ lnPr ( MODEL0 ) - lnPr ( MODEL1 ) ] ~ c2M1-M0
TESTOWANIE - wnioskowanie
• najbardziej prawdopodobna lokalizacja genu: marker 5
• LRT = 18.72
• założone maksymalne prawdopodobieństwo błędu aMAX = 0.01
• prawdopodobieństwo błędu dla LRT=25.46 wynosi aT=0.000015
20
• aMAX > aT
 H1
 na dziedziczenie cechy ma
wpływ gen główny
15
LRT 10
 gen jest w LD z markerem 5
5
0
1
2
3
4
5
6
7
lokalizacja genu
1. Modelowanie zmienności genetycznej
2. Modele statystyczne
3. Analiza sprzężeń i analiza asocjacyjna

+ e - theta.edu.pl

Transkrypt

Podobne dokumenty

Wykład 4 - theta.edu.pl

TEST T

PODSTAWY BIOINFORMATYKI

biometria - theta.edu.pl

CO TO JEST PRAWDOPODOBIEŃSTWO

Lista studentów CHIRURGIA PLASTYCZNA (fakultet)