+ e - theta.edu.pl
Transkrypt
+ e - theta.edu.pl
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Detekcja genów głównych w populacjach zwierząt hodowlanych – wprowadzenie WSTĘP 1. Modelowanie zmienności genetycznej 2. Modele statystyczne 3. Analiza sprzężeń i analiza asocjacyjna Copyright ©2012, Joanna Szyda MODELOWANIE ZMIENNOŚCI GENETYCZNEJ FENOTYPOWA WARTOŚĆ CECHY = EFEKTY WSPÓLNE DLA WSZYSTKICH OSOBNIKÓW + EFEKTY ŚRODOWISKOWE + EFEKTY GENETYCZNE + EFEKTY INTERAKCJI ŚRODOWISKA I GENÓW + EFEKTY BŁĘDU Copyright ©2012, Joanna Szyda MODELOWANIE ZMIENNOŚCI GENETYCZNEJ y=+s+g+i+e efekt pojedynczego genu GENY GŁÓWNE POLIGENY granica między genem głównym, a poligenem nie jest ściśle określona liczba genów Copyright ©2012, Joanna Szyda MODELOWANIE ZMIENNOŚCI GENETYCZNEJ POWIĄZANIE WARTOŚCI FENOTYPOWEJ CECHY Z SEGREGACJĄ MARKERÓW • wartość fenotypowa cechy • genotypy markerów • spokrewnienie osobników Copyright ©2012, Joanna Szyda MODELOWANIE ZMIENNOŚCI GENETYCZNEJ Copyright ©2012, Joanna Szyda ANALIZA SPRZĘŻEŃ ANALIZA SPRZĘŻEŃ - definicja ANALIZA SPRZĘŻEŃ 1. Statystyczna procedura poszukiwania genów 2. Poszukiwanie najbardziej prawdopodobnej lokalizacji QTL na chromosomie 3. Wykorzystująca prawdopodobieństwo dziedziczenia (niewidzialnego) genu głównego 4. Obliczone na podstawie częstości rekombinacji pomiędzy (widzialnymi) markerami Copyright ©2012, Joanna Szyda ANALIZA SPRZĘŻEŃ - źródła informacji ANALIZA SPRZĘŻEŃ wartości cechy genotypy markerów spokrewnienie Copyright ©2012, Joanna Szyda MODELE STATYSTYCZNE y=+s+g+i+e LICZBA QTL • pojedynczy • kilka sprzężonych QTL • epistaza pomiędzy genami WPŁYW QTL • wpływa na jedną cechę • wpływa na kilka cech • efekty epistatyczne OKREŚLENIE POŁOŻENIA QTL • na podstawie pojedynczego markera • na podstawie dwu sąsiadujących markerów (przedział markerowy) • na podstawie kilku markerów Copyright ©2012, Joanna Szyda MODELOWANIE ZMIENNOŚCI GENETYCZNEJ POSZUKIWANIE NAJBARDZIEJ PRAWDOPODOBNEJ LOKALIZACJI GENU GŁÓWNEGO NA CHROMOSOMIE 1) M1 M2 M3 M4 M5 M6 M7 0 cM 2) 100 cM QTL M1 M2 M3 M4 M5 M6 lokalizacja: 1 cM M7 0 cM 100 cM lokalizacja: 2 cM QTL ... n) 0 cM M1 M2 M3 M4 M5 M6 M7 100 cM lokalizacja: 99 cM QTL Copyright ©2012, Joanna Szyda MODELE STATYSTYCZNE POSZUKIWANIE NAJBARDZIEJ PRAWDOPODOBNEJ LOKALIZACJI GENU GŁÓWNEGO NA CHROMOSOMIE 1) y = + q1 + e prawdopodobieństwo 2) y = + q2 + e prawdopodobieństwo ... n) y = + q99 + e prawdopodobieństwo ELEMENTY MODELU: y wartość cechy efekty wspólne dla wszystkich osobników e efekty niemierzalne (błąd) qi efekt genu głównego zlokalizowanego w pozycji " i " Copyright ©2012, Joanna Szyda MODELE STATYSTYCZNE y = + qi + e 1.17 2.01 1.56 1.93 1 1 1 1 0.95 0.35 0.84 1.00 • prawdopodobieństwo, że dany osobnik odziedziczył określony genotyp genu głównego (QQ, Qq, qq) • prawdopodobieństwo jest obliczone na podstawie genotypu markerów Copyright ©2012, Joanna Szyda ANALIZA SPRZĘŻEŃ 1) y = + q1 + e prawdopodobieństwo 2) y = + q2 + e prawdopodobieństwo ... prawdopodobieństwo -271 ln ( prawdopod. ) n) y = + q99 + e -274 maks. prawd. 80 cM -277 -280 -283 -286 0 25 50 75 100 125 lokalizacja genu Copyright ©2012, Joanna Szyda ANALIZA SPRZĘŻEŃ HIPOTEZY • H0: w pozycji "i" brak genu głównego • H1: w pozycji "i" występuje gen główny qi = 0 qi 0 MODELE STATYSTYCZNE • MODEL0: • MODEL1: y=+e y = + qi + e TEST • LRT (likelihood ratio test) LRT = -2 [ lnPr ( MODEL 0 ) - lnPr ( MODEL 1 ) ] ~ c2M1-M0 Copyright ©2012, Joanna Szyda ANALIZA SPRZĘŻEŃ • najbardziej prawdopodobna lokalizacja genu: 80 cM • dla pozycji 80 cM TLR = 25.46 • założone maksymalne prawdopodobieństwo błędu aMAX = 0.01 • prawdopodobieństwo błędu dla LRT=25.46 wynosi aT=0.0000045 • aMAX > aT 30 H1 25 na dziedziczenie cechy ma wpływ gen główny 20 gen jest zlokalizowany na chrom. 6 ok. 80 cM od pierwszego markera maks. prawd. 80 cM LRT 15 10 5 0 0 25 50 75 100 125 lokalizacja genu Copyright ©2012, Joanna Szyda ANALIZA SPRZĘŻEŃ http://www.animalgenome.org/cgi-bin/QTLdb/index Copyright ©2012, Joanna Szyda ANALIZA ASOCJACYJNA ANALIZA ASOCJACYJNA - definicja ANALIZA ASOCJACYJNA 1. Statystyczna procedura poszukiwania genów 2. Poszukiwanie markerów powiązanych z genem głównym 3. Wykorzystująca zaburzenie równowagi HW pomiędzy (widzialnymi) markerami, a (niewidzialnym) genem głównym 4. Obliczone na podstawie korelacji pomiędzy zmiennością cechy, a zmiennością genotypów markerów Copyright ©2012, Joanna Szyda ANALIZA ASOCJACYJNA - źródła informacji ANALIZA ASOCJACYJNA wartości cechy genotypy markerów spokrewnienie Copyright ©2012, Joanna Szyda ANALIZA ASOCJACYJNA - poszukiwanie genów POSZUKIWANIE MARKERA O NAJWYŻSZEJ KORELACJI ZE ZMIENNOŚCIĄ CECHY 1) M1 M2 M3 M4 M5 M6 M7 0 cM 2) 100 cM QTL M1 M2 M3 M4 M5 M6 lokalizacja: 1 Marker M7 0 cM 100 cM lokalizacja: 2 Marker QTL ... 7) 0 cM M1 M2 M3 M4 M5 M6 M7 100 cM lokalizacja: 7 marker QTL Copyright ©2012, Joanna Szyda ANALIZA ASOCJACYJNA - poszukiwanie genów POSZUKIWANIE MARKERA O NAJWYŻSZEJ KORELACJI ZE ZMIENNOŚCIĄ CECHY 1) y = + m1 + e prawdopodobieństwo 2) y = + m2 + e prawdopodobieństwo ... 7) y = + m7 + e prawdopodobieństwo ELEMENTY MODELU: y wartość cechy efekty wspólne dla wszystkich osobników e efekty niemierzalne (błąd) mi efekt markera " i " Copyright ©2012, Joanna Szyda ANALIZA ASOCJACYJNA – model statystyczny y = + mi + e 1.17 2.01 1.56 1.93 1 1 1 1 1 0 -1 0 • Kod genotypu markera (11, 12, 22) Copyright ©2012, Joanna Szyda TESTOWANIE - prawdopodobieństwa dla każdego markera 1) y = + m1 + e prawdopodobieństwo 2) y = + m2 + e prawdopodobieństwo ... y = + m7 + e prawdopodobieństwo -275 ln ( prawdopod. ) 7) -280 -285 -290 -295 1 2 3 4 5 6 7 marker Copyright ©2012, Joanna Szyda TESTOWANIE - hipotezy i test HIPOTEZY • H0: marker "i" nieskorelowany z QTL • mi = 0 brak asocjacji H1: marker "i" skorelowany z QTL mi 0 występuje asocjacja MODELE STATYSTYCZNE • MODEL0: • MODEL1: y=+e y = + mi + e TEST • LRT (likelihood ratio test) LRT = -2 [ lnPr ( MODEL0 ) - lnPr ( MODEL1 ) ] ~ c2M1-M0 Copyright ©2012, Joanna Szyda TESTOWANIE - wnioskowanie • najbardziej prawdopodobna lokalizacja genu: marker 5 • LRT = 18.72 • założone maksymalne prawdopodobieństwo błędu aMAX = 0.01 • prawdopodobieństwo błędu dla LRT=25.46 wynosi aT=0.000015 20 • aMAX > aT H1 na dziedziczenie cechy ma wpływ gen główny 15 LRT 10 gen jest w LD z markerem 5 5 0 1 2 3 4 5 6 7 lokalizacja genu Copyright ©2012, Joanna Szyda 1. Modelowanie zmienności genetycznej 2. Modele statystyczne 3. Analiza sprzężeń i analiza asocjacyjna