Mapowanie genów
Transkrypt
Mapowanie genów
Mapowanie genów 10 maja 2004 1 Co daje identyfikacja genów? • poszerzenie wiedzy podstawowej • perspektywy przyspieszenia i zwie, kszenia efektywności selekcji • precyzyjne wprowadzanie obych genów do populacji (introgresja) 2 Klonowanie pozycyjne genów kandydujacych , Najbardziej preferowana metoda identyfikacji genów Etapy: 1. określenie pozycji genu na chromosomie wzgledem markerów , 2. określenie genów kandydatów we wskazanym rejonie (mapy transkrypcyjne) 3. zidentyfikowanie zmienności ksztaltuja,cej ceche, 3 Markery genetyczne Trzy wlasności markera: 1. specyficzny dla danego locus 2. polimorficzny w danej populacji 3. latwy do oznaczenia 4 Typy markerów genetycznych • markery fenotypowe • grupy krwi • polimorfizm biochemiczny • RFLPs • Minisatelity (VNTR) • Mikrosatelity (SSR) • SNPs 5 RFLPs RFLPs AA Aa aa A • kodominuja,ce • potrzebna wlaściwa kombinacja enzym-sonda a restriction site probe 1 2 3 resulting gel • tylko 200 enzymów, liczba sond nieograniczona 6 RFLPs • mutacja punktowa • insercja35 • zmienna powtórzeń liczba 7 RAPDs RAPDs AA Aa aa A PCR product a • dominuja,ce 1 2 3 resulting gel • wiele loci jednocześnie 8 Mikrosatelity Microsatellites GCCGCCGCC GCCGCCGCCGCCGCC AA Aa aa A a • kodominuja,ce • duża obfitość 1 2 3 resulting gel • równomiernie rozlożone w genomie • pólautomatyczne wykrywanie 9 Strategie mapowania • Linkage Analysis (analiza sprzeż , eniowa) • DNA Pooling / Bulk Segregant Analysis • Genetically Directed Representational Difference Analysis • analiza asocjacji i mapowanie genów i.p.p • Genome Mismatch Scanning 10 Tempo rekombinacji 49 mejoz bez crossing−over A B B A B a b b b a b A B A b b 1+1 1 mejoza z crossing−over A B tempo rekombinacji A B A b A b a B a B a b a b 49+49+49+49+1+1+1+1 = 0.01 11 Ukryte crossing-over A B a b A a B b B A A B a a a b b A B a b A B a b A B A B a a b b 12 Odleglość genetyczna • mierzona cze, stościa, (prawdopodobieństwem) crossing-over • jednostka, jest Morgan • 1 centiMorgan - prawdopodobieństwo crossing-over wynosi 0.01 • addytywna (rAC = rAB + rBC ) • określana na podstawie rekombinacji 13 Funkcje mapowe Pozwalaja, ’przeliczyć’ obserwowane tempo rekombinacji na odleglość genetyczna, Najcześ , ciej używane: • Morgana • Haldane’a • Kosambiego 14 Funkcja Kosambiego 1 + 2θ x = 0.25 × ln 1 − 2θ exp(4x) − 1 θ = 0.5 × exp(4x) + 1 • x odleglość genetyczna (w Morganach) • θ tempo rekombinacji 15 Funkcje mapowe 1 Haldane 0.8 odleglosc Kosambi 0.6 0.4 Morgan 0.2 0 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 tempo rekombinacji 0.4 0.45 16 Odleglość genetyczna i fizyczna 1 cM ˜ 1 M p.z. 17 Skad uzyskać tempo rekombinacji? , • bezpośrednie genotypowanie plemników i oocytów (tylko markery genetyczne) • genotypowanie rodziców i potomstwa ? jedyna możliwość dla cech fenotypowych ? wymaga podwójnych heterozygot 18 Informatywność markera A1 A2 A1 A1 1 1 potomstwo A A A1 A1 A1 A1 A1 A2 potomstwo A1 A2 potomstwo A1 A1 A1 A2 A2A2 A1 A1 1 A A2 A1 A3 1 4 AA potomstwo 2 3 AA 2 4 A3 A4 A A A1A2 19 Miary informatywności markera • Heterozygotyczność H =1− X p2i • Polymorphism Information Content (PIC) P IC = 1 − n X i=1 p2i − n−1 X n X i=1 j=i+1 p2i p2j 20 Test lod score • Test statystyczny weryfikuja,cy hipoteze, o niezależnej segregacji genów z różnych loci • Hipotezy: ? H0: brak sprzeż , enia (θ = 0.5) ? H1: sprzeż , enie loci (θ < 0.5) • Wiarogodność (Likelihood) ? miara sily dowodów na rzecz hipotezy ? prawdopodobieństwo danych obliczone przy danej hipotezie 21 • Iloraz wiarygodności (likelihood ratio) L(dane | θ) LR = L(dane | θ = 0.5) • Lod score Z = log10(LR) • Interpretacja ? Z > 3 geny sa, sprzeż , one ? Z < −2 brak sprzeż , enia ? −2 < Z < 3 brak informacji 22 Test lod score A1 A2 B1 B2 potomstwo A1 A1 B1 B1 gamety ojcowska matczyna N A1 A1 B1 B1 A1 B1 A1 B1 9 A1 A2 B1 B1 A1 A1 B1 B2 A1 A2 B1 B2 A2 B1 A1 B2 A2 B2 A1 B1 A1 B1 A1 B1 1 1 9 23 Test lod score • najprawdopodobniej u ojca wyste, puje sprzeżenie A1-B1 oraz A2-B2 • oszacowane tempo rekombinacji θb = 2/20 = 0.1 • wiarogodność przy θ = 0.1 L(0.1) = 20 2 (1 − 0.1)18 ∗ 0.12 • wiarogodność przy braku sprzeż , enia (θ = 0.5) 24 L(0.5) = 20 2 (1 − 0.5)18 ∗ 0.52 • lod score L(0.1) Z(0.1) = log10 ' 3.2 L(0.5) 25 Test lod score max−1 3 Z 0 −2 0 tempo rekombinacji 0.5 26 Programy komputerowe • LINKAGE • FASTLINK • VITESSE • CRIMAP - pozwala oszacować uszeregowanie genów! 27 Mapy sprzeżeniowe , Fragment mapy sprzeż , eniowej chromosomu 6 świni. 28 Mapy sprzeżeniowe (1999) , Gatunek Bydlo Świnia Owca Koń Pies liczba markerów 1240 1042 519 162 276 przecie, tna odleglość mie, dzy markerami 2,5 2,2 6,4 14,2 10,0 29 Mapowanie choroby monogenicznej 22 12 2|2 d|d 12 22 12 12 22 22 12 22 22 2|1 2|2 d|d d|D 2|1 1|2 D|d D|d 2|2 d|D 2|1 d|d 30 Mapowanie choroby monogenicznej LI (θ) = (1 − θ)4 LII (θ) = θ4 L(θ) = 12 [(1 − θ)4 + θ4] h 4 i 0.5 (1 − 0.25) + 0.254 h i ' 0.79 Z(0.25) = log10 4 0.5 (1 − 0.5) + 0.54 31 Mapowanie choroby monogenicznej 5 lod score 4 3 2 1 0 −1 −2 0 0.15 0.25 0.35 tempo rekombinacji 0.45 32 Cechy zlożone A H a disease loci Aa bb aa Bb locus heterogeneity Aa bb Ha bb allelic heterogeneity Aa bb Aa Bb epistasis B b Aa bb aa bb incomplete penetrance phenocopy 33 Geny cech ilościowych • QTL (Quantitative Trait Locus) to locus genu cechy ilościowej. • Gen glówny (major gene) - to QTL o bardzo dużym efekcie. 34 czestosc Model poligeniczny abc ABc AbC aBc abC genotyp ABC 35 Model mieszany - QTL + poligeny czestosc Qq QQ qq abc ABc AbC aBc abC ABc AbC aBc abC ABc ABc AbC aBc genotyp ABC 36 Mapowanie QTL Glówna strategia 1. (utworzenie populacji w nierównowadze gametycznej) 2. śledzenie (przy pomocy markerów) przekazywania fragmentów chromosomowych od rodziców do potomstwa 3. porównanie wydajności zwierza,t, które odziedziczyly różne fragmenty chromosomowe 37 Nierównowaga gametyczna A pA a pa B qB pA q B + D p a q B − D b pA q b − D qb pa q b + D 38 nierownowaga gametyczna (D) Nierównowaga gametyczna 1 0.9 r=0.01 0.8 0.7 0.6 0.5 0.4 r=0.05 r=0.1 0.3 0.2 0.1 0 r=0.5 2 4 6 pokolenie r=0.3 8 10 39 Nierównowaga gametyczna Mm D=0.0 mm frequency Qq MM Qq qq Qq qq QQ QQ QQ qq Mm mm frequency D=0.1 qq MM QQ qq Qq Qq qq QQ Qq QQ 40 Mapowanie QTL Uklady doświadczalne: • krzyżówki mie, dzy liniami, rasami i gatunkami ? nierównowaga gametyczna w populacji ? duża szansa wykrycia QTL ? ale tylko tych odpowiedzialnych za różnice mie, dzy rasami • zwierze, ta czystorasowe ? nierównowaga gametyczna w rodzinach ? mniejsza szansa wykrycia QTL ? QTL odpowiedzialne za zmienność osobnicza, 41 Uklad doświadczalny F2 • świnie ? dzik × świnie ras szlachetnych ? Meishan × świnie ras szlachetnych ? zlotnicka pstra × wielka biala polska • drób ? Red Jungle Fowl × White Leghorn ? Sasumadorri × White Plymouth Rock • bydlo ? bydlo holsztyńsko-fryzyjskie × charolais 42 Uklad doświadczalny F2 F0 rasa A rasa B M −− Q m −− q M −− Q m −− q F1 F2 genotypowanie M −− Q m −− q M M m M m m pomiar cech 43 Uklad doświadczalny F2 MMQQ mmqq MmQq MM 1/4 Mm 1/2 gamety mm 1/4 P(MQ)=P(mq)=0.5(1−r) P(Mq)=P(mQ)=0.5r P(QQ|MM) = P(MQ)*P(MQ)/4=(1−r)*(1−r) P(Qq|MM) = 2r(1−r) P(qq|MM) = r*r 44 Uklad doświadczalny F2 L(z|M M ) = P (QQ|M M ) × f (z, µQQ, σ) +P (Qq|M M ) × f (z, µQq , σ) +P (qq|M M ) × f (z, µqq , σ) f (z, µQQ, σ) = √ 1 2πσ 2 (z−µQQ) exp 2 2σ 2 45 Mapowanie przedzialowe A Q B 46 W populacji F2, po krzyżowaniu knurów Meishan z lochami holenderskimi, badano grubość sloniny. Zlokalizowano QTL na chromosomie 17, którego efekt addytywny wynosi a = 2.1mm (De Koning 2001). Strzalki wskazuja, pozycje markerów. statystyka testowa Mapowanie QTL wartosc krytyczna 0 30 chromosom 17 swini 70 80 150 cM 47 Mapowanie w populacjach hodowlanych Trudniejsze niż u mieszańców: • selekcja prowadzi do utrwalenia korzystnych alleli i redukcji zmiennośći genetycznej • także mniejsza zmienność markerów • w poszczególnych rodzinach ? segreguja, różne QTL i allele ? różne fazy sprzeż , enia • pomiar fenotypów mniej doskonaly Latwiejsze niż u czlowieka - duże grupy (pól)rodzeństwa 48 Daughter design Pozwala wykryć QTL w czystych Mm rasach. Porównywane sa, córki krowy, które odziedziczyly po ojcu alterantywne allele markerowe. Genotypowane sa, buhaje, matki i córki. M* m* 49 Granddaughter design genotypowanie Genotypowane sa, tylko buhaje (duża oszczedność). Zamiast , fenotypów bada sie, wartość hodowlana, buhajów, oceniona, na podstawie dużej liczby córek. “h2“ wartości hodowlanej aż 80%. ocena potomstwa 50 Genotypowanie wybiórcze 20% 1 S.D. 20% Genotypowanie osobników odbiegajacych 1 S.D. od średniej , pozwala zredukować liczbe, osobników o 60% bez straty mocy doświadczenia. 51 Dokladność analizy sprzeżeniowej , • Wymagana - 1cM (klonowanie pozycyjne genów kandydatów) • Ograniczona ? doste, pnościa, loci markerowych ? ilościa, i rozkladem crossing-over w badanej rodzinie • Osia,gana ? cechy proste - kilka cM (400 mejoz daje 90% szans na lokalizacje genu z dokladnościa, 1cM) ? cechy zlożone - kilkadziesia,t cM 52 Mapowanie porównawcze • Pozwala zawe, zić grupe, genów kandydatów we wskazanym regionie (50cM to setki genów). • Wykorzystuje zjawisko konserwatyzmu genetycznego - tu podobieństwa ulożenia genów u różnych gatunków. • Najważniejsze źródla informacji to mapy czlowieka i myszy. 53 Mapowanie genów i.p.p. • Przy b. bliskim sa,siedztwie markera i genu crossing-over prawie nie zachodzi, co daje duża, nierównowage, gametyczna,. • Jeżeli przyczyna, choroby jest 1 zmutowany gen, chorzy be, da, dzielili sa,siaduja,ce markery i.p.p. 54 Mapowanie genów i.p.p. 1 2 3 4 1 3 5 6 3 5 r=1/8 r=1/4 55 Mapowanie genów i.p.p. para 1 2 4 3 5 spokrew. 1 4 1/8 1 5 1/8 2 3 1/4 2 5 1/8 3 4 1/8 4 5 1/16 13/16 13/16 56 Asocjacja allel-cecha • test χ2 dla danego allelu gr. dośw. gr. kontrolna testowany allel obecny brak n1 n3 n2 n4 • sila asocjacji - ryzyko relatywne R= n1×(n2+n4) n2×(n1+n3) 57 Przypadek cukrzycy Badano plemiona Pima i Tohono O’odham (pd. Arizona) w których czesto wystepuje , , cukrzyca typu 2. Wykonano proste porównanie udzialu cukrzyków w dwóch grupach haplotypowych. Badanie wykazalo, że pewien allel Gm+ jest negatywnie skorelowany z cukrzyca., Gm+ obecny brak ogólem 293 4627 % cukrzyków 8% 29% 58 Populacje laczone , Populacja A - 100 osobników allel N chorych % chorych obecny 80 16 20% brak 20 4 20% Populacja B - 100 osobników allel N chorych % chorych obecny 30 15 50% brak 70 35 50% A+B - 200 osobników allel N chorych % chorych obecny 110 16+15=31 28% brak 90 4+35=39 43% 59 Przypadek cukrzycy - c.d. Dalsze badanie wykazalo, że asocjacja jest spowodowana przemieszaniem plemion z Kaukazami. U Kaukazów allel Gm+ wystepuje z czestoci a, 67%, a u rodowitych , , Pima i Tohono <1%. Badania ograniczone do rodowitych Pima i Tohono nie wykazaly asocjacji. Gm+ obecny brak ogólem 17 1764 % cukrzyków 59% 60% 60 Test TDT przekazany Transmission disequlibrium test • porównuje ile razy dany allel zostal przekazany (T) chorym a ile nie (NT) 33 12 • przy braku sprzeż , enia T' NT • χ21 = (T − N T )2/(T + N T ) nie przekazany 31 61 Test TDT a b b c T +1 T +0 NT +1 NT +0 b c a b c c T +1 NT +0 b c 62 Test TDT Przetestowano 21 markerów u 455 rodzin cukrzyków typu 1. Jeden z trzech alleli markera D2S152 jest mocno powia,zany z cukrzyca,. Obecność tego allelu może wskazywać na ryzyko zachorowania. allel 228 230 240 T 81 59 36 NT 45 73 24 χ2 10.29 1.48 2.40 p 0.001 0.223 0.121 63 Podsumowanie • Określenie pozycji genu jest pierwszym krokiem do jego identyfikacji. • Najlatwiej określić pozycje, genów wzgle, dem genów markerowych. • Dla wielu gatunków powstaly (markerowe) mapy sprzeż , eniowe stanowia,ce matryce, do lokalizacji ważnych genów. • Najważniejsze źródla markerów genetycznych to RFLP, mikro- i minisatelity oraz SNP. • Analiza sprzeż , eniowa jest najważniejszym narze, dziem mapowania. Bazuje na obserwacji rekombinacji genów. 64 • Geny sprzeż , one maja, tempo rekombinacji < 0.5. • Funkcja mapowa pozwala wyliczyć odleglość genetyczna, (cM) z oszacowanego tempa rekombinacji. • Test lod score testuje czy dwa geny sa, sprzeż , one. • QTL można wykryć analizuja,c mieszańce mocno zróżnicowanych ras lub badaja,c poszczególne rodziny. • Do zmapowania QTL potrzeba setek osobników, dla cech prostej tylko kilkanaście. • Wste, pna lokalizacja QTL daje bardzo niedokladny wynik. Dokladna lokalizacja QTL stanowi poważne wyzwanie. 65 • Informacja genomowa może może być przenoszona mie, dzy gatunkami przez mapowanie porównawcze. • Bliskie sprzeż , enie utrzymuje asocjacje allel (markerowy) - cecha przez wiele pokoleń.