mapowanie genomu
Transkrypt
mapowanie genomu
GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE Bioinformatyka, wykład 3 (18.X.2007) [email protected] tydzień temu… „Gen” ??? Biologiczne bazy danych – historia Biologiczne bazy danych – „najważniejsze” Sekwencyjne bazy danych – formaty plików Wykład 3 – spis treści Genomika Mapy genomowe Markery genetyczne, mapy genetyczne Mapowanie fizyczne Bazy danych map genomowych GENOMIKA – badanie struktury i funkcjonowania genomów GENOMIKA GENOMIKA STRUKTURALNA MAPOWANIE GENOMU: •Mapy genetyczne •Mapy fizyczne SEKWENCJONOWANIE II znaczenie: =proteomika strukturalna GENOMIKA PORÓWNAWCZA • Ewolucja genomów • Ewolucja genów GENOMIKA FUNKCJONALNA • Transkryptom •Regulacja tranckrypcji • Proteom Structural genomics Comparative genomics Functional genomics at or m GENOMIKA yk a GENOMIKA – badanie struktury i funkcjonowania genomów GENOMIKA PORÓWNAWCZA oi bi MAPOWANIE GENOMU: genomów ol ek ul ar na & • Ewolucja •Mapy IIgenetyczne znaczenie: •Mapy fizyczne =proteomika strukturalna GENOMIKA FUNKCJONALNA nf GENOMIKA STRUKTURALNA • Ewolucja genów •Regulacja tranckrypcji • Proteom Structural genomics Comparative genomics Functional genomics Bi ol og ia m SEKWENCJONOWANIE • Transkryptom Mapa genomu – graficzna prezentacja położenia markerów/genów na chromosomie MAPY GENETYCZNE MAPY FIZYCZNE cM bp Mapy genomowe MAPY GENETYCZNE • powstają w oparciu o analizę częstości rekombinacji między badanymi markerami • pokazują rozmieszczenie markerów na chromosomie oraz odległości genetyczne między nimi • jednostka: 1cM = 1% rekombinacji (1 crossing – over na 100 mejoz) u ludzi to ok.0,7 – 1 Mb MAPY FIZYCZNE • powstają poprzez bezpośrednią lokalizację, technikami biologii molekularnej, badanej sekwencji DNA w genomie • jednostka: pary zasad – pz (ang. bp, kbp) Mapy genetyczne Rekombinacje Jeżeli markery A i B są na tym samym chromosomie, częstość rekombinacji jest > 0 i < 0.5 Jeżeli markery A i B są na różnych chromosomach, częstość rekombinacji jest = 0.5. Częstość rekombinacji (θ) Ten sam chromosom Różne chromosomy Bardzo blisko Blisko Daleko Rzadko Kilka Często Często Sprzężenie TAK TAK NIE NIE θ 0% 1-4% 50% 50% Częstość CROSSING-OVER From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY Marker genetyczny – polimorficzna sekwencja DNA (specyficzna) z jednego miejsca na chromosomie, używana do mapowania genetycznego, może być związana z fenotypem. Jest to podstawowe narzędzie genetyka Marker genetyczny klasa II (markery DNA) klasa I (markery fenotypowe) •są to sekwencje DNA, niekoniecznie kodujące, np. RFLP, SSLP, SNP •są to geny kodujące cechy jakościowe organizmu np. antygeny erytrocytarne, antygeny •markery takie jako markery genetycze muszą mieć przynajmniej dwie alleliczne głównego układu zgodności tkankowej formy. (Major Histocompatibility Complex - MHC). •markery tej klasy indentyfikowane są metodami serologicznymi lub metodami elektroforetycznymi. •markery tego typu identyfikowane są przy użyciu technik analizy molekularnej. Markery DNA RFLPs (Restriction Fragment Lenght Polymorphisms) Minisatelity Mikrosatelity SNPs (Single Nucleotide Polymorphisms) Markery genetyczne cd. RFLPs (Restriction Fragment Lenght Polymorphisms) -polimorfizm długości fragmentów restrykcyjnych Miejsce cięcia enzymu restrykcyjnego HindIII. Markery RFLP: Żel Restriction Fragment Length Polymorphism Markery genetyczne cd. Wady markerów RFLP: - tylko dwie formy alleliczne - dużo miejsc cięcia w dużych genomach Markery genetyczne cd. SSLPs (Simple Sequence Length Polymorphisms) – polimorfizm długości prostych sekwencji -minisatelity -mikrosatelity Minisatelitarny DNA VNTRs (Variable Number of Tandem Repeats) – zmienna liczba powtórzeń tandemowych • sekwencje zawierające zmienną liczbę tandemowych powtórzeń motywu (11 – 60 pz) • z reguły występują przy końcach chromosomów - telomerach • liczba powtórzeń motywu: 2 do 1000, w zależności od ilości powtórzeń dany fragment DNA ma charakterystyczną długość (polimorfizm długości widoczny podczas elektroforezy) • VNTR może być badane metodą PCR wraz z elektroforezą, połączoną z hybrydyzacją z wyznakowaną sondą. Liczba powtórzeń decyduje o długości fragmentu, co z kolei wpływa na szybkości jego przemieszczania się podczas elektroforezy. • w danym locus VNTR występuje znaczna zmienność osobnicza Przykładowy motyw sekwencji minisatelitarnej: AGGGCTGGAGG Allel 1. AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG Allel 2. AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG Allel 3. AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG itd. Przykładowa analiza VNTRs Mikrosatelitarny DNA STRs (Short Tandem Repeats) – krótkie sekwencje powtórzone tandemowo • sekwencje zawierające zmienną liczbę tandemowych powtórzeń kilkunukleotydowego motywu (1 – 4 pz) • motyw równomiernie rozmieszczony w genomie • liczba powtórzeń motywu minisatelitarnego: 10 do 50 i w zależności od ilości powtórzeń dany fragment DNA ma charakterystyczną długość (polimorfizm długości widoczny podczas elektroforezy) • często motyw taki może być regularnie przerywany inną sekwencją. • ulokowane są zazwyczaj w intronach (czasami również w eksonach [egzonach] w postaci mniejszej liczby powtórzeń). STR a analiza restrykcyjna A1A1 A1A2 A3A4 …ACGACGACGACG… A1A1 Zalety: - duża zmienność - często tworzą A1A2 A3A4 multi-locus patterns charakterystyczne dla danego osobnika Wady: - nie nadają się do dokładnego mapowania z powodu ich nielosowego rozkładu w genomie Markery genetyczne cd. SNPs (Single Nucleotide Polymorphisms) – polimorfizm pojedynczych nukleotydów Genom ludzki: 34 mln SNPs (5,7 mln „validated” SNPs) dbSNP @ NCBI Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na amplifikacji określonego fragmentu genomu w reakcji PCR i sekwencjonowaniu uzyskanego produktu. Zaletą tej techniki jest wysoka wydajność identyfikacji polimorfizmu w obrębie badanej sekwencji, wadą jest wysoki koszt analizy. Analiza SNP molecular beacons SNP microarrays Analiza sprzężeń zaburzenia w analizach: - gorące miejsca rekombinacji - podwójny crossing – over Type of marker Blood groups No. of loci Features ~20 May need fresh blood 1910-1960 Electrophoretic mobility ~30 variants of serum proteins 1960-1975 HLA tissue types 1970- DNA RFLPs 1975- No easy physical localization May need fresh serum, specialized assays No easy physical localization Often limited polymorphism 1 One linked set Can only test for linkage to 6p21.3 DNA VNTRs 5 Two allele markers, maximum heterozygosity 0.5 >10 (potentially) Initially required Southern blotting, now PCR Easy physical localization 4 Many alleles, highly informative >10 (minisatellites) 1985- DNA VNTRs (potentially) Tend to cluster near ends of chromosomes Easy physical localization 5 Many alleles, highly informative >10 (microsatellites) (potentially) Can type by automated multiplex PCR Easy physical localization Distributed throughout genome 6 Less informative than microsatellites >10 (potentially) Can be typed on a very large scale by automated equipment without gel electrophoresis 1989- DNA SNPs (single nucleotide polymorphisms) 1998- Markery fenotypowe Markery DNA Niska rozdzielczość Mapowanie Fizyczne Mapa Cytogenetyczna (chromosome bands) – rozróżnialne zabarwione fragmenty chromosomów (mikroskop optyczny) Mbps Restriction mapping – kolejność i odległości pomiędzy punktami trawienia enzymami DNA. 100s kbp Fluorescence in situ hybridisation – hybrydyzacja fluorescencyjnych sond do chromosomów 100s kbp STS sequence mapping – kolejność unikalnych w genomie markerów DNA (STS) 100 kbp Sequence “map” - całkowicie zsekwencjonowany chromosom 1bp. Wysoka rozdzielczość Mapy fizyczne FISH (Fluorescent in situ hybridization) – hybrydyzacja fluorescencyjna in situ Mapa fizyczna genomu Medicago truncatula (lucerny) skonstruowana metodą FISH Mapy fizyczne cd. STS (Sequence tagged site) mapping miejsc znakowanych sekwencją - - mapowanie Analiza STS Mapa restrykcyjna A B A B Sekwencjonowanie genomów Clone contig WGS (whole genome shotgun) Przeglądarki genomowe - Genome Browsers NCBI Map Viewer UCSC Genome Browser (University of Calif., Santa Cruz) Ensembl Map View Ensembl Ensembl UCSC NCBI NCBI Za tydzień… bazy danych map genetcznych ewolucja genomów świat RNA