mapowanie genomu

Transkrypt

mapowanie genomu
GENOMIKA.
MAPOWANIE
GENOMÓW
MAPY
GENOMICZNE
Bioinformatyka, wykład 3 (18.X.2007)
[email protected]
tydzień temu…
„Gen” ???
Biologiczne bazy danych – historia
Biologiczne bazy danych
– „najważniejsze”
Sekwencyjne bazy danych
– formaty plików
Wykład 3 – spis treści
Genomika
Mapy genomowe
Markery genetyczne,
mapy genetyczne
Mapowanie fizyczne
Bazy danych map genomowych
GENOMIKA –
badanie struktury i funkcjonowania genomów
GENOMIKA
GENOMIKA
STRUKTURALNA
MAPOWANIE GENOMU:
•Mapy genetyczne
•Mapy fizyczne
SEKWENCJONOWANIE
II znaczenie:
=proteomika
strukturalna
GENOMIKA
PORÓWNAWCZA
• Ewolucja
genomów
• Ewolucja genów
GENOMIKA
FUNKCJONALNA
• Transkryptom
•Regulacja tranckrypcji
• Proteom
Structural genomics
Comparative genomics
Functional genomics
at
or
m
GENOMIKA
yk
a
GENOMIKA –
badanie struktury i funkcjonowania genomów
GENOMIKA
PORÓWNAWCZA
oi
bi
MAPOWANIE GENOMU:
genomów
ol
ek
ul
ar
na
&
• Ewolucja
•Mapy
IIgenetyczne
znaczenie:
•Mapy
fizyczne
=proteomika
strukturalna
GENOMIKA
FUNKCJONALNA
nf
GENOMIKA
STRUKTURALNA
• Ewolucja genów
•Regulacja tranckrypcji
• Proteom
Structural genomics
Comparative genomics
Functional genomics
Bi
ol
og
ia
m
SEKWENCJONOWANIE
• Transkryptom
Mapa genomu – graficzna prezentacja
położenia markerów/genów na chromosomie
MAPY
GENETYCZNE
MAPY
FIZYCZNE
cM
bp
Mapy genomowe
MAPY GENETYCZNE
• powstają w oparciu o analizę
częstości rekombinacji między
badanymi markerami
• pokazują rozmieszczenie
markerów na chromosomie oraz
odległości genetyczne między
nimi
• jednostka:
1cM = 1% rekombinacji
(1 crossing – over na 100 mejoz)
u ludzi to ok.0,7 – 1 Mb
MAPY FIZYCZNE
• powstają poprzez bezpośrednią
lokalizację, technikami biologii
molekularnej, badanej sekwencji
DNA w genomie
• jednostka:
pary zasad – pz
(ang. bp, kbp)
Mapy genetyczne
Rekombinacje
Jeżeli markery A i B są na tym samym chromosomie,
częstość rekombinacji jest > 0 i < 0.5
Jeżeli markery A i B są na różnych chromosomach,
częstość rekombinacji jest = 0.5.
Częstość rekombinacji (θ)
Ten sam chromosom
Różne
chromosomy
Bardzo
blisko
Blisko
Daleko
Rzadko
Kilka
Często
Często
Sprzężenie
TAK
TAK
NIE
NIE
θ
0%
1-4%
50%
50%
Częstość
CROSSING-OVER
From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY
Marker genetyczny
– polimorficzna sekwencja DNA
(specyficzna) z jednego miejsca na chromosomie,
używana do mapowania genetycznego,
może być związana z fenotypem.
Jest to podstawowe narzędzie genetyka
Marker genetyczny
klasa II (markery DNA)
klasa I (markery fenotypowe)
•są to sekwencje DNA, niekoniecznie
kodujące, np. RFLP, SSLP, SNP
•są to geny kodujące cechy jakościowe
organizmu np. antygeny erytrocytarne, antygeny •markery takie jako markery genetycze
muszą mieć przynajmniej dwie alleliczne
głównego układu zgodności tkankowej
formy.
(Major Histocompatibility Complex - MHC).
•markery tej klasy indentyfikowane są
metodami serologicznymi lub metodami
elektroforetycznymi.
•markery tego typu identyfikowane są
przy użyciu technik analizy molekularnej.
Markery DNA
RFLPs (Restriction Fragment Lenght
Polymorphisms)
Minisatelity
Mikrosatelity
SNPs (Single Nucleotide
Polymorphisms)
Markery genetyczne cd.
RFLPs (Restriction Fragment Lenght Polymorphisms) -polimorfizm długości fragmentów restrykcyjnych
Miejsce cięcia enzymu restrykcyjnego HindIII.
Markery RFLP:
Żel
Restriction Fragment Length Polymorphism
Markery genetyczne cd.
Wady markerów RFLP:
- tylko dwie formy alleliczne
- dużo miejsc cięcia w dużych genomach
Markery genetyczne cd.
SSLPs (Simple Sequence Length Polymorphisms) –
polimorfizm długości prostych sekwencji
-minisatelity
-mikrosatelity
Minisatelitarny DNA
VNTRs (Variable Number of Tandem Repeats) –
zmienna liczba powtórzeń tandemowych
• sekwencje zawierające zmienną liczbę tandemowych powtórzeń motywu
(11 – 60 pz)
• z reguły występują przy końcach chromosomów - telomerach
• liczba powtórzeń motywu: 2 do 1000, w zależności od ilości powtórzeń dany
fragment DNA ma charakterystyczną długość (polimorfizm długości widoczny
podczas elektroforezy)
• VNTR może być badane metodą PCR wraz z elektroforezą, połączoną
z hybrydyzacją z wyznakowaną sondą. Liczba powtórzeń decyduje o długości
fragmentu, co z kolei wpływa na szybkości jego przemieszczania się podczas
elektroforezy.
• w danym locus VNTR występuje znaczna zmienność osobnicza
Przykładowy motyw sekwencji minisatelitarnej: AGGGCTGGAGG
Allel 1.
AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG
Allel 2.
AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG
Allel 3.
AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG
itd.
Przykładowa
analiza VNTRs
Mikrosatelitarny DNA
STRs (Short Tandem Repeats) –
krótkie sekwencje powtórzone tandemowo
• sekwencje zawierające zmienną liczbę tandemowych powtórzeń
kilkunukleotydowego motywu (1 – 4 pz)
• motyw równomiernie rozmieszczony w genomie
• liczba powtórzeń motywu minisatelitarnego: 10 do 50
i w zależności od ilości powtórzeń dany fragment DNA ma charakterystyczną
długość (polimorfizm długości widoczny podczas elektroforezy)
• często motyw taki może być regularnie przerywany inną sekwencją.
• ulokowane są zazwyczaj w intronach (czasami również w eksonach
[egzonach] w postaci mniejszej liczby powtórzeń).
STR a analiza restrykcyjna
A1A1 A1A2 A3A4
…ACGACGACGACG…
A1A1
Zalety:
- duża zmienność
- często tworzą
A1A2
A3A4
multi-locus patterns
charakterystyczne dla
danego osobnika
Wady:
- nie nadają się do
dokładnego mapowania
z powodu ich nielosowego
rozkładu w genomie
Markery genetyczne cd.
SNPs (Single Nucleotide Polymorphisms) –
polimorfizm pojedynczych nukleotydów
Genom ludzki: 34 mln SNPs (5,7 mln „validated” SNPs)
dbSNP @ NCBI
Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego
nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na
amplifikacji określonego fragmentu genomu w reakcji PCR
i sekwencjonowaniu uzyskanego produktu.
Zaletą tej techniki jest wysoka wydajność identyfikacji polimorfizmu
w obrębie badanej sekwencji, wadą jest wysoki koszt analizy.
Analiza SNP
molecular
beacons
SNP
microarrays
Analiza sprzężeń
zaburzenia w
analizach:
- gorące miejsca
rekombinacji
- podwójny
crossing – over
Type of marker
Blood groups
No. of loci Features
~20
May need fresh blood
1910-1960 Electrophoretic mobility ~30
variants of serum proteins
1960-1975
HLA tissue types
1970- DNA RFLPs
1975- No easy physical localization
May need fresh serum, specialized assays
No easy physical localization
Often limited polymorphism
1 One linked set
Can only test for linkage to 6p21.3
DNA VNTRs
5
Two allele markers, maximum heterozygosity 0.5
>10
(potentially) Initially required Southern blotting, now PCR
Easy physical localization
4
Many alleles, highly informative
>10
(minisatellites) 1985- DNA VNTRs
(potentially) Tend to cluster near ends of chromosomes
Easy physical localization
5
Many alleles, highly informative
>10
(microsatellites) (potentially) Can type by automated multiplex PCR
Easy physical localization
Distributed throughout genome
6
Less informative than microsatellites
>10
(potentially) Can be typed on a very large scale by automated
equipment without gel electrophoresis
1989- DNA SNPs
(single nucleotide
polymorphisms)
1998- Markery
fenotypowe
Markery
DNA
Niska rozdzielczość
Mapowanie Fizyczne
Mapa Cytogenetyczna (chromosome bands) – rozróżnialne
zabarwione fragmenty chromosomów (mikroskop optyczny)
Mbps
Restriction mapping – kolejność i odległości pomiędzy punktami
trawienia enzymami DNA. 100s kbp
Fluorescence in situ hybridisation – hybrydyzacja
fluorescencyjnych sond do chromosomów 100s kbp
STS sequence mapping – kolejność unikalnych w genomie
markerów DNA (STS) 100 kbp
Sequence “map” - całkowicie zsekwencjonowany chromosom 1bp.
Wysoka rozdzielczość
Mapy fizyczne
FISH (Fluorescent in situ hybridization) –
hybrydyzacja fluorescencyjna in situ
Mapa fizyczna genomu
Medicago truncatula
(lucerny)
skonstruowana metodą
FISH
Mapy fizyczne cd.
STS (Sequence tagged site) mapping
miejsc znakowanych sekwencją
-
- mapowanie
Analiza STS
Mapa restrykcyjna
A
B
A
B
Sekwencjonowanie genomów
Clone contig
WGS
(whole genome shotgun)
Przeglądarki genomowe
- Genome Browsers
NCBI Map Viewer
UCSC Genome Browser
(University of Calif., Santa Cruz)
Ensembl Map View
Ensembl
Ensembl
UCSC
NCBI
NCBI
Za tydzień…
bazy danych map genetcznych
ewolucja genomów
świat RNA

Podobne dokumenty