platformy sekwencjonowania

Transkrypt

platformy sekwencjonowania
PODSTAWY BIOINFORMATYKI
13 SEKWENCJONOWANIE NOWEJ GENERACJI
WSTĘP
1. Platformy sekwencjonowania
2. Kontrola jakości sekwencji
3. Przyrównanie do genomu referencyjnego
4. Identyfikacja wariantów genetycznych
5. Analiza funkcji wariantów genetycznych
Copyright ©2013, Joanna Szyda
PLATFORMY
SEKWENCJONOWANIA
• Generowanie krótkich sekwencji DNA  „reads”
PLATFORMY SEKWENCJONOWANIA
1. Roche (454)
• 700-400 bp, pyrosequencing
• fluorescencja
2. Illumina (Solexa)
• 100-150 bp, sekwencjonowanie przez syntezę
• fluorescencja
3. Life Technologies (Solid)
• 50 bp, sekwencjonowanie na drodze ligacji
• fluorescencja
4. Life Technologies (Ion torrent)
• 200 bp, pyrosequencing
• uwalnianie jonów H+  pomiar pH
Copyright ©2013, Joanna Szyda
PLATFORMY SEKWENCJONOWANIA  Roche
krótkie odcinki DNA
synteza nici DNA
odczyt fluorescencyny
By A. E. Mardis NIH course 2012
PLATFORMY SEKWENCJONOWANIA  Roche
GS FLX System
Copyright ©2013, Joanna Szyda
PLATFORMY SEKWENCJONOWANIA  Illumina
krótkie odcinki DNA
+
synteza nici
odczyt fluorescencyny
By A. E. Mardis NIH course 2012
PLATFORMY SEKWENCJONOWANIA  Illumina
HiSEQ 2000
Copyright ©2013, Joanna Szyda
PLATFORMY SEKWENCJONOWANIA  Life Technologies
krótkie odcinki DNA
synteza nici DNA
odczyt fluorescencyny
By A. E. Mardis NIH course 2012
PLATFORMY SEKWENCJONOWANIA  Life Technologies
Solid 5500
Copyright ©2013, Joanna Szyda
KONTROLA JAKOŚCI
SEKWENCJI
• Usunięcie sekwencji o niskiej jakości  edycja danych
KONTROLA JAKOŚCI SEKWENCJI  pojedyncze nukleotydy
dobra jakość
zła jakość
Copyright ©2013, Magda Mielczarek
KONTROLA JAKOŚCI SEKWENCJI  średnia dla sekwencji
dobra
gorsza
Copyright ©2013, Magda Mielczarek
KONTROLA JAKOŚCI SEKWENCJI  zawartość par GC
dobra = brak odchyleń
zła = różnice pomiędzy pozycjami
Copyright ©2013, Magda Mielczarek
PRZYRÓWNANIE DO
GENOMU REFERENCYJNEGO
• Ułożenie w kolejności odpowiadającej genomowi
PRZYRÓWNANIE DO GENOMU REFERENCYJNEGO
Copyright ©2013, Magda Mielczarek
PRZYRÓWNANIE DO GENOMU REFERENCYJNEGO
Copyright ©2013, Magda Mielczarek
IDENTYFIKACJA WARIANTÓW
GENETYCZNYCH
• Detekcja różnic pomiędzy genomem referencyjnym,
a przyrównanym
IDENTYFIKACJA WARIANTÓW GENETYCZNYCH
1. Dodatkowy krok edycji danych
• Uwzględnienie tylko sekwencji o wysokiej
jakości
• > 20
2. Oprogramowanie
• GATK
• Atlas-SNP2
• DNAA
• SAMtools
• …
•
•
•
darmowe
A A
CLCBio
Genomatix Mining Station
…
G G
komercyjne
Copyright ©2013, Joanna Szyda
IDENTYFIKACJA WARIANTÓW GENETYCZNYCH
1. Single Nucleotide Polymorphisms SNP
2. Insertions/Deletions
INDEL
3. Copy Number Variations
CNV
4. Loss of Heterozygosity
LOH
5. Inversions
INV
6. Translocations
TRANS
Copyright ©2013, Joanna Szyda
ANALIZA FUNKCJI
WARIANTÓW
GENETYCZNYCH
• Nadanie funkcjonalnego znaczenia
zidentyfikowanym wariantom
ANALIZA FUNKCJI WARIANTÓW GENETYCZNYCH
1. Lokalizacja w genomie
• Intronowe
• Egzonowe
• UTR-3
• UTR-5
2. Funkcja
• Informacje z baz danych np. OMIM, OMIA, dbSNP
• Sunonymous SNP (brak zmiany aminokwasu)
• Nonsynonymous SNP (zmiana aminokwasu)
3. Analiza danych
• Genomewide Association Studies GWAS
Copyright ©2013, Joanna Szyda
PRZYKŁAD LITERATURY
Copyright ©2013, Joanna Szyda
ANALIZA
DANYCH NGS
Anotacja wariantów
Identyfikacja wariantów