variant effect predictor

Transkrypt

variant effect predictor
ADNOTACJE WARIANTÓW GENETYCZNYCH
WSTĘP
1. Adnotacja ?
2. Klasyfikacja wariantów
3. Sequence Ontology terms
4. Variant Effect Predictor
•
online
•
skrypt
5. Inne źródła adnotacji
Copyright ©2015, Joanna Szyda
ADNOTACJA WARIANTÓW
1. Edycja danych
2. Przyrównanie
3. Post-alignment processing
4. Pre-variant calling processing
5. Detekcja wariantów polimorficznych
6. Adnotacja wariantów polimorficznych
nadanie funkcjonalnego
znaczenia
Copyright ©2015, Joanna Szyda
KLASYFIKACJA WARIANTÓW
• warianty w regionach intergenicznych
• warianty o destrukcyjnym wpływie na
• warianty w genach nie kodujących białek
białka
• predykcja funkcji trudna
• powodują np. skrócenie łańcucha, utratę
• brak danych eksperymentalnych funkcji, rozpad
23%
high
52%
modifier
14%
moderate
11%
• nie powodują zmiany funkcji białka • warianty o niedestrukcyjnym wpływie na
• znikomy wpływ na fenotyp
białko low
• mutacja może zmienić wydajność reakcji
z udziałem białka
Copyright ©2015, Joanna Szyda
% SNP
KLASYFIKACJA WARIANTÓW
100
90
80
70
60
50
40
30
20
10
0
BSW
FLV
GUE
HOL
human
HIGH
LOW
MODERATE MODIFIER
Copyright ©2015, Joanna Szyda
KLASYFIKACJA WARIANTÓW
1.6
1.4
% SNP
1.2
1.0
0.8
0.6
0.4
0.2
0.0
HIGH
LOW
MODERATE MODIFIER
Copyright ©2015, Joanna Szyda
SEQUENCE ONTOLOGY TERMS
http://www.sequenceontology.org/
Copyright ©2015 Joanna Szyda
SEQUENCE ONTOLOGY TERMS
http://www.ensembl.org/info/genome/variation/predicted_data.htm
l#consequences
Copyright ©2015, Joanna Szyda
SEQUENCE ONTOLOGY TERMS
http://www.ensembl.org/info/genome/variation/predicted_data.htm
l#consequences
Copyright ©2015, Joanna Szyda
SEQUENCE ONTOLOGY TERMS
http://www.ensembl.org/info/genome/variation/predicted_data.htm
l#consequences
Copyright ©2015, Joanna Szyda
SEQUENCE ONTOLOGY TERMS
1000
Średnia liczba SNP
SNP in HIGH SO
500
0
frameshift
splice_acceptor splice_donor
stop_gained
stop_lost
Copyright ©2015, Joanna Szyda
SEQUENCE ONTOLOGY TERMS
350
Liczba SNPs
300
250
mean=35 sd=40
200
150
100
50
0
gen
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
http://www.ensembl.org/info/docs/tools/vep/index.html
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
http://www.ensembl.org/info/docs/tools/vep/index.html
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
Przykład zastosowania VEP online
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
Wyniki online
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
http://www.ensembl.org/info/docs/tools/vep/index.html
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
Przykład zastosowania VEP w linii komend
perl variant_effect_predictor.pl -i input.txt -o output.txt
perl variant_effect_predictor.pl -i $FILEIDN -o output.txt --species
bos_taurus --cache --no_progress
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
Skrypt uruchomienia VEP
#!/bin/bash
###########################################
# snp annotation through vep and statistics
###########################################
umask 006
# define variant calling software
SOFT=FREEBAYES
# define breed
BREED=BSW
# clean old files
rm /mnt/diskstation/GENE2FARM/OUTPUT/vepcounts.txt
…
rm /mnt/diskstation/GENE2FARM/OUTPUT/MR.txt
# start analysis
cd /mnt/diskstation/GENE2FARM/VCF/$SOFT/
…
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
Skrypt uruchomienia VEP
# start analysis
cd /mnt/diskstation/GENE2FARM/VCF/$SOFT/
ls $BREED* > list.txt
while read FILEID ; do
echo ".......... gunzip for "$FILEID
gunzip $FILEID
echo ".......... vep for "$FILEIDN
FILEIDN="${FILEID:0:23}"
perl variant_effect_predictor.pl -i $FILEIDN -o output.txt --species bos_taurus --cache --no_progress
mv /mnt/diskstation/GENE2FARM/OUTPUT/output.txt_summary.html $FILEIDN.html
if [ $? -ne 0 ] ; then echo "perl program failed for "$FILEIDN ; fi
echo ".......... gzip for "$FILEIDN
gzip $FILEIDN
echo ".......... sas for "$FILEIDN
sas /mnt/diskstation/GENE2FARM/PROGRAMS/vep1.sas
if [ $? -ne 0 ] ; then echo "sas program failed for "$FILEIDN ; fi
rm /mnt/diskstation/GENE2FARM/OUTPUT/output.txt
rm /mnt/diskstation/GENE2FARM/OUTPUT/output.txt_warnings.txt
done < /mnt/diskstation/GENE2FARM/VCF/$SOFT/list.txt
echo "program finished"
Copyright ©2015, Joanna Szyda
VARIANT EFFECT PREDICTOR
Wyniki w pliku tekstowym
## ENSEMBL VARIANT EFFECT PREDICTOR v80
## Output produced at 2015-08-12 06:58:10
## Connected to bos_taurus_core_80_31 on ensembldb.ensembl.org
## Using cache in /home/szyda/.vep/bos_taurus/80_UMD3.1
## Using API version 80, DB version 80
## sift version sift5.2.2
## genebuild version 2011-09
## assembly version UMD3.1
## dbSNP version 142
## Extra column keys:
## IMPACT : Subjective impact classification
## DISTANCE : Shortest distance from variant to transcript
## STRAND : Strand of the feature (1/-1)
#Uploaded_variation Location
Allele Gene Feature Feature_type Consequence
cDNA_position CDS_position Protein_position
Amino_acids Codons Existing_variation
Extra
25_158_T/G 25:158 G
ENSBTAG00000047565 ENSBTAT00000065458 Transcript
upstream_gene_variant IMPACT=MODIFIER;DISTANCE=3689;STRAND=1
25_158_T/G 25:158 G
ENSBTAG00000046523 ENSBTAT00000063454 Transcript
upstream_gene_variant IMPACT=MODIFIER;DISTANCE=146;STRAND=1
25_472_C/AC 25:472 AC ENSBTAG00000047565 ENSBTAT00000065458 Transcript
upstream_gene_variant IMPACT=MODIFIER;DISTANCE=3375;STRAND=1
Copyright ©2015, Joanna Szyda
INNE ŹRÓDŁA INFORMACJI
SIFT
http://sift.jcvi.org/
Copyright ©2015, Joanna Szyda
INNE ŹRÓDŁA INFORMACJI
PolyPhen
http://genetics.bwh.harvard.edu/pph2/
Copyright ©2015, Joanna Szyda
ADNOTACJE
WARIANTÓW
GENETYCZNYCH
SIFT
PolyPhen

Podobne dokumenty