variant effect predictor
Transkrypt
variant effect predictor
ADNOTACJE WARIANTÓW GENETYCZNYCH WSTĘP 1. Adnotacja ? 2. Klasyfikacja wariantów 3. Sequence Ontology terms 4. Variant Effect Predictor • online • skrypt 5. Inne źródła adnotacji Copyright ©2015, Joanna Szyda ADNOTACJA WARIANTÓW 1. Edycja danych 2. Przyrównanie 3. Post-alignment processing 4. Pre-variant calling processing 5. Detekcja wariantów polimorficznych 6. Adnotacja wariantów polimorficznych nadanie funkcjonalnego znaczenia Copyright ©2015, Joanna Szyda KLASYFIKACJA WARIANTÓW • warianty w regionach intergenicznych • warianty o destrukcyjnym wpływie na • warianty w genach nie kodujących białek białka • predykcja funkcji trudna • powodują np. skrócenie łańcucha, utratę • brak danych eksperymentalnych funkcji, rozpad 23% high 52% modifier 14% moderate 11% • nie powodują zmiany funkcji białka • warianty o niedestrukcyjnym wpływie na • znikomy wpływ na fenotyp białko low • mutacja może zmienić wydajność reakcji z udziałem białka Copyright ©2015, Joanna Szyda % SNP KLASYFIKACJA WARIANTÓW 100 90 80 70 60 50 40 30 20 10 0 BSW FLV GUE HOL human HIGH LOW MODERATE MODIFIER Copyright ©2015, Joanna Szyda KLASYFIKACJA WARIANTÓW 1.6 1.4 % SNP 1.2 1.0 0.8 0.6 0.4 0.2 0.0 HIGH LOW MODERATE MODIFIER Copyright ©2015, Joanna Szyda SEQUENCE ONTOLOGY TERMS http://www.sequenceontology.org/ Copyright ©2015 Joanna Szyda SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data.htm l#consequences Copyright ©2015, Joanna Szyda SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data.htm l#consequences Copyright ©2015, Joanna Szyda SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data.htm l#consequences Copyright ©2015, Joanna Szyda SEQUENCE ONTOLOGY TERMS 1000 Średnia liczba SNP SNP in HIGH SO 500 0 frameshift splice_acceptor splice_donor stop_gained stop_lost Copyright ©2015, Joanna Szyda SEQUENCE ONTOLOGY TERMS 350 Liczba SNPs 300 250 mean=35 sd=40 200 150 100 50 0 gen Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR Przykład zastosowania VEP online Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR Wyniki online Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR Przykład zastosowania VEP w linii komend perl variant_effect_predictor.pl -i input.txt -o output.txt perl variant_effect_predictor.pl -i $FILEIDN -o output.txt --species bos_taurus --cache --no_progress Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR Skrypt uruchomienia VEP #!/bin/bash ########################################### # snp annotation through vep and statistics ########################################### umask 006 # define variant calling software SOFT=FREEBAYES # define breed BREED=BSW # clean old files rm /mnt/diskstation/GENE2FARM/OUTPUT/vepcounts.txt … rm /mnt/diskstation/GENE2FARM/OUTPUT/MR.txt # start analysis cd /mnt/diskstation/GENE2FARM/VCF/$SOFT/ … Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR Skrypt uruchomienia VEP # start analysis cd /mnt/diskstation/GENE2FARM/VCF/$SOFT/ ls $BREED* > list.txt while read FILEID ; do echo ".......... gunzip for "$FILEID gunzip $FILEID echo ".......... vep for "$FILEIDN FILEIDN="${FILEID:0:23}" perl variant_effect_predictor.pl -i $FILEIDN -o output.txt --species bos_taurus --cache --no_progress mv /mnt/diskstation/GENE2FARM/OUTPUT/output.txt_summary.html $FILEIDN.html if [ $? -ne 0 ] ; then echo "perl program failed for "$FILEIDN ; fi echo ".......... gzip for "$FILEIDN gzip $FILEIDN echo ".......... sas for "$FILEIDN sas /mnt/diskstation/GENE2FARM/PROGRAMS/vep1.sas if [ $? -ne 0 ] ; then echo "sas program failed for "$FILEIDN ; fi rm /mnt/diskstation/GENE2FARM/OUTPUT/output.txt rm /mnt/diskstation/GENE2FARM/OUTPUT/output.txt_warnings.txt done < /mnt/diskstation/GENE2FARM/VCF/$SOFT/list.txt echo "program finished" Copyright ©2015, Joanna Szyda VARIANT EFFECT PREDICTOR Wyniki w pliku tekstowym ## ENSEMBL VARIANT EFFECT PREDICTOR v80 ## Output produced at 2015-08-12 06:58:10 ## Connected to bos_taurus_core_80_31 on ensembldb.ensembl.org ## Using cache in /home/szyda/.vep/bos_taurus/80_UMD3.1 ## Using API version 80, DB version 80 ## sift version sift5.2.2 ## genebuild version 2011-09 ## assembly version UMD3.1 ## dbSNP version 142 ## Extra column keys: ## IMPACT : Subjective impact classification ## DISTANCE : Shortest distance from variant to transcript ## STRAND : Strand of the feature (1/-1) #Uploaded_variation Location Allele Gene Feature Feature_type Consequence cDNA_position CDS_position Protein_position Amino_acids Codons Existing_variation Extra 25_158_T/G 25:158 G ENSBTAG00000047565 ENSBTAT00000065458 Transcript upstream_gene_variant IMPACT=MODIFIER;DISTANCE=3689;STRAND=1 25_158_T/G 25:158 G ENSBTAG00000046523 ENSBTAT00000063454 Transcript upstream_gene_variant IMPACT=MODIFIER;DISTANCE=146;STRAND=1 25_472_C/AC 25:472 AC ENSBTAG00000047565 ENSBTAT00000065458 Transcript upstream_gene_variant IMPACT=MODIFIER;DISTANCE=3375;STRAND=1 Copyright ©2015, Joanna Szyda INNE ŹRÓDŁA INFORMACJI SIFT http://sift.jcvi.org/ Copyright ©2015, Joanna Szyda INNE ŹRÓDŁA INFORMACJI PolyPhen http://genetics.bwh.harvard.edu/pph2/ Copyright ©2015, Joanna Szyda ADNOTACJE WARIANTÓW GENETYCZNYCH SIFT PolyPhen