NGS lista 4 1. Przeprowadź kontrolę jakości surowych

Transkrypt

NGS lista 4 1. Przeprowadź kontrolę jakości surowych
NGS
lista 4
1. Przeprowadź kontrolę jakości surowych danych NGS należących do muszki owocowej
(SRR2132970). Na podstawie wykresów odpowiedz na następujące pytania:
(a) jaka jest najczęstsza średnia jakość sekwencji w obu plikach?
(b) ile sekwencji reprezentuje najwyższą średnią jakość?
(c) jaka jest średnia jakość danych dla pozycji 10, 15, 20?
(d) który z plików jest lepszej jakości?
2. Przećwicz edycję danych używając programu Trimmomatic. Użyj przynajmniej 3
zaproponowanych metod (każda z osobna + wszystkie razem). Na początek, możesz
użyć odpowiedniego ciągu komend w linii poleceń, np.:
java -jar trimmomatic-0.30.jar PE -phred33 input_forward.fq.gz input_reverse.fq.gz
output_forward_paired.fq.gz output_forward_unpaired.fq.gz
output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz OPCJA:wartość
(więcej informacji tutaj  http://www.usadellab.org/cms/?page=trimmomatic).
Po każdej operacji wygeneruj wykresy kontroli jakości. Zastanów się jak wszystkie
przeprowadzone działania wpłynęły na jakość danych.
Uwaga! Zawsze pamiętaj o wskazaniu odpowiedniego kodowania jakości poprzez
opcję TOPHRED
3. Na podstawie wykresów wygenerowanych w zadaniu 1, zaproponuj odpowiedni
według Ciebie, sposób edycji danych. Napisz skrypt w języku bash, w celu
zautomatyzowania tego procesu (wspomóż się skryptem zaprezentowanym na
wykładzie).
05/11/2015
theta.edu.pl
Magda Mielczarek

Podobne dokumenty