NGS lista 4 1. Przeprowadź kontrolę jakości surowych
Transkrypt
NGS lista 4 1. Przeprowadź kontrolę jakości surowych
NGS lista 4 1. Przeprowadź kontrolę jakości surowych danych NGS należących do muszki owocowej (SRR2132970). Na podstawie wykresów odpowiedz na następujące pytania: (a) jaka jest najczęstsza średnia jakość sekwencji w obu plikach? (b) ile sekwencji reprezentuje najwyższą średnią jakość? (c) jaka jest średnia jakość danych dla pozycji 10, 15, 20? (d) który z plików jest lepszej jakości? 2. Przećwicz edycję danych używając programu Trimmomatic. Użyj przynajmniej 3 zaproponowanych metod (każda z osobna + wszystkie razem). Na początek, możesz użyć odpowiedniego ciągu komend w linii poleceń, np.: java -jar trimmomatic-0.30.jar PE -phred33 input_forward.fq.gz input_reverse.fq.gz output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz OPCJA:wartość (więcej informacji tutaj http://www.usadellab.org/cms/?page=trimmomatic). Po każdej operacji wygeneruj wykresy kontroli jakości. Zastanów się jak wszystkie przeprowadzone działania wpłynęły na jakość danych. Uwaga! Zawsze pamiętaj o wskazaniu odpowiedniego kodowania jakości poprzez opcję TOPHRED 3. Na podstawie wykresów wygenerowanych w zadaniu 1, zaproponuj odpowiedni według Ciebie, sposób edycji danych. Napisz skrypt w języku bash, w celu zautomatyzowania tego procesu (wspomóż się skryptem zaprezentowanym na wykładzie). 05/11/2015 theta.edu.pl Magda Mielczarek