Bioinformatyka - Laboratorium nr.2

Transkrypt

Bioinformatyka - Laboratorium nr.2
Bioinformatyka - Laboratorium nr.2
Zadanie 1 - Š¡czenie i konwersja zmiennych.
a) Sprawd¹ wynik komend:
print('The answer is %s0 %42) lub u»yj print('The answer is', str(42))
b) wykonaj konwersj¦ dowolnych 3-ró»nych zmiennych, korzystaj¡c z 3-ch dowolnych funkcji: int(x) - konwersja
zmiennej x do int, long(x) - konwersja zmiennej x do long-a, oat(x) - konwersja x do oat'a, complex(real
[,imag]) - zapis liczby zespolonej, str(x) - konwersja do string zmiennej x, tuple(s) - konwersja do krotki,
list(s) - konwersja do listy, chr(x) - konwersja integer do znaku, unichr(x)- konwersja integer do Unicode,
hex(x)-konwertuje integer do postaci hexadecymalnej, oct(x)-konwertuje integer do postaci ósemkowej
Zadanie 2 Sªowniki.
a) W skªad biaªek wchodzi 20 ró»nych rodzajów aminokwasów biaªkowych, ka»dy z nich ma skrót 1 lub 3 literowy np. A-Ala-alanina (patrz Rys.1). Poni»ej przedstawiono kilka z nich w zbiorze o nazwie amino. Sprawd¹
wynik komend:
amino = {'A':'Ala','C':'Cys','E':'Glu'}
lub u»yj
amino = dict(A='Ala', C='Cys', D='Glu')
print(” C jest oznaczeniem dla: "+amino['C'])
amino['A']
amino.items()
amino.keys()
amino.values()
oraz
Przykªad
aa in amino.values():
print(aa)
for
Rysunek 1: Aminokwasy
b) okre±l wynik dziaªa« nast¦puj¡cych operatorów tj.&, |, −, ∧ na poni»sze zbiory:
zbior1 =set(['CP0.1','EF3.1','EF3.1'])
zbior2 = set(['CP0.2','EF3.1','EF3.2'])
wynik = zbior1 & zbior2 itd.
Pytanie: jakim operacjom matematycznym na zbiorach odpowiadaj¡ rezultaty dziaªa« w/w funkcji.
Zadanie 3 Moduªy
Utwórz funkcj¦ o nazwie silnia, która obliczy warto±¢ silni dla zmiennej zdeklarowanej przez u»ytkownika,
zapisz w/w funkcj¦ do pliku sil.py, nast¦pnie napisz skrypt który obliczy dwumian Newtona n!/(k!(n-k)!) wykorzystuj¡c moduª sil. Uwaga: pami¦taj o import nazwa moduªu.
Zadanie 4 Sekwencje DNA
Sekwencja DNA jest to kolejno±¢ nukleotydów w cz¡steczce DNA. Oznaczana jest za pomoc¡ skrótów od zasad
wchodz¡cych w skªad nukleotydów. Analogicznie, sekwencja RNA jest to kolejno±¢ nukleotydów w cz¡steczce
RNA (w RNA nie wyst¦puje tak jak w DNA tymina "T", zamiast niej wyst¦puje uracyl "U"). Przykªad: gdyby
ni¢ koduj¡ca DNA byªa okre±lona jako CCGATTACGT (A-adeina, G-guanina, C-cytozyna, T-tymina) to powy»sza sekwencja mRNA wygl¡daªaby nast¦puj¡co: CCGAUUACGU.
Rysunek 2: Proces transkrypcji, czyli przepisywanie informacji zawartej w DNA na RNA
a) zapoznaj si¦ z ilustracj¡ Rys.2 przedstawiaj¡c¡ proces transkrypcji (górn¡ ni¢ DNA nazywamy matrycow¡),
zwró¢ uwag¦ na poª¡czenia nici DNA.
1
Twoim zadaniem jest utworzenie programu, który umo»liwi wykonanie u»ytkownikowi transkrypcji kodu DNA
na RNA dla podanej przez u»ytkownikownika sekwencji DNA (ni¢ matrycowa).
b) zmodykuj wcze±niej napisany program tj. poinformuj u»ytkownika o niepoprawno±ci danych je±li poda
liczb¦ nukleotydów mniejsz¡ ni» 10 lub wi¦ksz¡ ni» 25.
Zadanie 5 Aminokwasy
Aminokwasy s¡ budulcem biaªek. Ka»dy z aminokwasów ma indywidualn¡ wag¦. Podczas tworzenia biaªka,
ka»de wi¡zanie aminokwasu uwalnia cz¡steczki wody (o masie cz¡steczkowej M=18). Aby obliczy¢ mas¦ biaªka
nale»y odj¡¢ mas¦ wszystkich uwalnianych cz¡steczek wody od caªkowitej masy aminokwasów wchodz¡cych w
skªad biaªka.
a) wczytaj plik tekstowy zawieraj¡cy mas¦ poszczególnych aminokwasów aminowaga.txt zawieraj¡cy dane:
{”A":89,”V":117,”L":131,”I":131,”P":115,”F":165,
”W":204,”M":149,”G":75,”S":105,”C":121,”T":119,
”Y":181,”N":132,”Q":146,”D":133,”E":147,
”K":146,”R":174,”H":155}
Twoim zadaniem jest utworzenie programu, który umo»liwi obliczenie masy biaªka dla podanej przez u»ytkownika sekwencji aminokwasów. Przykªadowa sekwencja aminokwasów np. MKTFVLHIFIFALVAF
b) dla zbioru=UUCUCGGACCUGGAGAUUCACAGU, oblicz ile razy w w/w zbiorze wyst¦puj¡ kombinacje
liter: UCU, UCC, UCA, UCG, AGU lub AGC
c) Ka»dy aminokwas jest zbudowany z kodonów, ka»dy kodon skªada si¦ z 3 nukleotydów (patrz Rys.3), aminokwas o nazwie seryna skªada si¦ z kodonu: UCU, UCC, UCA, UCG, AGU lub AGC. Znaj¡c fragment sekwencji
nukleotydów biaªka tj. UUCUCGGACCUGGAGAUUCACAGU napisz program który ustali ile razy wyst¦puje
w nim aminokwas seryna, rozwa» nast¦puj¡ce przypadki podziaªu:
- UUC UCG GAC CUG GAG AUU CAC AGU
- U UCU CGG ACC UGG AGA UUC ACA GU
- UU CUC GGA CCU GGA GAU UCA CAG U
Rysunek 3: Proces translacji
PRZYPOMINAMY FUNKCJE
Rysunek 4:
2

Podobne dokumenty