Księgarnia PWN: A
Transkrypt
Księgarnia PWN: A
Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette – Bioinformatyka Słowo wstępne XIII Przedmowa XV 1. Bioinformatyka i Internet Andreas D. Baxevanis 1 1.1. Podstawy Internetu 2 1.2. Połączenie z Internetem 4 1.3. Poczta elektroniczna 7 1.4. FTP (protokół przesyłania plików) 11 1.5. World Wide Web 13 Adresy internetowe do rozdziału 1 17 Literatura 18 2. Model danych NCBI James M. Ostell, Sarah J. Wheelan, Jonathan A. Kans 19 2.1. Wprowadzenie 19 2.2. PUBs – publikuj albo nie istniejesz 24 2.3. Seq-id – co zawiera nazwa? 28 2.4. Bioseq – sekwencja biologiczna 32 2.5. Bioseq-set – zestaw sekwencji 35 2.6. Seq-annot – adnotacje sekwencji 36 2.7. Seq-descr – opisywanie sekwencji 41 2.8. Korzystanie z modelu 42 2.9. Podsumowanie 45 Literatura 45 3. GenBank – baza danych sekwencji Ilene Karsch-Mizrachi, B.F. Francis Ouellette 46 3.1. Wprowadzenie 46 3.2. Pierwotne i wtórne bazy danych 47 3.3. Format a zawartość – komputery a ludzie 48 3.4. Baza danych 50 3.5. Anatomia pliku GenBank 51 3.6. Uwagi końcowe 61 Adresy internetowe do rozdziału 3 61 Literatura 62 Dodatki 62 4. Wprowadzanie sekwencji DNA do baz danych Jonathan A. Kans, B.F. Francis Ouellette 68 4.1. Wstęp 68 4.2. Po co, dokąd i co wprowadzać? 69 4.3. DNA/RNA 70 4.4. Badania populacyjne, filogenetyczne i mutacyjne 73 4.5. Wprowadzanie wyłącznie białek 73 4.6. Jak wprowadzać sekwencje za pomocą usług WWW? 73 4.7. Jak wprowadzać sekwencje przy użyciu programu Sequin? 74 4.8. Aktualizacje 82 4.9. Konsekwencje wynikające z modelu danych 82 4.10. EST/STS/GSS/HTG/SNP i ośrodki genomowe 84 4.11. Uwagi końcowe 85 Adresy wprowadzania danych sekwencyjnych do baz DDBJ/EMBL/GenBank 85 Adresy internetowe do rozdziału 4 86 Literatura 87 5. Bazy danych struktur biomolekularnych Christopher W.V. Hogue 88 5.1. Wstęp do struktur białkowych 88 5.2. PDB – baza struktur białkowych w RCSB 92 5.3. MMDB – baza danych modelowania molekularnego w NCBI 97 5.4. Formaty plików strukturalnych 99 5.5. Wizualizacja informacji strukturalnej 101 5.6. Przeglądarki struktur zawartych w bazie danych 105 5.7. Zaawansowane modelowanie strukturalne 108 5.8. Poszukiwanie podobieństwa strukturalnego 108 Adresy internetowe do rozdziału 5 110 Ćwiczenia 111 Literatura 112 6. Mapowanie genomów i bazy danych map Peter S. White, Tara C. Matise 114 6.1. Zależności między mapowaniem a sekwencjonowaniem 115 6.2. Elementy map genomów 116 6.3. Rodzaje map 118 6.4. Problemy związane z mapowaniem 124 6.5. Składowanie danych 127 6.6. Projekty mapowania i inne zbiory danych 134 6.7. Praktyczne zastosowania danych pochodzących z mapowania 150 Adresy internetowe do rozdziału 6 155 Ćwiczenia 159 Literatura 159 7. Pobieranie informacji z biologicznych baz danych Andreas D. Baxevanis 164 7.1. Zintegrowane pobieranie informacji – system Entrez 164 7.2. LocusLink 184 7.3. Bazy sekwencji poza NCBI 188 7.4. Medyczne bazy danych 192 Adresy internetowe do rozdziału 7 194 Ćwiczenia 195 Literatura 196 8. Dopasowywanie sekwencji i przeszukiwanie baz danych Gregory D. Schuler 197 8.1. Wstęp 197 8.2. Podstawy ewolucyjne dopasowywania sekwencji 197 8.3. Modularna natura białek 200 8.4. Metody optymalnego dopasowywania sekwencji 203 8.5. Wartości substytucji i kary za przerwy 206 8.6. Znaczenie statystyczne dopasowań 209 8.7. Poszukiwanie podobieństwa w bazach danych 210 8.8. FASTA 213 8.9. BLAST 214 8.10. Artefakty towarzyszące przeszukiwaniu bazy danych 218 8.11. Pozycyjne specyficzne macierze wartościujące 221 8.12. Łączone dopasowania 223 8.13. Wnioski 226 Adresy internetowe do rozdziału 8 226 Ćwiczenia 226 Literatura 227 9. Tworzenie i analiza zestawień dopasowanych sekwencji białek Geoffrey J. Barton 229 9.1. Wstęp 229 9.2. Co to są zestawienia sekwencji dopasowanych i po co je tworzymy? 229 9.3. Dopasowywanie struktur czy dopasowywanie ewolucyjne? 231 9.4. Jak dopasowuje się wiele sekwencji? 231 9.5. Narzędzia wspomagające analizę zestawień wielu sekwencji dopasowanych 237 9.6. Zbiory zestawień sekwencji dopasowanych 243 Adresy internetowe do rozdziału 9 243 Ćwiczenia 244 Analiza podrodziny 245 Literatura 246 10. Metody przewidywania regionów kodujących w sekwencjach DNA Adreas D. Baxevanis 248 10.1. GRAIL 251 10.2. FGENEH/FGENES 253 10.3. MZEF 255 10.4. GENSCAN 256 10.5. PROCRUSTES 259 10.6. Jaka jest skuteczność metod rozpoznających geny? 263 10.7. Strategie i rozważania 265 Adresy internetowe do rozdziału 10 267 Ćwiczenia 267 Literatura 268 11. Metody przewidywania wykorzystujące sekwencje białek Sharmila Banerjee-Basu, Andreas D. Baxevanis 270 11.1. Identyczność białek oparta na ich składzie 271 11.2. PROPSEARCH 272 11.3. MOWSE 274 11.4. Właściwości fizyczne oparte na sekwencji 274 11.5. TGREASE 275 11.6. SAPS 276 11.7. Motywy i wzorce 277 11.8. BLOCKS 279 11.9. CDD 281 11.10. Klasy struktur drugorzędowych i zwinięcia łańcucha 281 11.11. PREDATOR 286 11.12. PSIPRED 287 11.13. SOPMA 287 11.14. Wyspecjalizowane struktury lub właściwości 289 11.15. Struktura trzeciorzędowa 295 Adresy internetowe do rozdziału 11 297 Ćwiczenia 298 Literatura 299 12. Znaczniki sekwencji ulegających ekspresji (EST) Tyra G. Wolfsberg, David Landsman 302 12.1. Co to jest EST? 302 12.2. Grupowanie EST 307 12.3. Baza Indeksów Genowych TIGR 313 12.4. STACK 314 12.5. EST i odkrywanie genów 314 12.6. Mapy genów ludzkich 315 12.7. Przewidywanie lokalizacji genów w DNA genomowym 315 12.8. EST i polimorfizmy sekwencji 316 12.9. Szacowanie poziomu ekspresji genów za pomocą EST 317 Adresy internetowe do rozdziału 12 319 Ćwiczenia 320 Literatura 321 13. Składanie sekwencji i metody dokańczające Rodger Staden, David P. Judge, James K. Bonfield 323 13.1. Zastosowanie oszacowań dokładności sygnału zasad lub wartości ufności 325 13.2. Wymagania stawiane programom składającym sekwencje 326 13.3. Całościowe składanie sekwencji 326 13.4. Formaty plików 328 13.5. Przygotowanie odczytów do składania 328 13.6. Wprowadzenie do programu gap4 331 13.7. Proponowanie dodatkowych eksperymentów i automatyzacja projektu 339 13.8. Uwagi końcowe 339 Adresy internetowe do rozdziału 13 340 Ćwiczenia 340 Literatura 341 14. Analizy filogenetyczne Fiona S.L. Brinkman, Detlef D. Leipe 342 14.1. Podstawowe zasady modeli filogenetycznych 344 14.2. Interpretacja drzewa – znaczenie identyfikacji paralogów i ortologów 346 14.3. Cztery etapy analizy danych filogenetycznych 346 14.4. Dopasowywanie sekwencji – tworzenie modelu danych 348 14.5. Dopasowywanie sekwencji – wybór zbioru danych filogenetycznych 353 14.6. Określanie modelu substytucji 354 14.7. Metody tworzenia drzew 361 14.8. Ocena drzewa 369 14.9. Programy filogenetyczne 371 14.10. Programy do analiz filogenetycznych dostępne w Internecie 379 14.11. Uwagi praktyczne 380 Adresy internetowe do rozdziału 14 381 Literatura 382 15. Analiza porównawcza genomów Michael Y. Galperin, Eugene V. Koonin 384 15.1. Postęp w sekwencjonowaniu genomów 385 15.2. Analiza i adnotacje genomu 392 15.3. Zastosowanie genomiki porównawczej do rekonstrukcji szlaków metabolicznych 410 15.4. Jak unikać częstych problemów w adnotacji genomu? 413 15.5. Wnioski 415 Adresy internetowe do rozdziału 15 416 Ćwiczenia 418 Literatura 419 16. Analiza wielkoskalowa genomu Paul S. Meltzer 422 16.1. Wstęp 422 16.2. Techniki wielkoskalowej ekspresji genu 423 16.3. Narzędzia obliczeniowe służące do analizy ekspresji 427 16.4. Grupowanie hierarchiczne 435 16.5. Perspektywy na przyszłość 437 Adresy internetowe do rozdziału 16 438 Literatura 438 17. Perl jako narzędzie ułatwiające analizę biologiczną Lincoln D. Stein 441 17.1. Pierwsze kroki 442 17.2. Jak działa skrypt? 443 17.3. Łańcuchy, liczby i zmienne 444 17.4. Obliczenia arytmetyczne 446 17.5. Rozwijanie zmiennych 447 17.6. Podstawowe wejście i wyjście 448 17.7. Obsługa plików 450 17.8. Podejmowanie decyzji 452 17.9. Bloki wykonywane warunkowo 455 17.10. Co jest prawdą? 458 17.11. Pętle 458 17.12. Łączenie pętli z wczytywaniem danych 460 17.13. Standardowe wejście i wyjście 461 17.14. Znajdowanie długości sekwencji w pliku 463 17.15. Dopasowywanie do wzorca 464 17.16. Wyodrębnianie wyrażeń 468 17.17. Tablice 469 17.18. Tablice i listy 472 17.19. Dzielenie i łączenie 472 17.20. Hasze 473 17.21. Przykład praktyczny 474 17.22. Co dalej? 477 Adresy internetowe do rozdziału 17 478 Literatura 478 Słowniczek 479 Skorowidz 484