P(A - theta.edu.pl
Transkrypt
P(A - theta.edu.pl
BIOINFORMATYKA 1. Wykład wstępny 2. Struktury danych w badaniach bioinformatycznych 3. Bazy danych: projektowanie i struktura 4. Bazy danych: projektowanie i struktura 5. Równowaga Hardyego-Weinberga, współczynnik rekombinacji 6. Analiza asocjacyjna 7. Analiza asocjacyjna 8. Funkcjonalna adnotacja genomu: KEGG 9. Funkcjonalna adnotacja genomu: GO 10. Symulacje komputerowe, jackknife, bootstrap 11. Monte Carlo Markov Models 12. Metody klasyfikacyjne 13. Wykład podsumowujący 14. Zastosowanie przykładowych programów do analizy danych 15. Zastosowanie przykładowych programów do analizy danych WSTĘP 1. Równowaga Hardyego Weinberga • definicja • 1 locus • 2 loci • obliczanie współczynnika zaburzenia równowagi pomiędzy parą loci 2. Sprzężenie • definicja • miary odległości pomiędzy loci • interferencja • obliczanie współczynnika rekombinacji • funkcje mapowania Copyright ©2011, Joanna Szyda RÓWNOWAGA HARDYEGO-WEINBERGA PRAWO HARDYEGO-WEINBERGA - definicja • Hardy - matematyk, Science (1908) 28: 49-50 • Weinberg - lekarz, Jahreshefte des Vereins fur vaterlandische Naturkunde in Wuttemberg (1908) 64: 368-382 Godfrey H. Hardy Wilhelm Weinberg Copyright ©2011, Joanna Szyda PRAWO HARDYEGO-WEINBERGA - definicja • " W losowo rozmnażającej się nieskończenie dużej populacji, w której nie występują selekcja, mutacje i migracja, frekwencje alleli i genotypów są niezmienne w kolejnych pokoleniach ... pokolenie 1: pokolenie 2: ... pokolenie n: P(A1)=p P(A1)=p P(A2)=q P(A2)=q P(A1)=p P(A2)=q • ... w takiej populacji istnieje stały związek pomiędzy frekwencją alleli, a frekwencją genotypów" pokolenie 1: P(A1A1)=p*p pokolenie 2: P(A1A1)=p2 ... pokolenie n: P(A1A1)=p2 P(AA) P(A1A2)=p*q P(A2A1)=p*q P(A1A2)=2pq P(A2A2)=q*q P(A2A2)=q2 P(A1A2)=2pq P(A2A2)=q2 P(A) Copyright ©2011, Joanna Szyda SPRZĘŻENIE vs. ASOCJACJA SPRZĘŻENIE A1 A2 ASOCJACJA B1 B2 A1B1 A1B1 A2B2 A1B1 • fizyczne powiązanie pomiędzy parą loci poprzez położenie na tym samym chromosomie • • miara - współczynnik rekombinacji • • pomiędzy sprzężonymi loci zwykle brak równowagi HW • • • Dlaczego? • A1B2 A2B2 A2B2 A2B1 nielosowa segregacja alleli pomiędzy parą loci = zabużenie równowagi HW = linkage disequilibrium = LD może wyniknąć z różnych przyczyn np. sprzężenia, selekcji miara - współczynnik LD loci pozostające w LD nie zawsze są sprzężone Dlaczego? Copyright ©2015, Joanna Szyda PRAWO HARDYEGO-WEINBERGA - przykład dla 1 locus • locus grup krwi typu M/N • grupa krwi jest determinowana przez 2 allele MiN • grupy krwi zidentyfikowana u 747 mieszkańców Islandii • zaobserwowano: frekwencje alleli: P(M)=0.6 P(N)=0.4 liczebności grup krwi: MM MN NN = 233 = 385 = 129 = 747 Copyright ©2011, Joanna Szyda PRAWO HARDYEGO-WEINBERGA - przykład dla 1 locus HIPOTEZY • H0: P(MM)=p2 i P(MN)=2pq i P(NN)=q2 populacja Islandii pozostaje w równowadze HardyegoWeinberga = w populacji występuje kojarzenie losowe, brak selekcji, mutacji, migracji • H1: P(MM)p2 lub P(MN)2pq lub P(NN)q2 populacja Islandii nie znajduje się w równowadze Hardyego-Weinberga = w populacji nie występuje kojarzenie losowe i/lub istnieją selekcja, mutacje, migracja Copyright ©2011, Joanna Szyda PRAWO HARDYEGO-WEINBERGA - przykład dla 1 locus TEST • przyjęte maksymalne pr. błędu MAX = 0.05 tzn. prawdopodobieństwo błędnej decyzji o odrzuceniu H0, choć w rzeczywistości H0 jest prawdziwa • na podstawie rozkładu 22 T = 0.02 tzn. jeżeli na podstawie wyników testu odrzucimy H0 to prawdopodobieństwo, że w rzeczywistości H0 jest prawdziwa wynosi 0.02 • MAX > T H0 H1 • populacja nie znajduje się w równowadze Hardyego-Weinberga Copyright ©2011, Joanna Szyda ASOCJACJA PRAWO HARDYEGO-WEINBERGA - przykład dla 2 loci • loci leżą na tym samym chromosomie • każdy z loci ma 2 allele A1, A2 i B1, B2 • zidentyfikowane na chromosomie 2 u 24 osobników Drosophila melanogaster • frekwencje alleli: P(A1)=0.17 P(A2)=0.83 P(B1)=0.36 P(B2)=0.64 • liczebności genotypów: A1B1=4 A2B2=26 A1B2=4 A2B1=14 =48 Copyright ©2011, Joanna Szyda PRAWO HARDYEGO-WEINBERGA - przykład dla 2 loci A B A1 B1 A2 B2 A1 B2 A2 B1 HIPOTEZY • H0: P(A1B1)=P(A1)*P(B1) P(A2B2)=P(A2)*P(B2) P(A1B2)=P(A1)*P(B2) P(A2B1)=P(A2)*P(B2) loci pozostają w równowadze Hardyego- Weinberga • H1: P(A1B1)P(A1)*P(B1) P(A2B2)P(A2)*P(B2) P(A1B2)P(A1)*P(B2) P(A2B1)P(A2)*P(B2) loci nie znajduje się w równowadze Hardyego-Weinberga Copyright ©2011, Joanna Szyda PRAWO HARDYEGO-WEINBERGA - przykład dla 2 loci TEST • przyjęte maksymalne pr. błędu MAX = 0.05 • na podstawie rozkładu 23 T = 0.83 • MAX > T H0 H1 • loci A i B znajdują się w równowadze Hardyego-Weinberga Copyright ©2011, Joanna Szyda ASOCJACJA - współczynnik zaburzenia równowagi HW Równowaga HW locus A P ( haplotypów ) A1 A2 B1 P(A1)*P(B1) P(A2)*P(B1) B2 P(A1)*P(B2) P(A2)*P(B2) locus B Copyright ©2011, Joanna Szyda ASOCJACJA - współczynnik zaburzenia równowagi HW Zaburzenie równowagi HW (linkage disequilibrium LD) locus A P ( haplotypów ) A1 A2 B1 P(A1)*P(B1) +D P(A2)*P(B1) -D B2 P(A1)*P(B2) -D P(A2)*P(B2) +D locus B Copyright ©2011, Joanna Szyda ASOCJACJA - estymacja LD locus A P ( haplotypów ) A1 A2 B1 P(A1)*P(B1) +D P(A2)*P(B1) -D B2 P(A1)*P(B2) -D P(A2)*P(B2) +D locus B Copyright ©2011, Joanna Szyda SPRZĘŻENIE SPRZĘŻENIE - miary odległości pomiędzy loci 1. Odległość fizyczna • liczba par zasad • bp (base pair), kbp=1 000 bp, Mbp=1 000 000 bp • miara addytywna: A‒2kbp‒B‒5kbp‒C to A‒7kbp‒C 2. Prawdopodobieństwo - odległość mapowania • M (Morgan), cM=0.01 M • 1M = prawdopodobieństwo wystąpienia 1 crossing over pomiędzy parą loci w czasie jednej mejozy • miara addytywna: A‒20cM‒B‒5cM‒C to A‒25cM‒C • w genomie człowieka średnio 1M ≈ 1Mbp • 1M nie zawsze odpowiada jednakowej liczbie bp !!! • częstość crossing over różni się pomiędzy płciami, regionami chromosomów, gatunkami Copyright ©2015, Joanna Szyda SPRZĘŻENIE - miary odległości pomiędzy loci 3. Prawdopodobieństwo - częstość rekombinacji • r, (recombination rate) • prawdopodobieństwo wystąpienia rekombinacji pomiędzy parą loci • rekombinacja = zajście nieparzystej liczby crossing over • r [ 0, 0.5 ] • r=0.5 niezależna segregacja loci • miara nieaddytywna: A‒‒‒r=0.1‒‒‒B‒‒‒r=0.2‒‒‒C to A‒‒‒r0.3‒‒‒C rAC = rAB + rBC - 2rABrBC Copyright ©2015 Joanna Szyda SPRZĘŻENIE - estymacja współczynnika rekombinacji Copyright ©2011, Joanna Szyda SPRZĘŻENIE - estymacja współczynnika rekombinacji A A A A B B B B C REKOMBINACJA AB BC AC ‒ ‒ ‒ + ‒ + ‒ + + + + ‒ C C C Copyright ©2011, Joanna Szyda SPRZĘŻENIE - interferencja A B C BRAK INTERFERENCJI INTERFERENCJA • Crossing over są od siebie niezależne • Wystąpienie jednego crossing over zmienia prawdopodobieństwo zajścia następnych • rAC = rAB + rBC - 2rABrBC • rAC = rAB + rBC - 2CrABrBC • 2rABrBC korekta na podwójną rekombinację • 1-C interferencja Copyright ©2011, Joanna Szyda SPRZĘŻENIE - funkcje mapowania • poszczególne crossing over → niewidoczne → nie można obliczyć odległości mapowania [ M ] • rekombinacja → widoczna → można obliczyć wsp. rekombinacji [ r ] • funkcje mapowania służą do przeliczania r na M • ... i dowrotnie Copyright ©2011, Joanna Szyda SPRZĘŻENIE - funkcje mapowania Funkcja Haldane'a: brak interferencji, C=1 Funkcja Kosambi: interferencja, C=2r Copyright ©2011, Joanna Szyda SPRZĘŻENIE - funkcje mapowania 2.0 1.9 1.8 Haldane 1.7 1.6 Kosambi 1.5 1.4 1.3 1.2 1.1 M 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0 0.1 0.2 0.3 r 0.4 0.5 Copyright ©2011, Joanna Szyda SPRZĘŻENIE vs ASOCJACJA SPRZĘŻENIE vs ASOCJACJA • Sprzężenie fizyczne powiązanie pomiędzy loci • Asocjacja powiązanie pomiędzy loci nie musi wynikać ze sprzężenia może być wynikiem np. selekcji, mutacji, stratyfikacji w populacji Copyright ©2015, Joanna Szyda P(AA) P(A) sprzężenie a asocjacja POWIĄZANIE POMIĘDZY GENAMI locus A P ( haplotypów ) A1 A2 B1 P(A1)*P(B1) +D P(A2)*P(B1) -D B2 P(A1)*P(B2) -D P(A2)*P(B2) +D locus B Copyright ©2013, Joanna Szyda