P(A - theta.edu.pl

Transkrypt

P(A - theta.edu.pl
BIOINFORMATYKA
1. Wykład wstępny
2. Struktury danych w badaniach bioinformatycznych
3. Bazy danych: projektowanie i struktura
4. Bazy danych: projektowanie i struktura
5. Równowaga Hardyego-Weinberga, współczynnik rekombinacji
6. Analiza asocjacyjna
7. Analiza asocjacyjna
8. Funkcjonalna adnotacja genomu: KEGG
9. Funkcjonalna adnotacja genomu: GO
10. Symulacje komputerowe, jackknife, bootstrap
11. Monte Carlo Markov Models
12. Metody klasyfikacyjne
13. Wykład podsumowujący
14. Zastosowanie przykładowych programów do analizy danych
15. Zastosowanie przykładowych programów do analizy danych
WSTĘP
1. Równowaga Hardyego Weinberga
• definicja
• 1 locus
• 2 loci
• obliczanie współczynnika zaburzenia
równowagi pomiędzy parą loci
2. Sprzężenie
• definicja
• miary odległości pomiędzy loci
• interferencja
• obliczanie współczynnika rekombinacji
• funkcje mapowania
Copyright ©2011, Joanna Szyda
RÓWNOWAGA
HARDYEGO-WEINBERGA
PRAWO HARDYEGO-WEINBERGA - definicja
• Hardy - matematyk, Science (1908) 28: 49-50
• Weinberg - lekarz, Jahreshefte des Vereins fur vaterlandische
Naturkunde in Wuttemberg (1908) 64: 368-382
Godfrey H. Hardy
Wilhelm Weinberg
Copyright ©2011, Joanna Szyda
PRAWO HARDYEGO-WEINBERGA - definicja
• " W losowo rozmnażającej się nieskończenie dużej populacji, w której
nie występują selekcja, mutacje i migracja, frekwencje alleli i genotypów
są niezmienne w kolejnych pokoleniach ...
pokolenie 1:
pokolenie 2:
...
pokolenie n:
P(A1)=p
P(A1)=p
P(A2)=q
P(A2)=q
P(A1)=p
P(A2)=q
• ... w takiej populacji istnieje stały związek pomiędzy frekwencją alleli, a
frekwencją genotypów"
pokolenie 1: P(A1A1)=p*p
pokolenie 2: P(A1A1)=p2
...
pokolenie n: P(A1A1)=p2
P(AA)
P(A1A2)=p*q P(A2A1)=p*q
P(A1A2)=2pq
P(A2A2)=q*q
P(A2A2)=q2
P(A1A2)=2pq
P(A2A2)=q2
P(A)
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE vs. ASOCJACJA
SPRZĘŻENIE
A1
A2
ASOCJACJA
B1
B2
A1B1 A1B1
A2B2
A1B1
•
fizyczne powiązanie
pomiędzy parą loci
poprzez położenie na tym
samym chromosomie
•
•
miara - współczynnik
rekombinacji
•
•
pomiędzy sprzężonymi
loci zwykle brak
równowagi HW
•
•
•
Dlaczego?
•
A1B2
A2B2
A2B2
A2B1
nielosowa segregacja
alleli pomiędzy parą loci =
zabużenie równowagi HW
= linkage disequilibrium =
LD
może wyniknąć z różnych
przyczyn np. sprzężenia,
selekcji
miara - współczynnik LD
loci pozostające w LD nie
zawsze są sprzężone
Dlaczego?
Copyright ©2015, Joanna Szyda
PRAWO HARDYEGO-WEINBERGA - przykład dla 1 locus
• locus grup krwi typu M/N
• grupa krwi jest determinowana przez 2 allele
MiN
• grupy krwi zidentyfikowana u 747
mieszkańców Islandii
• zaobserwowano:
frekwencje alleli:
P(M)=0.6 P(N)=0.4
liczebności grup krwi:
MM
MN
NN

= 233
= 385
= 129
= 747
Copyright ©2011, Joanna Szyda
PRAWO HARDYEGO-WEINBERGA - przykład dla 1 locus
HIPOTEZY
• H0: P(MM)=p2
i
P(MN)=2pq i
P(NN)=q2
populacja Islandii pozostaje w równowadze HardyegoWeinberga
=
w populacji występuje kojarzenie losowe, brak selekcji,
mutacji, migracji
• H1: P(MM)p2
lub P(MN)2pq lub
P(NN)q2
populacja Islandii nie znajduje się w równowadze
Hardyego-Weinberga
=
w populacji nie występuje kojarzenie losowe i/lub istnieją
selekcja, mutacje, migracja
Copyright ©2011, Joanna Szyda
PRAWO HARDYEGO-WEINBERGA - przykład dla 1 locus
TEST
• przyjęte maksymalne pr. błędu MAX = 0.05
tzn. prawdopodobieństwo błędnej decyzji o odrzuceniu H0, choć w
rzeczywistości H0 jest prawdziwa
• na podstawie rozkładu 22 T = 0.02
tzn. jeżeli na podstawie wyników testu odrzucimy H0 to prawdopodobieństwo,
że w rzeczywistości H0 jest prawdziwa wynosi 0.02
• MAX > T
H0
H1
• populacja nie znajduje się w równowadze Hardyego-Weinberga
Copyright ©2011, Joanna Szyda
ASOCJACJA
PRAWO HARDYEGO-WEINBERGA - przykład dla 2 loci
• loci leżą na tym samym chromosomie
• każdy z loci ma 2 allele A1, A2 i B1, B2
• zidentyfikowane na chromosomie 2 u 24
osobników Drosophila melanogaster
• frekwencje alleli:
P(A1)=0.17 P(A2)=0.83
P(B1)=0.36 P(B2)=0.64
• liczebności genotypów:
A1B1=4
A2B2=26
A1B2=4
A2B1=14
=48
Copyright ©2011, Joanna Szyda
PRAWO HARDYEGO-WEINBERGA - przykład dla 2 loci
A
B
A1
B1
A2
B2
A1
B2
A2
B1
HIPOTEZY
• H0:
P(A1B1)=P(A1)*P(B1) P(A2B2)=P(A2)*P(B2) P(A1B2)=P(A1)*P(B2) P(A2B1)=P(A2)*P(B2)
loci pozostają w równowadze Hardyego- Weinberga
• H1:
P(A1B1)P(A1)*P(B1) P(A2B2)P(A2)*P(B2) P(A1B2)P(A1)*P(B2) P(A2B1)P(A2)*P(B2)
loci nie znajduje się w równowadze Hardyego-Weinberga
Copyright ©2011, Joanna Szyda
PRAWO HARDYEGO-WEINBERGA - przykład dla 2 loci
TEST
• przyjęte maksymalne pr. błędu MAX = 0.05
• na podstawie rozkładu 23 T = 0.83
• MAX > T
H0
H1
• loci A i B znajdują się w równowadze Hardyego-Weinberga
Copyright ©2011, Joanna Szyda
ASOCJACJA - współczynnik zaburzenia równowagi HW
Równowaga HW
locus A
P ( haplotypów )
A1
A2
B1
P(A1)*P(B1)
P(A2)*P(B1)
B2
P(A1)*P(B2)
P(A2)*P(B2)
locus B
Copyright ©2011, Joanna Szyda
ASOCJACJA - współczynnik zaburzenia równowagi HW
Zaburzenie równowagi HW (linkage disequilibrium LD)
locus A
P ( haplotypów )
A1
A2
B1
P(A1)*P(B1)
+D
P(A2)*P(B1)
-D
B2
P(A1)*P(B2)
-D
P(A2)*P(B2)
+D
locus B
Copyright ©2011, Joanna Szyda
ASOCJACJA - estymacja LD
locus A
P ( haplotypów )
A1
A2
B1
P(A1)*P(B1)
+D
P(A2)*P(B1)
-D
B2
P(A1)*P(B2)
-D
P(A2)*P(B2)
+D
locus B
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE
SPRZĘŻENIE - miary odległości pomiędzy loci
1. Odległość fizyczna
• liczba par zasad
• bp (base pair), kbp=1 000 bp, Mbp=1 000 000 bp
• miara addytywna: A‒2kbp‒B‒5kbp‒C to A‒7kbp‒C
2. Prawdopodobieństwo - odległość mapowania
• M (Morgan), cM=0.01 M
• 1M = prawdopodobieństwo wystąpienia 1 crossing
over pomiędzy parą loci w czasie jednej mejozy
• miara addytywna: A‒20cM‒B‒5cM‒C to A‒25cM‒C
• w genomie człowieka średnio 1M ≈ 1Mbp
• 1M nie zawsze odpowiada jednakowej liczbie bp !!!
• częstość crossing over różni się pomiędzy płciami,
regionami chromosomów, gatunkami
Copyright ©2015, Joanna Szyda
SPRZĘŻENIE - miary odległości pomiędzy loci
3. Prawdopodobieństwo - częstość rekombinacji
•
r, (recombination rate)
•
prawdopodobieństwo wystąpienia rekombinacji
pomiędzy parą loci
•
rekombinacja = zajście nieparzystej liczby crossing
over
•
r  [ 0, 0.5 ]
•
r=0.5 niezależna segregacja loci
•
miara nieaddytywna:
A‒‒‒r=0.1‒‒‒B‒‒‒r=0.2‒‒‒C
to
A‒‒‒r0.3‒‒‒C
rAC = rAB + rBC - 2rABrBC
Copyright ©2015 Joanna Szyda
SPRZĘŻENIE - estymacja współczynnika rekombinacji
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE - estymacja współczynnika rekombinacji
A
A
A
A
B
B
B
B
C
REKOMBINACJA
AB
BC
AC
‒
‒
‒
+
‒
+
‒
+
+
+
+
‒
C
C
C
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE - interferencja
A
B
C
BRAK INTERFERENCJI
INTERFERENCJA
•
Crossing over są od
siebie niezależne
•
Wystąpienie jednego
crossing over zmienia
prawdopodobieństwo
zajścia następnych
•
rAC = rAB + rBC - 2rABrBC
•
rAC = rAB + rBC - 2CrABrBC
•
2rABrBC korekta na
podwójną rekombinację
•
1-C interferencja
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE - funkcje mapowania
•
poszczególne crossing over → niewidoczne → nie
można obliczyć odległości mapowania [ M ]
•
rekombinacja → widoczna → można obliczyć wsp.
rekombinacji [ r ]
•
funkcje mapowania służą do przeliczania r na M
•
... i dowrotnie
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE - funkcje mapowania
Funkcja Haldane'a: brak interferencji, C=1
Funkcja Kosambi: interferencja, C=2r
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE - funkcje mapowania
2.0
1.9
1.8
Haldane
1.7
1.6
Kosambi
1.5
1.4
1.3
1.2
1.1
M
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0
0.1
0.2
0.3
r
0.4
0.5
Copyright ©2011, Joanna Szyda
SPRZĘŻENIE
vs
ASOCJACJA
SPRZĘŻENIE vs ASOCJACJA
•
Sprzężenie  fizyczne powiązanie pomiędzy loci
•
Asocjacja
 powiązanie pomiędzy loci
 nie musi wynikać ze sprzężenia
 może być wynikiem np. selekcji,
mutacji, stratyfikacji w populacji
Copyright ©2015, Joanna Szyda
P(AA)
P(A)
sprzężenie
a
asocjacja
POWIĄZANIE
POMIĘDZY
GENAMI
locus A
P ( haplotypów )
A1
A2
B1
P(A1)*P(B1)
+D
P(A2)*P(B1)
-D
B2
P(A1)*P(B2)
-D
P(A2)*P(B2)
+D
locus B
Copyright ©2013, Joanna Szyda

Podobne dokumenty