Problemy jednoczesnego testowania wielu hipotez statystycznych i
Transkrypt
Problemy jednoczesnego testowania wielu hipotez statystycznych i
Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA Konrad Furmańczyk Katedra Zastosowań Matematyki SGGW Plan referatu • Testowanie w analizie mikromacierzy DNA • Uogólnienia błędów I rodzaju: FWER, k-FWER, FDP, FDR • Klasyczne procedury testowania wielu hipotez: cut-off, step-down, step-up • Pewne wyniki dla zależnych testowań • Symulacje Wyniki eksperymentu mikromacierzowego Mikromacierz 1 Gen 1 Gen 2 … Gen m Mikromacierz 2 … Mikromacierz n Testowanie w analizie mikromacierzy DNA • Typowe zadanie: porównujemy poziomy ekspresji genów z eksperymentu mikromacierzowego wykonanego w dwóch badanych grupach. • Istotne problemy wnioskowania: • mała liczebność grup (np. n1= n2= 8) • duża liczba genów (porównań) np. m=3000 • Po wstępnej analizie danych i ich normalizacji stosujemy do porównań np. test t-Studenta w przypadku niezależnych prób z dwóch populacji Model statystyczny X i poziom ekspresji i - tego genu w I grupie Yi poziom ekspresji i - tego genu w II grupie Niech X i ~ N ( mi , k , σ 1 ) oraz Yi ~ N ( mi ,c , σ 2 ) Testujemy m hipotez H 0 ,i : mi , k − mi ,c = 0 wobec H 1,i : mi , k − mi ,c ≠ 0 Test t-Studenta • Statystyka testowa ma postać: ti = X i − Yi 2 S X ,i S Y ,i + n1 n2 2 Inne używane testy • Możemy również używać testów nieparametrycznych dotyczących testowania różnicy rozkładów zmiennych losowych X i oraz Yi np. test Wilcoxona lub U-Manna-Witneya (w przypadku wykrycia niejednorodności wariancji). Istotne problemy testowania: • Jeśli każdy test wykonamy przy ustalonym poziomie istotności α = 0.05 to przeciętnie otrzymamy m ⋅ α ≈ 3000 * 0.05 = 150 genów o istotnie różnych poz. ekspresji, nawet jeśli rzeczywiście żaden gen istotnie nie różnicuje badane grupy. Uogólnienia błędu I rodzaju • Dlatego rozpatrujemy takie procedury testowania dla których umiemy kontrolować miary błędu MB takie jak: FWER, k-FWER, FDR, tzn. MB ≤ α Słaba i mocna kontrola • Słaba kontrola MB: gdy wszystkie rozważane hipotezy zerowe są prawdziwe. • Mocna kontrola MB: gdy rozważamy dowolną konfigurację prawdziwych hipotez zerowych wśród m testowanych hipotez zerowych, dokładniej rozważmy H 0,i : θ ∈ Θ i dla i = 1,..., m MBθ ≤ α dla każdego θ ∈ Θ i , gdzie i∈ M 0 M 0 = {i : H 0,i jest prawdziwa} FWER • FWER (Family Wise Error Rate) to prawdopodobieństwo, że popełnimy przynajmniej jeden błąd I rodzaju testując m hipotez Niech V = # false discoveries Wtedy FWER = Pθ (V ≥ 1) Procedura Bonferroniego • Każdą hipotezę testujemy na poziomie istotności α / m aby otrzymać FWER ≤ α • Niestety taka procedura jest bardzo restrykcyjna (będzie miała bardzo małą zdolność do wykrycia genów istotnie różnicujących) , bowiem każdą hipotezę (tzw. proc. cut -off) testujemy na na poziomie 0.05/3000 = 1.67*10-5 Procedury step-down • Niech α ≤ ... ≤ α 1 m • Rozważmy uporządkowany ciąg poziomów krytycznych (p-wartości): p(1) ≤ p( 2) ... ≤ p( m ) • Jeśli p(1) > α 1 , to nie odrzucamy żadnej hipotezy zerowej H0,i • w przeciwnym przyp., gdy (*) p(1) ≤ α 1 ,..., p( r ) ≤ α to odrzucamy hipotezy H0,(1),…, H0,(r) gdzie r największa liczba spełniająca (*) r Procedura Holma • To procedura step-down z α i = α /(m − i + 1) • Przy testowaniu wielu hipotez procedura Holma zapewnia kontrolę FWER na poziomie α • Dodatkowo procedura Holma ma większą moc od procedury Bonferroniego. k-FWER • Lehmann i Romano (2005) zaproponowali uogólnioną procedurę Holma, tzn. procedurę step-down z kα / m, i≤ k αi= kα /(m + k − i ), i > k . która kontroluję (mocno) k-FWER, tzn. k - FWER := Pθ (V ≥ k ) ≤ α . • Zwykle procedury kontrolujące k-FWER mają większą moc niż procedury kontrolujące FWER. False Discovery Rate (FDR) • Benjamini i Hochberg (1995) wprowadzili oraz V / R , FDP = 0, R> 0 R= 0 FDR = Eθ (FDP ) gdzie R = liczba odrzuconych hipotez zerowych Procedura BH kontroli FDR { } • Niech k = max i : p( i ) ≤ α ⋅ i / m • Jeśli istnieje takie k, to odrzucić hipotezy H0,(1),…, H0,(k) . W przeciwnym przypadku nic nie odrzucamy. • Procedura BH jest przykładem tzw. procedur step-up z α i = α ⋅ i / m Procedury step-up • Jeśli p( m ) ≤ α m , to nie przyjmujemy żadnej hipotezy zerowej H0,i • w przeciwnym przyp., gdy (**) p( m ) > α m ,..., p( r + 1) > α r+ 1 to przyjmujemy hipotezy H0,(r+1),…, H0,(m) gdzie r najmniejsza liczba spełniająca (**) Twierdzenie (Benjamini i Hochberg (1995)) • Dla niezależnych statystyk testowych procedura BH zapewnia kontrolę FDR, tzn. FDR ≤ α ⋅ m0 / m ≤ α gdzie m0 oznacza liczbę prawdziwych hipotez zerowych wśród m testowanych. Kontrola FDR dla zależnych testów • Benjamini i Yekutieli (2001) pokazali, że dla dodatnio zależnych (regresyjnie dod. zal.) statystyk testowych odpowiadającym prawdziwym hipotezom zerowym procedura BH zapewnia FDR ≤ α ⋅ m0 / m ≤ α Przykłady dod. zależności • Wektor T m statystyk testowych ma rozkład N (µ , Σ ) • rozważamy H0,i: µ i = 0 wobec H1,i : µ i > 0 dla i ∈ M 0 j ≠ i Σ i , j ≥ 0, gdzie M 0 = {i : H 0,i prawdziwe} Przykłady dodatniej zależności c.d. • wektor m wym. Y ma rozkład N ( µ , Σ ) • testujemy H 0,i : µ i = 0 wobec H1,i : µ i ≠ 0 • wielowymiarowy t-Studenta T = Y /S • Pewne wyniki dla kontroli dla zależnych testów uzyskali Dudziński i Furmańczyk (2007) np. Pθ ( R ≥ 1) > 0 Pθ (qi ≤ u T = t ) ≤ u dla u ∈ (0,1), i = 1,..., m0 , t = 0,1,..., m − m0 , T = V − R lub V i V − R są ujem. zal. to procedura Holma kontroluje (mocno) FDR. Kontrola FDR bez zał. o zależności • Benjamini i Yekutieli (2001) pokazali, że jeśli wstawimy w procedurze BH zamiast α m 1 * wartość α = α / ∑ , i= 1 i to również otrzymamy kontrolę FDR na poziomie α , ale o znacznie niższej mocy. Ulepszenia procedury BH i kontroli FDR • Estymacja wartości m0 znacznie by poprawiła kontrolę FDR wstawiając zamiast α wartość α * m =α m0 Dwustopniowa procedura BH • Benjamini i inni (2001) zaproponowali dwustopniową procedurę BH, która kontroluje FDR dla niezależnych statystyk testowych: • w pierwszym kroku stosujemy zwykłą procedurę BH w wyniku czego odrzucamy r1 hipotez zerowych, • w drugim kroku stosujemy zwykła procedurę m BH z * α =α . (m − r1 )(1 + α ) q-value (Storey (2003)) • Niech pFDR = Eθ (V / R R > 0) • Rozważmy rodzinę zbiorów odrzuceń dla hipotez zerowych taką, że {Γ α } α < β ⇒ Γ α ⊂ Γ β • Załóżmy, że π 0 = P ( H 0,i = 0), π 1 = P( H 0,i = 1) = 1 − π 0 • Niech ciągiem (Ti ,H0,i) będzie i.i.d. • Rozkład statystyki testowej Ti pod warunkiem H0,i ma postać: Ti H 0,i = (1 − H 0,i ) F0 + H 0,i F1 , gdzie F0 jest rozkładem stat. test. pod warunkiem prawdziwości H0,i • F1 jest rozkładem stat. test. pod warunkiem prawdziwości hipotezy alternatywnej Wtedy pFDR = P ( H 0,i = 0 Ti ∈ Γ α ) = π 0 P (Ti ∈ Γ α H 0,i = 0) P (Ti ∈ Γ α ) p - value(t ) = inf{Γ α :t∈ Γ α } P(T ∈ Γ α H o ,i = 0) q - value(t ) = inf{Γ α :t∈ Γ α } pFDP(Γ α ) = inf{Γ α :t∈ Γ α } P ( H o ,i = 0 T ∈ Γ α ) • q-value służy do oceny istotności genów • W naszym przypadku q - value(t ) = Pθ ( H 0,i = 0 Ti ≥ t ) • Reguła wyboru istotnych genów: wybierz te geny (jako istotne) dla których q-value <0.05 Pakiety w R do jednoczesnego testowania: • • • • • multtest nFDR qvalue FDR-AME multcomp Symulacje m=100, m0=90 0.0 0.2 0.4 0.6 0.8 1.0 p 6 5 4 3 Frequency 2 1 0 0.2 0.4 12 0.0 0.2 0.4 0.6 p[null] Histogram of p[alt] 0.0 0 2 4 6 8 Frequency 12 Histogram of p[null] 0 2 4 6 8 Frequency Histogram of p 0.6 p[alt] 0.8 1.0 0.8 1.0 m=1000, m0=900 Stat. rozk. norm, n1=n2=30, m=3000, m0=1200 Stat. rozk. t-Stud, n1=n2=30, m=3000, m0=1200 Dane z mikromacierzy Golub (1999) • Badano 3051 genów w dwóch grupach pacjentów chorych na 2 typy białaczki, n1=27, n2=11. Literatura • • • • • • Benjamini Y., Hochberg Y. 1995. Controling the false discovery rate: a practical and powerful approach to multiple testing. J. Roy. Statist. Soc. Ser.B 57: 289-300 Benjamini Y., Yekutieli D. 2001. The control of the false discovery rate in multiple testing under dependency. Ann. Statist.:29, 1165-1188 Dudoit S, Shaffer J.P., Boldrick J.C. 2003 Multiple hypothesis testing in microarray experiments. Statist. Scien. 18 (1): 71-103 Dudziński M, Furmańczyk K. 2007. Procedury jednoczesnego testowania wielu hipotez i ich zastosowania w analizie mikromacierzy DNA, Matematyka Stosowana Lehman E.L., Romano J.P. 2005. Generalizations of the familywise error rate. Ann. Statist. 33: 1138-1154 Storey J. 2003. The positive false discovery rate: A Bayesian interpretation and the q-value. Ann. Statist. 31: 2013-2035