statystyczne modelowanie danych biologicznych
Transkrypt
statystyczne modelowanie danych biologicznych
STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH WYKAD 4 03 listopad 2014 1 / 26 Plan wykªadu 1. Testowanie zaªo»e« o proporcjonalnym hazardzie w modelu Cox'a 2. Wybór zmiennych do modelu Cox'a 4. Pakiet R 2 / 26 TESTOWANIE ZAOE O PROPORCJONALNYM HAZARDZIE W MODELU COX'A 3 / 26 Model Cox'a Funkcja hazardu oparta na modelu Cox'a ma nast¦puj¡c¡ posta¢: λ(t, X) = λ0 (t) exp (β T X), gdzie λ0 (t) - hazard bazowy; X - wektor k zmiennych obja±niaj¡cych; βT - wektor nieznanych wspóªczynników. 4 / 26 Model Cox'a W modelu proporcjonalnego hazardu zakªada si¦, »e funkcja hazardu dla obserwacji w analizie zale»y jedynie od warto±ci zmiennych obja±niaj¡cych i hazardu bazowego. Dla dwóch obserwacji o ustalonych warto±ciach stosunek estymowanych warto±ci hazardu w czasie t b¦dzie staªy (model pro- porcjonalnego hazardu). 5 / 26 Model Cox'a - jedna zmienna binarna Zdeniujmy: h(t) = Je»eli X λ(t, X) = exp βx = hX . λ0 (t) jest zmienn¡ binarn¡ (przyjmuje dwie warto±ci 0 lub 1) to: HRF = h1 = h0 exp (βF ) exp (0) = exp (βF ). Przykªad: Mamy dwie grupy pacjentów chorych na raka trzustki. Jednej grupie jest podawane nowo testowane lekarstwo, a drugiej placebo. 0.6754 < HRF = 1 i oznacza to, »e pacjenci, którzy przyjmuj¡ nowo testowane lekarstwo maj¡ lepsze rokowania ni» pacjenci leczeni placebo. Dodatkowo βbF = −0.3925 i SE (βbF ) = 0.1159. Na tej podstawie mo»emy sprawdzi¢, czy parametr β jest statystycznie istotny tzn. testujemy hipotez¦ H0 : β = bF /SE (βbF ) = 3.3877. P 0 na przeciw H1 : β 6= 0 przy pomocy testu z = β warto±¢ wynosi 0.0007 co nie daje nam podstaw do odrzucenia H0 . 6 / 26 Model Cox'a - jedna zmienna ci¡gªa Je»eli X jest zmienn¡ ci¡gª¡ to: HRA = hX1 = hX2 exp (βA X1 ) exp (βA X2 ) = exp (βA (X1 − X2 )). Wzgl¦dny hazard zale»y w powy»szym przypadku tylko i wyª¡cznie od ró»nicy (X1 − X2 ). Przykªad: Mamy dwóch pacjentów chorych na raka trzustki w wieku 50 i 40 lat. Dla tych pacjentów funkcja wiemy, »e βbA = 0.0320 to HRA = HRA = 1.3771. exp βbA · (50 − 40) . Gdy Sugeruje to, »e starszy pacjent ma du»o wi¦ksze ryzyko ±mierci ni» pacjent mªodszy. Skoro pacjenci ró»ni¡ si¦ o 10 lat to 1.3771 = 1.03310 . 7 / 26 Model Cox'a Zaªó»my, »e istnieje wektor g (t), taki »e λ(t, X) = λ0 exp [β + g (t)]T X wtedy proporcja funkcji hazardu (hazard ratio) mo»e zmienia¢ si¦ w czasie. Aby sprawdzi¢ zaªo»enie o proporcjonalnym hazardzie trzeba sprawdzi¢, czy funkcja g (t) jest bliska zeru. 8 / 26 Model Cox'a Dla dwóch grup (np. osoby chore na raka trzustki poddane leczeniu A i B) zaªo»enie proporcjonalnego hazardu jest speªnione, gdy: λ0 exp β T X1 λ(t, X1 ) = = λ(t, X2 ) λ0 exp (β T X2 ) β T X1 = c. exp (β T X2 ) exp Czyli testowanie zaªo»enia o proporcjonalnym hazardzie mo»na sprowadzi¢ do porównania przeksztaªconych funkcji prze»ycia. 9 / 26 Model Cox'a Niech λ(t, Xi ) = λi (t) i ∈ {1, 2}. Wiemy, »e Z t Si (t) = exp − λi (s)ds . dla 0 Po dalszym przeksztaªceniu otrzymujemy: log (− log (Si (t))) = log λ0 exp β T Xi = log (λ0 ) + β T Xi . 10 / 26 Model Cox'a Wykorzystuj¡c zaªo»enie o proporcjonalnym hazardzie mamy: log (− log (S1 (t)))=log (λ0 ) + β T X1 =log (λ0 ) + β T X2 + log c = log (− log (S2 (t))) + log c. St¡d, gdy wykresy funkcji log (− log (S1 (t))) i log (− log (S2 (t))) s¡ przesuni¦te o staª¡ c to mo»emy uzna¢, »e zaªo»enie o proporcjonalnym hazardzie jest speªnione. 11 / 26 Model Cox'a 12 / 26 Model Cox'a 13 / 26 Model Cox'a Uwagi: Testowanie wizualne najlepiej sprawdza si¦ w przypadku dwóch warto±ci cechy u»ytej przy konstrukcji modelu. W przypadku cechy o wi¦kszej liczbie warto±ci lub cech o warto±ciach ci¡gªych metody gracznej si¦ nie stosuje. W wielu przypadkach wykres nie jest jednoznaczny. 14 / 26 Model Cox'a 15 / 26 Model Cox'a Residua Schoenfeld'a maj¡ posta¢: Xj exp βbT Xj , rbi = Xi − P bT j∈Ri exp β Xj P j∈Ri czyli b i |Ri ), rbi = Xi − E(X gdzie Ri = {j : tj < ti } - zbiór ryzyk βb - estymatory parametrów β . do czasu ti ; 16 / 26 Model Cox'a E(b ri ) ' Vi g (ti ), gdzie bT Xj β j∈Ri Vi = P + bT Xj exp β j∈Ri hP i hP iT bT Xj bT Xj X exp β X exp β j j j∈Ri j∈Ri − , P 2 bT Xj exp β j∈Ri P czyli Xj XjT exp Vi = E(Xi2 |Ri ) − E(Xi |Ri )2 . 17 / 26 Model Cox'a Je»eli zaªo»enie o proporcjonalnym hazardzie b¦dzie speªnione to: E(b ri ) ' 0, a wykres zale»no±ci rbi od czasu t b¦dzie poªo»ony blisko 0. 18 / 26 PAKIET R 19 / 26 Pakiet R 1 2 3 4 5 6 7 8 9 library(survival) data(stanford2) attach(stanford2) model=coxph(Surv(time,status)~age) res=residuals(model,''scaledsch'') times=as.numeric(names(residuals(model,"schoenfeld"))) plot(times,res,ylab="residua",xlab="czas") abline(0,0,lty=2) lines(smooth.spline(times,res),col="red") 20 / 26 Pakiet R 21 / 26 Pakiet R Graczne testowanie zaªo»e« o proporcjonalnym hazardzie sprowadza si¦ do badania, czy residua Schoenfelda znajduj¡ si¦ blisko 0. Przesªank¡ za uznaniem proporcjonalno±ci hazardu jest wykres gªadkiej funkcji (czerwona linia) przypominaj¡ca staª¡ prost¡ blisk¡ 0. 22 / 26 Pakiet R 1 2 test=cox.zph(coxph(Surv(time,status)~age+t5),global=T) plot(test) 23 / 26 Pakiet R 24 / 26 WYBÓR ZMIENNYCH DO MODELU COX'A 25 / 26 Bibliograa Wykªad opracowany na podstawie ksi¡»ki: Mahesh K. B. Parmer i David Machin Survival Analysis - A Practical Approach Burawska Marta i Kolankowski Marcin Model Cox'a. Testowanie zaªo»e« o proporcjonalnym hazardzie. 26 / 26