statystyczne modelowanie danych biologicznych

Transkrypt

statystyczne modelowanie danych biologicznych
STATYSTYCZNE MODELOWANIE DANYCH
BIOLOGICZNYCH
WYKŠAD 4
03 listopad 2014
1 / 26
Plan wykªadu
1. Testowanie zaªo»e« o proporcjonalnym hazardzie w modelu Cox'a
2. Wybór zmiennych do modelu Cox'a
4. Pakiet R
2 / 26
TESTOWANIE ZAŠO›E‹ O
PROPORCJONALNYM HAZARDZIE
W MODELU COX'A
3 / 26
Model Cox'a
Funkcja hazardu oparta na modelu Cox'a ma nast¦puj¡c¡ posta¢:
λ(t, X) = λ0 (t) exp (β T X),
gdzie
λ0 (t)
- hazard bazowy;
X - wektor k zmiennych obja±niaj¡cych;
βT
- wektor nieznanych wspóªczynników.
4 / 26
Model Cox'a
W modelu proporcjonalnego hazardu zakªada si¦, »e funkcja hazardu dla
obserwacji w analizie zale»y jedynie od warto±ci zmiennych obja±niaj¡cych
i hazardu bazowego. Dla dwóch obserwacji o ustalonych warto±ciach stosunek estymowanych warto±ci hazardu w czasie
t
b¦dzie staªy (model pro-
porcjonalnego hazardu).
5 / 26
Model Cox'a - jedna zmienna binarna
Zdeniujmy:
h(t) =
Je»eli
X
λ(t, X)
= exp βx = hX .
λ0 (t)
jest zmienn¡ binarn¡ (przyjmuje dwie warto±ci 0 lub 1) to:
HRF =
h1
=
h0
exp (βF )
exp (0)
= exp (βF ).
Przykªad: Mamy dwie grupy pacjentów chorych na raka trzustki. Jednej
grupie jest podawane nowo testowane lekarstwo, a drugiej placebo.
0.6754
<
HRF =
1 i oznacza to, »e pacjenci, którzy przyjmuj¡ nowo testowane
lekarstwo maj¡ lepsze rokowania ni» pacjenci leczeni placebo. Dodatkowo
βbF = −0.3925 i SE (βbF ) = 0.1159. Na tej podstawie mo»emy sprawdzi¢,
czy parametr β jest statystycznie istotny tzn. testujemy hipotez¦ H0 : β =
bF /SE (βbF ) = 3.3877. P
0 na przeciw H1 : β 6= 0 przy pomocy testu z = β
warto±¢ wynosi 0.0007 co nie daje nam podstaw do odrzucenia H0 .
6 / 26
Model Cox'a - jedna zmienna ci¡gªa
Je»eli
X
jest zmienn¡ ci¡gª¡ to:
HRA =
hX1
=
hX2
exp (βA X1 )
exp (βA X2 )
= exp (βA (X1 − X2 )).
Wzgl¦dny hazard zale»y w powy»szym przypadku tylko i wyª¡cznie od ró»nicy
(X1 − X2 ).
Przykªad: Mamy dwóch pacjentów chorych na raka trzustki w wieku 50
i 40 lat. Dla tych pacjentów funkcja
wiemy, »e
βbA = 0.0320
to
HRA =
HRA = 1.3771.
exp
βbA · (50 − 40)
. Gdy
Sugeruje to, »e starszy pacjent
ma du»o wi¦ksze ryzyko ±mierci ni» pacjent mªodszy. Skoro pacjenci ró»ni¡
si¦ o 10 lat to 1.3771
= 1.03310 .
7 / 26
Model Cox'a
Zaªó»my, »e istnieje wektor
g (t),
taki »e
λ(t, X) = λ0 exp [β + g (t)]T X
wtedy proporcja funkcji hazardu (hazard ratio) mo»e zmienia¢ si¦ w czasie.
Aby sprawdzi¢ zaªo»enie o proporcjonalnym hazardzie trzeba sprawdzi¢,
czy funkcja
g (t)
jest bliska zeru.
8 / 26
Model Cox'a
Dla dwóch grup (np. osoby chore na raka trzustki poddane leczeniu A i
B) zaªo»enie proporcjonalnego hazardu jest speªnione, gdy:
λ0 exp β T X1
λ(t, X1 )
=
=
λ(t, X2 )
λ0 exp (β T X2 )
β T X1
= c.
exp (β T X2 )
exp
Czyli testowanie zaªo»enia o proporcjonalnym hazardzie mo»na sprowadzi¢
do porównania przeksztaªconych funkcji prze»ycia.
9 / 26
Model Cox'a
Niech
λ(t, Xi ) = λi (t)
i ∈ {1, 2}. Wiemy, »e
Z t
Si (t) = exp −
λi (s)ds .
dla
0
Po dalszym przeksztaªceniu otrzymujemy:
log (− log (Si (t)))
= log λ0 exp β T Xi
= log (λ0 ) + β T Xi .
10 / 26
Model Cox'a
Wykorzystuj¡c zaªo»enie o proporcjonalnym hazardzie mamy:
log (− log (S1 (t)))=log (λ0 )
+ β T X1
=log (λ0 ) + β T X2 + log c = log (− log (S2 (t))) + log c.
St¡d, gdy wykresy funkcji log (− log (S1 (t))) i log (− log (S2 (t))) s¡ przesuni¦te o staª¡
c
to mo»emy uzna¢, »e zaªo»enie o proporcjonalnym hazardzie
jest speªnione.
11 / 26
Model Cox'a
12 / 26
Model Cox'a
13 / 26
Model Cox'a
Uwagi:
Testowanie wizualne najlepiej sprawdza si¦ w przypadku dwóch warto±ci cechy u»ytej przy konstrukcji modelu.
W przypadku cechy o wi¦kszej liczbie warto±ci lub cech o warto±ciach
ci¡gªych metody gracznej si¦ nie stosuje.
W wielu przypadkach wykres nie jest jednoznaczny.
14 / 26
Model Cox'a
15 / 26
Model Cox'a
Residua Schoenfeld'a maj¡ posta¢:
Xj exp βbT Xj
,
rbi = Xi − P
bT
j∈Ri exp β Xj
P
j∈Ri
czyli
b i |Ri ),
rbi = Xi − E(X
gdzie
Ri = {j : tj < ti } - zbiór ryzyk
βb - estymatory parametrów β .
do czasu
ti ;
16 / 26
Model Cox'a
E(b
ri ) ' Vi g (ti ),
gdzie
bT Xj
β
j∈Ri
Vi = P
+
bT Xj
exp
β
j∈Ri
hP
i hP
iT
bT Xj
bT Xj
X
exp
β
X
exp
β
j
j
j∈Ri
j∈Ri
−
,
P
2
bT Xj
exp
β
j∈Ri
P
czyli
Xj XjT
exp
Vi = E(Xi2 |Ri ) − E(Xi |Ri )2 .
17 / 26
Model Cox'a
Je»eli zaªo»enie o proporcjonalnym hazardzie b¦dzie speªnione to:
E(b
ri ) ' 0,
a wykres zale»no±ci
rbi
od czasu
t
b¦dzie poªo»ony blisko 0.
18 / 26
PAKIET R
19 / 26
Pakiet R
1
2
3
4
5
6
7
8
9
library(survival)
data(stanford2)
attach(stanford2)
model=coxph(Surv(time,status)~age)
res=residuals(model,''scaledsch'')
times=as.numeric(names(residuals(model,"schoenfeld")))
plot(times,res,ylab="residua",xlab="czas")
abline(0,0,lty=2)
lines(smooth.spline(times,res),col="red")
20 / 26
Pakiet R
21 / 26
Pakiet R
Graczne testowanie zaªo»e« o proporcjonalnym hazardzie sprowadza
si¦ do badania, czy residua Schoenfelda znajduj¡ si¦ blisko 0.
Przesªank¡ za uznaniem proporcjonalno±ci hazardu jest wykres gªadkiej funkcji (czerwona linia) przypominaj¡ca staª¡ prost¡ blisk¡ 0.
22 / 26
Pakiet R
1
2
test=cox.zph(coxph(Surv(time,status)~age+t5),global=T)
plot(test)
23 / 26
Pakiet R
24 / 26
WYBÓR ZMIENNYCH DO MODELU
COX'A
25 / 26
Bibliograa
Wykªad opracowany na podstawie ksi¡»ki:
Mahesh K. B. Parmer i David Machin Survival Analysis - A
Practical Approach
Burawska Marta i Kolankowski Marcin Model Cox'a. Testowanie
zaªo»e« o proporcjonalnym hazardzie.
26 / 26