Krzywe przeżycia - testowanie różnic

Transkrypt

Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Wanda Niemyska, Robert Źrałek
5 listopada 2008
Wprowadzenie
Rodzaje testów
Koniec
Przypomnienie
Cel testowania
Podstawowe pojęcia
Badamy np.:
przeżywalność pacjentów po operacji;
długość trwania małżeństwa.
T – zmienna losowa oznaczająca czas do interesującego nas
zdarzenia (survival time).
Funkcja przeżycia: S(t) = P(T >= t) = 1–F (t−)
S(t) oznacza prawdopodobieństwo, że obiekt przeżyje do czasu t.
Wprowadzenie
Rodzaje testów
Koniec
Przypomnienie
Cel testowania
Krzywe przeżycia
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na płeć biorcy
0.0
kobiety-biorcy
męŜczy?ni-biorcy
0
5
10
15
Czas obserwacji
Wprowadzenie
Rodzaje testów
Koniec
Przypomnienie
Cel testowania
Po co testujemy różnice krzywych przeżycia?
Szukamy odpowiedzi na pytania:
Czy dłużej żyją pacjenci poddani jednej terapii, czy drugiej?
Czy długość trwania małżeństwa zależy od statusu
majątkowego małżonków?
Czy procesy, w których adwokat jest wynajęty trwają dłużej
niż te, w których adwokat jest przydzielony?
Itd.
Szukamy czynników, które wpływają na przeżycie.
Wprowadzenie
Rodzaje testów
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Brak obserwacji cenzorowanych ⇒ używamy standardowych
nieparametrycznych testów do porównania 2 funkcji przeżycia dla 2
grup.
GRUPY:
Niezależne: np. test serii, Wilcoxon-Mann-Whitney Test U;
Zależne: np. test znaków (Sign Test).
Wprowadzenie
Rodzaje testów
Koniec
Test serii
X1 , . . . , Xn – próba prosta z rozkładu o nieznanej dystrybuancie F1 ;
Y1 , . . . , Ym – próba prosta z rozkładu o nieznanej dystrybuancie F2 ;
Testujemy hipotezę H0 : F1 = F2 przeciw hipotezie alternatywnej H1 : F1 6= F2 .
Kolejne kroki:
ustawiamy obserwacje z obu grup w 1 niemalejący ciąg;
obserwacje z pierwszej grupy oznaczamy zerami, z drugiej – jedynkami;
(n+m)!
– liczba różnych ciągów składających się z n zer oraz m jedynek
n!m!
(wszystkie równie prawdopodobne, bo zakładamy, że
X1 , . . . , Xn, Y1 , . . . , Ym są nzal, o tym samym rozkładzie)
statystyka testowa: L = liczba serii w ciągu (L > 2), Np. dla ciągu
1100010111 L=5;
mała liczba serii = zdarzenie przemawiające przeciw hipotezie H0 .
Zbiór krytyczny W = [2, l(alfa, n, m)].
l(alfa, n, m) tak dobrane, aby P(L ∈ W ) 6 alfa (istnieją tablice tych wartości).
Wprowadzenie
Rodzaje testów
Koniec
Wilcoxon-Mann-Whitney Test U
ustawiamy obserwacje z obu grup w 1 niemalejący ciąg;
sumujemy pozycje w ciągu (rank) dla obserwacji z obu grup
(oddzielnie).
Mniejsza z otrzymanych liczb jest wartością statystyki testowej –
jeśli jest odpowiednio duża, hipotezę o równości dystrybuant
odrzucamy.
Test nie powinien być stosowany, gdy rozkłady w 2 grupach różnią
się bardzo – może wtedy wygenerować błędny wynik.
Wprowadzenie
Rodzaje testów
Koniec
Sign Test
p = P(X > Y ), H0 : p =
1
2
mamy pary obserwacji (xi , yi ), i ∈ 1, . . . , n;
pary (xi , yi ), t.że xi = yi – odrzucamy. Zostaje m par;
w := #{(xi , yi ) : yi − xi > 0};
H0 jest prawdą > W ∼ b(m; 0, 5).
Wprowadzenie
Rodzaje testów
Koniec
Rodzaje testów
Niektóre ważne testy:
Log-rank test (najbardziej popularny test);
Breslow’s test;
Cox’s F test.
Wprowadzenie
Rodzaje testów
Koniec
Log-rank
Analiza oparta jest na momentach, w których obserwujemy
zdarzenia. Dla każdej takiej chwili liczymy zaobserwowaną oraz
oczekiwaną liczbę zdarzeń w każdej grupie.
Niech j = 1, . . . , J – momenty, w których obserwujemy zdarzenia
(w dowolnej grupie),
N1j , N2j - liczby obserwowanych obiektów zagrożonych w j-tym
momencie w 1. i 2. grupie odpowiednio.
Nj := N1j + N2j
O1j , O2j – liczby zaobserwowanych zdarzeń w chwili j w obu
grupach
Oj := O1j + O2j
Wprowadzenie
Rodzaje testów
Koniec
Log-rank
Znając wartość Oj (łączna liczba zdarzeń w chwili j) i zakładając
prawdziwość hipotezy, Oj1 ma hipergeometryczny rozkład z
parametrami Nj , N1j , Oj :
expected value: Ej = Oj
variance: Vj =
Oj
N1j
N1
N1j
N1
N
(1− N1j )(Nj −Oj )
1
Nj −1
statystyka testowa: Z =
PJ
(O1j −Ej )
j=1
q
P
J
j=1
Vj
H prawdziwa ⇒ Z ∼ N(0, 1).
Wprowadzenie
Rodzaje testów
Koniec
Log-rank
Inna statystyka testowa:
Ot1 , Ot2 – są sumami obserwowanych zdarzeń we wszystkich
momentach w grupie 1. i 2. odpowiednio;
Et1 , Et2 – są sumami oczekiwanych zdarzeń we wszystkich
momentach w grupie 1. i 2. odpowiednio;
Statystyka testowa: S =
(Ot1 –Et1 )2
Et1
+
(Ot2 –Et2 )2
Et2
S ∼ χ2 z (liczba grup – 1) stopniami swobody.
Wprowadzenie
Rodzaje testów
Koniec
Log-rank przykład
Porównujemy krzywe przeżycia dla pacjentów z powracającymi
guzami (recurrent malignant gliomas) różnego typu.
51 dorosłych pacjentów;
20 z guzami typu A = astrocytoma, 31 z guzami typu G =
glioblastoma;
Wprowadzenie
Rodzaje testów
Koniec
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
...
A
6
13
21
30
31*
37
38
47*
49
50
63
79
80*
82*
82*
86
98
149*
G
10
10
12
13
14
15
16
17
18
20
24
24
25
28
30
33
34*
35
Wprowadzenie
Rodzaje testów
Koniec
1
2
3
Moment: j=1 w 6. Tygodniu
1
N1 = 51, O1 = 1 ⇒ prawd.smierci= 51
W grupie 1. N1,1 = 20, więc oczekiwana
Moment: j=2 w 10. Tygodniu
2
N2 = 50, O2 = 2 ⇒ prawd.śmierci= 50
Itd.
liczba śmierci E1,1 = 20 ·
1
.
51
1
.
51
1
.
25
1
.
25
Po zsumowaniu:
Ot1 = 14, Ot2 = 28
Et1 = 22.48, Et2 = 19.52
S=
(14−22.48)2
22.48
+
(28−19.52)2
19.52
= 6.88.
W tablicy rozkładu χ2 odnajdujemy P < 0.01, okazuje się więc, że różnica
między grupami jest statystycznie znacząca.
Wprowadzenie
Rodzaje testów
Koniec
log-rank – Breslow test
Breslow test:
V =
P
i
wi · (Oi –Ei )
wi — waga
Log-rank test: waga wszędzie jest jednakowa
Breslow test: wi = Ni (czyli wcześniejsze zdarzenia mają większą wagę)
Log-rank test lepszy, gdy:
Śmiertelność w obu grupach jest proporcjonalna – krzywe przeżycia nie
przecinają się (funkcje hazardu są paralelne)
Breslow test jest lepszy, gdy:
Śmiertelność w obu grupach nie jest proporcjonalna – krzywe przeżycia
przecinają się. Moc tego testu zmniejsza się, kiedy zwiększa się liczba
cenzorowanych obserwacji.
Wprowadzenie
Rodzaje testów
Koniec
log-rank – Breslow test
{tj : j = 1, 2, . . . , r } – zbiór wszystkich momentów wystąpienia zdarzenia (np.
śmierci obiektu);
Oj – liczba wystąpień zdarzenia w chwili tj ;
Nj – liczba obserwowanych obiektów zagrożonych w chwili tj ;
Cj – liczba ocenzorowanych obserwacji w okresie [tj , tj+1 );
wj – waga;
P
r
(Cj + Oj ) = Ni ;
j=i
Oja , Nja , Cja – analogicznie jak Oj , Nj , Cj tylko dla podgrupy a;
Statystyka Coxa-Mantela dla próbki a:
Va =
Pr
i=0
wi (Oia −
Oi Nia
)
Ni
Wprowadzenie
Rodzaje testów
Koniec
Pr
Va =
i=0
=
Pr
=
Pr
i=0
i=0
Va =
wi (Oia −
wi Oia −
(wi −
Oi Nia
)
Ni
Pr
i=0
=
j=0
wj Njj )Oia −
PNa
V , gdzie:
( j=0 ja P
i
Vja =
i=0
(Cia + Oia )
O
Pi
Pr
k
wi − k=0 wk O
Nk
Pi
Ok
− k=0 wk Nk
wi Oia −
O
w j
j=0 j Nj
i
r
( j=0
i=0
Pr
i=0
i
wi O
Ni
Pr
j=i
(Cja + Oja )
Pi
P
P
O
wj Njj )Cia
gdy wystąpiła obrerwacja Xja = ti ;
gdy Xja jest ocenzorowaną wartością;
log-rank
= 0, wi = 1
( – rhoP
i
k
gdy wystąpiła obrerwacja Xja = ti ;
1 − k=0 O
Pi OkNk
Vja =
− k=0 Nk
gdy Xja jest ocenzorowaną wartością;
Jeśli brak cenzorowania i remisów to: Ok = 1, Nk = N − k + 1.
Pi
Ok
k=0 Nk
=
Pi
1
k=0 N−k+1
=
PN
1
k=N−i+1 k
N
≈ log ( N−i+1
)
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
Funkcja survdiff
Funkcja survdiff przeprowadza test na różnice między dwoma lub
większą liczbą krzywych przeżycia używając rodziny G − rho
testów lub wykazuje różnice krzywą doświadczalną a teoretyczną.
Funkcja survdiff implementuje rodzinę testów sparametryzowaną
współczynnikiem rho. Każda śmierć w próbce testowej jest
przemnożona przez S(t)rho , gdzie S(t) jest funkcją przeżycia.
Wartości szczególne rho:
rho = 0 – log-rank lub Mantel-Haenszel test;
rho = 1 – Peto & Peto test (modyfikacja testu
Gehana-Wilcoxona);
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
Składnia
Składnia:
> survdiff (formula, data, subset, na.action, rho = 0)
gdzie
formula – obiekt postaci Surv (time, status) ∼ predictors,
gdzie predictors jest cechą lub zbiorem cech dzielącym nam
obserwacje na podgrupy;
data – zbiór danych;
subset – wyrażenie określające które wiersze z danych
testowych mają zostać użyte w teście;
na.action – filtr brakujących danych;
rho – wartość określająca typ testu;
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
survdiff - przykład1
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane)
Call: survdiff(formula = Surv(dane$czas, dane$status) ∼ plec.biorcy, dane)
(O−E )2
)2
N Observed Expected (O−E
E
V
plec.biorcy=K 58
8
9.88
0.358
0.631
plec.biorcy=M 78
16
14.12
0.251
0.631
Chisq= 0.6 on 1 degrees of freedom, p= 0.427
Zmienne w tabeli oznaczają:
N – liczba osobników w grupie;
obs – liczba obserwacji w grupie (czasem z wagą różną od 1);
exp – oczekiwana wartość obserwacji (z wagą);
Chisq – statystyka Chi-kwadrat;
p – p-value;
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na płeć biorcy
0.0
kobiety-biorcy
męŜczy?ni-biorcy
0
5
10
15
Czas obserwacji
Call: survdiff(formula = Surv(dane$czas, dane$status) ∼ plec.biorcy, dane,
rho=1)
plec.biorcy=K
plec.biorcy=M
N
58
78
Observed
6.3
13.9
Expected
8.49
11.67
(O−E )2
E
(O−E )2
V
0.563
0.410
1.15
1.15
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na wiek dawcy
0.0
wiek dawcy < 40
41 < wiek dawcy < 60
wiek dawcy > 61
0
5
10
15
Czas obserwacji
>dane$myvalue=round(dane$wiek.dawcy/20)*20
>survdiff(Surv(dane$czas, dane$status) ∼ myvalue, dane)
)2
(O−E )2
E
V
myvalue=20 31
5
8.47
1.422
2.288
myvalue=40 70
11
12.22
0.121
0.252
myvalue=60 35
8
3.31
6.631
8.102
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na plec dawcy i biorcy
0.0
plec.dawcy=K, plec.biorcy=K
plec.dawcy=K, plec.biorcy=M
plec.dawcy=M, plec.biorcy=K
plec.dawcy=M, plec.biorcy=M
0
5
10
15
Czas obserwacji
>survdiff(Surv(dane$czas, dane$status) ∼ plec.dawcy+plec.biorcy, dane)
)2
E
plec.dawcy=K, plec.biorcy=K
21
3
4.26
0.3728
plec.dawcy=K, plec.biorcy=M 34
11
7.07
2.1844
plec.dawcy=M, plec.biorcy=K 37
5
5.62
0.0685
plec.dawcy=M, plec.biorcy=M 44
5
7.05
0.5955
(O−E )2
V
0.466
3.203
0.096
0.863
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 0)
)2
(O−E )2
E
V
plec.biorcy=K 58
8
9.88
0.358
0.631
plec.biorcy=M 78
16
14.12
0.251
0.631
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 0.5)
)2
(O−E )2
E
V
plec.biorcy=K 58
7.06
9.12
0.467
0.896
plec.biorcy=M 78
14.84
12.77
0.334
0.896
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 1)
)2
(O−E )2
E
V
plec.biorcy=K 58
6.3
8.49
0.563
1.15
plec.biorcy=M 78
13.9
11.67
0.410
1.15
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
Zależność p-value od rho
0.263
0.260
0.261
0.262
p-value
0.264
0.265
ZaleŜność p-value od rho dla podziału względem plec.dawcy
0.0
0.2
0.4
0.6
rho
0.8
1.0
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest importance
>plot(rsf(Survrsf(czas.obserwacji, status)∼., data = dane[,-6]))
0.60
wiek.dawcy
MDRD36m
plec.biorcy
MDRD60m
niezgodnosci.AB
plec.dawcy
wiek.biorcy
MDRD12m
0.50
Error Rate
0.55
wagastart
niezgodnosci.DR
MDRDend
MDRD30
wagaend
0.45
MDRD24m
MDRD6m
MDRD7
0
200
600
1000
Number of Trees
-0.02
0.02
0.06
Importance
Wprowadzenie
Rodzaje testów
Koniec
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
left daughter
2.00
4.00
0.00
6.00
8.00
10.00
12.00
0.00
0.00
14.00
16.00
18.00
20.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
22.00
0.00
0.00
right daughter
3.00
5.00
0.00
7.00
9.00
11.00
13.00
0.00
0.00
15.00
17.00
19.00
21.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
23.00
0.00
0.00
Funkcja survdiff
Współczynnik rho
split var
MDRD7
MDRD36m
MDRD36m
wiek.dawcy
MDRDend
wiek.biorcy
wiek.biorcy
MDRD36m
MDRD12m
wiek.dawcy
plec.dawcy
split point
67.50
57.50
0.00
50.50
17.50
22.00
42.50
0.00
0.00
40.00
29.00
58.00
43.50
0.00
0.00
0.00
0.00
0.00
0.00
0.00
2.00
0.00
0.00
status
-3.00
-3.00
-1.00
-3.00
-3.00
-3.00
-3.00
-1.00
-1.00
-3.00
-3.00
-3.00
-3.00
-1.00
-1.00
-1.00
-1.00
-1.00
-1.00
-1.00
-3.00
-1.00
-1.00
prediction
0.15
0.14
1.00
0.21
0.02
0.09
0.38
1.00
0.00
0.50
0.02
0.07
0.57
1.00
0.00
1.00
0.00
0.00
1.00
0.00
0.87
0.33
1.00
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na wiek.dawcy
0.0
wiek.dawcy < 43.5
wiek.dawcy >= 43.5
0
5
10
15
Czas obserwacji
>dane$myvalue=dane$wiek.dawcy>= 43.5
>survdiff(Surv(dane$czas.obserwacji, dane$status) ∼ myvalue, data = dane)
)2
(O−E )2
E
V
myvalue=FALSE 70
10
17.19
3.01
11.9
myvalue=TRUE 66
14
6.81
7.59
11.9
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na MDRD36m
0.0
MDRD36m <= 40
MDRD36m > 40
0
5
10
15
Czas obserwacji
>dane$myvalue=round(dane$MDRD36m/40)*40
)2
(O−E )2
E
V
myvalue=40 88
18
12.6
2.36
5.22
myvalue=80 48
6
11.4
2.59
5.22
Wprowadzenie
Rodzaje testów
Koniec
Funkcja survdiff
Współczynnik rho
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na MDRD7
0.0
MDRD7 <= median
MDRD7 > median
0
5
10
15
Czas obserwacji
>dane$myvalue=dane$MDRD7<=median(dane$MDRD7)
)2
(O−E )2
E
V
myvalue=FALSE 68
12
11.1
0.0792
0.153
myvalue=TRUE 68
12
12.9
0.0678
0.153
Wprowadzenie
Rodzaje testów
Koniec
Bibliografia
Stevenson, M., 2007, An Introduction to Survival Analysis.
IVABS, s. 15–16.
Therneau, T.M., Foundation, M., 1999, A package for Survival
Analysis in S. s. 14–16.
Jones, M.P, Crowley, J., 1989, A General Class of
Nonparametric Tests for Survival Analysis. Biometrics, Vol. 45,
No. 1, s. 157–170.
Harrington, D.P., Fleming, T.R., 1982, A Class of Rank Test
Procedures for Censored Survival Data. Biometrika, Vol. 69,
No. 3, s. 553–566.
Wprowadzenie
Rodzaje testów
Koniec
Koniec!
Dziękujemy za uwagę!

Krzywe przeżycia - testowanie różnic

Transkrypt

Podobne dokumenty

Wypożyczalnia rowerów

Analiza przeżycia

Jak długo prze yjemy w razie katastrofy, czyli na ile wystarczyłyby

Sieroty są wśród nas

Wytrzewienie Kiedy i jak leczyć ?

Zlecenie na identyfikację przeciwciała do Pracowni Badań

W służbie Marsa i Hestii, Stanisław. Grodziski

AB - Śląskie Centrum Chorób Serca w Zabrzu

Znaczenie twórczej aktywności plastycznej w rozwoju dziecka.