Krzywe przeżycia - testowanie różnic

Transkrypt

Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Krzywe przeżycia - testowanie różnic
Wanda Niemyska, Robert Źrałek
5 listopada 2008
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Przypomnienie
Cel testowania
Podstawowe pojęcia
Badamy np.:
przeżywalność pacjentów po operacji;
długość trwania małżeństwa.
T – zmienna losowa oznaczająca czas do interesującego nas
zdarzenia (survival time).
Funkcja przeżycia: S(t) = P(T >= t) = 1–F (t−)
S(t) oznacza prawdopodobieństwo, że obiekt przeżyje do czasu t.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Przypomnienie
Cel testowania
Krzywe przeżycia
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na płeć biorcy
0.0
kobiety-biorcy
męŜczy?ni-biorcy
0
5
10
15
Czas obserwacji
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Przypomnienie
Cel testowania
Po co testujemy różnice krzywych przeżycia?
Szukamy odpowiedzi na pytania:
Czy dłużej żyją pacjenci poddani jednej terapii, czy drugiej?
Czy długość trwania małżeństwa zależy od statusu
majątkowego małżonków?
Czy procesy, w których adwokat jest wynajęty trwają dłużej
niż te, w których adwokat jest przydzielony?
Itd.
Szukamy czynników, które wpływają na przeżycie.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Testy dla danych niecenzorowanych
Brak obserwacji cenzorowanych ⇒ używamy standardowych
nieparametrycznych testów do porównania 2 funkcji przeżycia dla 2
grup.
GRUPY:
Niezależne: np. test serii, Wilcoxon-Mann-Whitney Test U;
Zależne: np. test znaków (Sign Test).
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Test serii
X1 , . . . , Xn – próba prosta z rozkładu o nieznanej dystrybuancie F1 ;
Y1 , . . . , Ym – próba prosta z rozkładu o nieznanej dystrybuancie F2 ;
Testujemy hipotezę H0 : F1 = F2 przeciw hipotezie alternatywnej H1 : F1 6= F2 .
Kolejne kroki:
ustawiamy obserwacje z obu grup w 1 niemalejący ciąg;
obserwacje z pierwszej grupy oznaczamy zerami, z drugiej – jedynkami;
(n+m)!
– liczba różnych ciągów składających się z n zer oraz m jedynek
n!m!
(wszystkie równie prawdopodobne, bo zakładamy, że
X1 , . . . , Xn, Y1 , . . . , Ym są nzal, o tym samym rozkładzie)
statystyka testowa: L = liczba serii w ciągu (L > 2), Np. dla ciągu
1100010111 L=5;
mała liczba serii = zdarzenie przemawiające przeciw hipotezie H0 .
Zbiór krytyczny W = [2, l(alfa, n, m)].
l(alfa, n, m) tak dobrane, aby P(L ∈ W ) 6 alfa (istnieją tablice tych wartości).
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Wilcoxon-Mann-Whitney Test U
ustawiamy obserwacje z obu grup w 1 niemalejący ciąg;
sumujemy pozycje w ciągu (rank) dla obserwacji z obu grup
(oddzielnie).
Mniejsza z otrzymanych liczb jest wartością statystyki testowej –
jeśli jest odpowiednio duża, hipotezę o równości dystrybuant
odrzucamy.
Test nie powinien być stosowany, gdy rozkłady w 2 grupach różnią
się bardzo – może wtedy wygenerować błędny wynik.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Sign Test
p = P(X > Y ), H0 : p =
1
2
mamy pary obserwacji (xi , yi ), i ∈ 1, . . . , n;
pary (xi , yi ), t.że xi = yi – odrzucamy. Zostaje m par;
w := #{(xi , yi ) : yi − xi > 0};
H0 jest prawdą > W ∼ b(m; 0, 5).
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Rodzaje testów
Niektóre ważne testy:
Log-rank test (najbardziej popularny test);
Breslow’s test;
Cox’s F test.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Log-rank
Analiza oparta jest na momentach, w których obserwujemy
zdarzenia. Dla każdej takiej chwili liczymy zaobserwowaną oraz
oczekiwaną liczbę zdarzeń w każdej grupie.
Niech j = 1, . . . , J – momenty, w których obserwujemy zdarzenia
(w dowolnej grupie),
N1j , N2j - liczby obserwowanych obiektów zagrożonych w j-tym
momencie w 1. i 2. grupie odpowiednio.
Nj := N1j + N2j
O1j , O2j – liczby zaobserwowanych zdarzeń w chwili j w obu
grupach
Oj := O1j + O2j
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Log-rank
Znając wartość Oj (łączna liczba zdarzeń w chwili j) i zakładając
prawdziwość hipotezy, Oj1 ma hipergeometryczny rozkład z
parametrami Nj , N1j , Oj :
expected value: Ej = Oj
variance: Vj =
Oj
N1j
N1
N1j
N1
N
(1− N1j )(Nj −Oj )
1
Nj −1
statystyka testowa: Z =
PJ
(O1j −Ej )
j=1
q
P
J
j=1
Vj
H prawdziwa ⇒ Z ∼ N(0, 1).
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Log-rank
Inna statystyka testowa:
Ot1 , Ot2 – są sumami obserwowanych zdarzeń we wszystkich
momentach w grupie 1. i 2. odpowiednio;
Et1 , Et2 – są sumami oczekiwanych zdarzeń we wszystkich
momentach w grupie 1. i 2. odpowiednio;
Statystyka testowa: S =
(Ot1 –Et1 )2
Et1
+
(Ot2 –Et2 )2
Et2
S ∼ χ2 z (liczba grup – 1) stopniami swobody.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Log-rank przykład
Porównujemy krzywe przeżycia dla pacjentów z powracającymi
guzami (recurrent malignant gliomas) różnego typu.
51 dorosłych pacjentów;
20 z guzami typu A = astrocytoma, 31 z guzami typu G =
glioblastoma;
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
...
A
6
13
21
30
31*
37
38
47*
49
50
63
79
80*
82*
82*
86
98
149*
Wanda Niemyska, Robert Źrałek
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
G
10
10
12
13
14
15
16
17
18
20
24
24
25
28
30
33
34*
35
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
1
2
3
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
Moment: j=1 w 6. Tygodniu
1
N1 = 51, O1 = 1 ⇒ prawd.smierci= 51
W grupie 1. N1,1 = 20, więc oczekiwana
W grupie 2. N2,1 = 31, więc oczekiwana
Moment: j=2 w 10. Tygodniu
2
N2 = 50, O2 = 2 ⇒ prawd.śmierci= 50
W grupie 1. N1,2 = 19, więc oczekiwana
W grupie 2. N2,2 = 31, więc oczekiwana
Itd.
liczba śmierci E1,1 = 20 ·
liczba śmierci E2,1 = 31 ·
1
.
51
1
.
51
liczba śmierci E1,2 = 19 ·
liczba śmierci E2,2 = 31 ·
1
.
25
1
.
25
Po zsumowaniu:
Ot1 = 14, Ot2 = 28
Et1 = 22.48, Et2 = 19.52
S=
(14−22.48)2
22.48
+
(28−19.52)2
19.52
= 6.88.
W tablicy rozkładu χ2 odnajdujemy P < 0.01, okazuje się więc, że różnica
między grupami jest statystycznie znacząca.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
log-rank – Breslow test
Breslow test:
V =
P
i
wi · (Oi –Ei )
wi — waga
Log-rank test: waga wszędzie jest jednakowa
Breslow test: wi = Ni (czyli wcześniejsze zdarzenia mają większą wagę)
Log-rank test lepszy, gdy:
Śmiertelność w obu grupach jest proporcjonalna – krzywe przeżycia nie
przecinają się (funkcje hazardu są paralelne)
Breslow test jest lepszy, gdy:
Śmiertelność w obu grupach nie jest proporcjonalna – krzywe przeżycia
przecinają się. Moc tego testu zmniejsza się, kiedy zwiększa się liczba
cenzorowanych obserwacji.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
log-rank – Breslow test
{tj : j = 1, 2, . . . , r } – zbiór wszystkich momentów wystąpienia zdarzenia (np.
śmierci obiektu);
Oj – liczba wystąpień zdarzenia w chwili tj ;
Nj – liczba obserwowanych obiektów zagrożonych w chwili tj ;
Cj – liczba ocenzorowanych obserwacji w okresie [tj , tj+1 );
wj – waga;
P
r
(Cj + Oj ) = Ni ;
j=i
Oja , Nja , Cja – analogicznie jak Oj , Nj , Cj tylko dla podgrupy a;
Statystyka Coxa-Mantela dla próbki a:
Va =
Pr
i=0
wi (Oia −
Oi Nia
)
Ni
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Pr
Va =
i=0
=
Pr
=
Pr
i=0
i=0
Va =
wi (Oia −
wi Oia −
(wi −
Oi Nia
)
Ni
Pr
i=0
=
j=0
wj Njj )Oia −
PNa
V , gdzie:
( j=0 ja P
i
Vja =
i=0
(Cia + Oia )
O
Pi
Pr
k
wi − k=0 wk O
Nk
Pi
Ok
− k=0 wk Nk
Testy dla danych niecenzorowanych
Testy dla danych cenzorowanych
Log-rank – test dla danych cenzorowanych
wi Oia −
O
w j
j=0 j Nj
i
r
( j=0
i=0
Pr
i=0
i
wi O
Ni
Pr
j=i
(Cja + Oja )
Pi
P
P
O
wj Njj )Cia
gdy wystąpiła obrerwacja Xja = ti ;
gdy Xja jest ocenzorowaną wartością;
log-rank
= 0, wi = 1
( – rhoP
i
k
gdy wystąpiła obrerwacja Xja = ti ;
1 − k=0 O
Pi OkNk
Vja =
− k=0 Nk
gdy Xja jest ocenzorowaną wartością;
Jeśli brak cenzorowania i remisów to: Ok = 1, Nk = N − k + 1.
Pi
Ok
k=0 Nk
=
Pi
1
k=0 N−k+1
=
PN
1
k=N−i+1 k
Wanda Niemyska, Robert Źrałek
N
≈ log ( N−i+1
)
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
Funkcja survdiff
Funkcja survdiff przeprowadza test na różnice między dwoma lub
większą liczbą krzywych przeżycia używając rodziny G − rho
testów lub wykazuje różnice krzywą doświadczalną a teoretyczną.
Funkcja survdiff implementuje rodzinę testów sparametryzowaną
współczynnikiem rho. Każda śmierć w próbce testowej jest
przemnożona przez S(t)rho , gdzie S(t) jest funkcją przeżycia.
Wartości szczególne rho:
rho = 0 – log-rank lub Mantel-Haenszel test;
rho = 1 – Peto & Peto test (modyfikacja testu
Gehana-Wilcoxona);
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
Składnia
Składnia:
> survdiff (formula, data, subset, na.action, rho = 0)
gdzie
formula – obiekt postaci Surv (time, status) ∼ predictors,
gdzie predictors jest cechą lub zbiorem cech dzielącym nam
obserwacje na podgrupy;
data – zbiór danych;
subset – wyrażenie określające które wiersze z danych
testowych mają zostać użyte w teście;
na.action – filtr brakujących danych;
rho – wartość określająca typ testu;
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
survdiff - przykład1
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane)
Call: survdiff(formula = Surv(dane$czas, dane$status) ∼ plec.biorcy, dane)
(O−E )2
)2
N Observed Expected (O−E
E
V
plec.biorcy=K 58
8
9.88
0.358
0.631
plec.biorcy=M 78
16
14.12
0.251
0.631
Chisq= 0.6 on 1 degrees of freedom, p= 0.427
Zmienne w tabeli oznaczają:
N – liczba osobników w grupie;
obs – liczba obserwacji w grupie (czasem z wagą różną od 1);
exp – oczekiwana wartość obserwacji (z wagą);
Chisq – statystyka Chi-kwadrat;
p – p-value;
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na płeć biorcy
0.0
kobiety-biorcy
męŜczy?ni-biorcy
0
5
10
15
Czas obserwacji
Call: survdiff(formula = Surv(dane$czas, dane$status) ∼ plec.biorcy, dane,
rho=1)
plec.biorcy=K
plec.biorcy=M
N
58
78
Observed
6.3
13.9
Expected
8.49
11.67
(O−E )2
E
(O−E )2
V
0.563
0.410
1.15
1.15
Chisq= 1.2 on 1 degrees of freedom, p= 0.283
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na wiek dawcy
0.0
wiek dawcy < 40
41 < wiek dawcy < 60
wiek dawcy > 61
0
5
10
15
Czas obserwacji
>dane$myvalue=round(dane$wiek.dawcy/20)*20
>survdiff(Surv(dane$czas, dane$status) ∼ myvalue, dane)
)2
(O−E )2
N Observed Expected (O−E
E
V
myvalue=20 31
5
8.47
1.422
2.288
myvalue=40 70
11
12.22
0.121
0.252
myvalue=60 35
8
3.31
6.631
8.102
Chisq= 8.7 on 2 degrees of freedom, p= 0.0131
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na plec dawcy i biorcy
0.0
plec.dawcy=K, plec.biorcy=K
plec.dawcy=K, plec.biorcy=M
plec.dawcy=M, plec.biorcy=K
plec.dawcy=M, plec.biorcy=M
0
5
10
15
Czas obserwacji
>survdiff(Surv(dane$czas, dane$status) ∼ plec.dawcy+plec.biorcy, dane)
)2
N Observed Expected (O−E
E
plec.dawcy=K, plec.biorcy=K
21
3
4.26
0.3728
plec.dawcy=K, plec.biorcy=M 34
11
7.07
2.1844
plec.dawcy=M, plec.biorcy=K 37
5
5.62
0.0685
plec.dawcy=M, plec.biorcy=M 44
5
7.05
0.5955
Chisq= 3.3 on 3 degrees of freedom, p= 0.345
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
(O−E )2
V
0.466
3.203
0.096
0.863
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 0)
)2
(O−E )2
N Observed Expected (O−E
E
V
plec.biorcy=K 58
8
9.88
0.358
0.631
plec.biorcy=M 78
16
14.12
0.251
0.631
Chisq= 0.6 on 1 degrees of freedom, p= 0.427
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 0.5)
)2
(O−E )2
N Observed Expected (O−E
E
V
plec.biorcy=K 58
7.06
9.12
0.467
0.896
plec.biorcy=M 78
14.84
12.77
0.334
0.896
Chisq= 0.9 on 1 degrees of freedom, p= 0.344
>survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 1)
)2
(O−E )2
N Observed Expected (O−E
E
V
plec.biorcy=K 58
6.3
8.49
0.563
1.15
plec.biorcy=M 78
13.9
11.67
0.410
1.15
Chisq= 1.2 on 1 degrees of freedom, p= 0.283
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
Zależność p-value od rho
0.263
0.260
0.261
0.262
p-value
0.264
0.265
ZaleŜność p-value od rho dla podziału względem plec.dawcy
0.0
0.2
0.4
Wanda Niemyska, Robert Źrałek
0.6
rho
0.8
1.0
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
RandomSurvivalForest importance
>plot(rsf(Survrsf(czas.obserwacji, status)∼., data = dane[,-6]))
0.60
wiek.dawcy
MDRD36m
plec.biorcy
MDRD60m
niezgodnosci.AB
plec.dawcy
wiek.biorcy
MDRD12m
0.50
Error Rate
0.55
wagastart
niezgodnosci.DR
MDRDend
MDRD30
wagaend
0.45
MDRD24m
MDRD6m
MDRD7
0
200
600
1000
Number of Trees
Wanda Niemyska, Robert Źrałek
-0.02
0.02
0.06
Importance
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
left daughter
2.00
4.00
0.00
6.00
8.00
10.00
12.00
0.00
0.00
14.00
16.00
18.00
20.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
22.00
0.00
0.00
right daughter
3.00
5.00
0.00
7.00
9.00
11.00
13.00
0.00
0.00
15.00
17.00
19.00
21.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
23.00
0.00
0.00
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
split var
MDRD7
MDRD36m
MDRD36m
wiek.dawcy
MDRDend
wiek.biorcy
wiek.biorcy
MDRD36m
MDRD12m
wiek.dawcy
plec.dawcy
Wanda Niemyska, Robert Źrałek
split point
67.50
57.50
0.00
50.50
17.50
22.00
42.50
0.00
0.00
40.00
29.00
58.00
43.50
0.00
0.00
0.00
0.00
0.00
0.00
0.00
2.00
0.00
0.00
status
-3.00
-3.00
-1.00
-3.00
-3.00
-3.00
-3.00
-1.00
-1.00
-3.00
-3.00
-3.00
-3.00
-1.00
-1.00
-1.00
-1.00
-1.00
-1.00
-1.00
-3.00
-1.00
-1.00
prediction
0.15
0.14
1.00
0.21
0.02
0.09
0.38
1.00
0.00
0.50
0.02
0.07
0.57
1.00
0.00
1.00
0.00
0.00
1.00
0.00
0.87
0.33
1.00
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na wiek.dawcy
0.0
wiek.dawcy < 43.5
wiek.dawcy >= 43.5
0
5
10
15
Czas obserwacji
>dane$myvalue=dane$wiek.dawcy>= 43.5
>survdiff(Surv(dane$czas.obserwacji, dane$status) ∼ myvalue, data = dane)
)2
(O−E )2
N Observed Expected (O−E
E
V
myvalue=FALSE 70
10
17.19
3.01
11.9
myvalue=TRUE 66
14
6.81
7.59
11.9
Chisq= 11.9 on 1 degrees of freedom, p= 0.000574
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na MDRD36m
0.0
MDRD36m <= 40
MDRD36m > 40
0
5
10
15
Czas obserwacji
>dane$myvalue=round(dane$MDRD36m/40)*40
>survdiff(Surv(dane$czas.obserwacji, dane$status) ∼ myvalue, data = dane)
)2
(O−E )2
N Observed Expected (O−E
E
V
myvalue=40 88
18
12.6
2.36
5.22
myvalue=80 48
6
11.4
2.59
5.22
Chisq= 5.2 on 1 degrees of freedom, p= 0.0223
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Funkcja survdiff
Współczynnik rho
RandomSurvivalForest
0.2
0.4
S(t)
0.6
0.8
1.0
Krzywe przeŜycia z podziałem ze względu na MDRD7
0.0
MDRD7 <= median
MDRD7 > median
0
5
10
15
Czas obserwacji
>dane$myvalue=dane$MDRD7<=median(dane$MDRD7)
>survdiff(Surv(dane$czas.obserwacji, dane$status) ∼ myvalue, data = dane)
)2
(O−E )2
N Observed Expected (O−E
E
V
myvalue=FALSE 68
12
11.1
0.0792
0.153
myvalue=TRUE 68
12
12.9
0.0678
0.153
Chisq= 0.2 on 1 degrees of freedom, p= 0.696
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Bibliografia
Stevenson, M., 2007, An Introduction to Survival Analysis.
IVABS, s. 15–16.
Therneau, T.M., Foundation, M., 1999, A package for Survival
Analysis in S. s. 14–16.
Jones, M.P, Crowley, J., 1989, A General Class of
Nonparametric Tests for Survival Analysis. Biometrics, Vol. 45,
No. 1, s. 157–170.
Harrington, D.P., Fleming, T.R., 1982, A Class of Rank Test
Procedures for Censored Survival Data. Biometrika, Vol. 69,
No. 3, s. 553–566.
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic
Wprowadzenie
Rodzaje testów
Analiza przeżycia w środowisku R
Koniec
Koniec!
Dziękujemy za uwagę!
Wanda Niemyska, Robert Źrałek
Krzywe przeżycia - testowanie różnic