Krzywe przeżycia - testowanie różnic
Transkrypt
Krzywe przeżycia - testowanie różnic
Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Krzywe przeżycia - testowanie różnic Wanda Niemyska, Robert Źrałek 5 listopada 2008 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Przypomnienie Cel testowania Podstawowe pojęcia Badamy np.: przeżywalność pacjentów po operacji; długość trwania małżeństwa. T – zmienna losowa oznaczająca czas do interesującego nas zdarzenia (survival time). Funkcja przeżycia: S(t) = P(T >= t) = 1–F (t−) S(t) oznacza prawdopodobieństwo, że obiekt przeżyje do czasu t. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Przypomnienie Cel testowania Krzywe przeżycia 0.2 0.4 S(t) 0.6 0.8 1.0 Krzywe przeŜycia z podziałem ze względu na płeć biorcy 0.0 kobiety-biorcy męŜczy?ni-biorcy 0 5 10 15 Czas obserwacji Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Przypomnienie Cel testowania Po co testujemy różnice krzywych przeżycia? Szukamy odpowiedzi na pytania: Czy dłużej żyją pacjenci poddani jednej terapii, czy drugiej? Czy długość trwania małżeństwa zależy od statusu majątkowego małżonków? Czy procesy, w których adwokat jest wynajęty trwają dłużej niż te, w których adwokat jest przydzielony? Itd. Szukamy czynników, które wpływają na przeżycie. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Testy dla danych niecenzorowanych Brak obserwacji cenzorowanych ⇒ używamy standardowych nieparametrycznych testów do porównania 2 funkcji przeżycia dla 2 grup. GRUPY: Niezależne: np. test serii, Wilcoxon-Mann-Whitney Test U; Zależne: np. test znaków (Sign Test). Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Test serii X1 , . . . , Xn – próba prosta z rozkładu o nieznanej dystrybuancie F1 ; Y1 , . . . , Ym – próba prosta z rozkładu o nieznanej dystrybuancie F2 ; Testujemy hipotezę H0 : F1 = F2 przeciw hipotezie alternatywnej H1 : F1 6= F2 . Kolejne kroki: ustawiamy obserwacje z obu grup w 1 niemalejący ciąg; obserwacje z pierwszej grupy oznaczamy zerami, z drugiej – jedynkami; (n+m)! – liczba różnych ciągów składających się z n zer oraz m jedynek n!m! (wszystkie równie prawdopodobne, bo zakładamy, że X1 , . . . , Xn, Y1 , . . . , Ym są nzal, o tym samym rozkładzie) statystyka testowa: L = liczba serii w ciągu (L > 2), Np. dla ciągu 1100010111 L=5; mała liczba serii = zdarzenie przemawiające przeciw hipotezie H0 . Zbiór krytyczny W = [2, l(alfa, n, m)]. l(alfa, n, m) tak dobrane, aby P(L ∈ W ) 6 alfa (istnieją tablice tych wartości). Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Wilcoxon-Mann-Whitney Test U ustawiamy obserwacje z obu grup w 1 niemalejący ciąg; sumujemy pozycje w ciągu (rank) dla obserwacji z obu grup (oddzielnie). Mniejsza z otrzymanych liczb jest wartością statystyki testowej – jeśli jest odpowiednio duża, hipotezę o równości dystrybuant odrzucamy. Test nie powinien być stosowany, gdy rozkłady w 2 grupach różnią się bardzo – może wtedy wygenerować błędny wynik. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Sign Test p = P(X > Y ), H0 : p = 1 2 mamy pary obserwacji (xi , yi ), i ∈ 1, . . . , n; pary (xi , yi ), t.że xi = yi – odrzucamy. Zostaje m par; w := #{(xi , yi ) : yi − xi > 0}; H0 jest prawdą > W ∼ b(m; 0, 5). Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Rodzaje testów Niektóre ważne testy: Log-rank test (najbardziej popularny test); Breslow’s test; Cox’s F test. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Log-rank Analiza oparta jest na momentach, w których obserwujemy zdarzenia. Dla każdej takiej chwili liczymy zaobserwowaną oraz oczekiwaną liczbę zdarzeń w każdej grupie. Niech j = 1, . . . , J – momenty, w których obserwujemy zdarzenia (w dowolnej grupie), N1j , N2j - liczby obserwowanych obiektów zagrożonych w j-tym momencie w 1. i 2. grupie odpowiednio. Nj := N1j + N2j O1j , O2j – liczby zaobserwowanych zdarzeń w chwili j w obu grupach Oj := O1j + O2j Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Log-rank Znając wartość Oj (łączna liczba zdarzeń w chwili j) i zakładając prawdziwość hipotezy, Oj1 ma hipergeometryczny rozkład z parametrami Nj , N1j , Oj : expected value: Ej = Oj variance: Vj = Oj N1j N1 N1j N1 N (1− N1j )(Nj −Oj ) 1 Nj −1 statystyka testowa: Z = PJ (O1j −Ej ) j=1 q P J j=1 Vj H prawdziwa ⇒ Z ∼ N(0, 1). Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Log-rank Inna statystyka testowa: Ot1 , Ot2 – są sumami obserwowanych zdarzeń we wszystkich momentach w grupie 1. i 2. odpowiednio; Et1 , Et2 – są sumami oczekiwanych zdarzeń we wszystkich momentach w grupie 1. i 2. odpowiednio; Statystyka testowa: S = (Ot1 –Et1 )2 Et1 + (Ot2 –Et2 )2 Et2 S ∼ χ2 z (liczba grup – 1) stopniami swobody. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Log-rank przykład Porównujemy krzywe przeżycia dla pacjentów z powracającymi guzami (recurrent malignant gliomas) różnego typu. 51 dorosłych pacjentów; 20 z guzami typu A = astrocytoma, 31 z guzami typu G = glioblastoma; Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ... A 6 13 21 30 31* 37 38 47* 49 50 63 79 80* 82* 82* 86 98 149* Wanda Niemyska, Robert Źrałek Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych G 10 10 12 13 14 15 16 17 18 20 24 24 25 28 30 33 34* 35 Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec 1 2 3 Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych Moment: j=1 w 6. Tygodniu 1 N1 = 51, O1 = 1 ⇒ prawd.smierci= 51 W grupie 1. N1,1 = 20, więc oczekiwana W grupie 2. N2,1 = 31, więc oczekiwana Moment: j=2 w 10. Tygodniu 2 N2 = 50, O2 = 2 ⇒ prawd.śmierci= 50 W grupie 1. N1,2 = 19, więc oczekiwana W grupie 2. N2,2 = 31, więc oczekiwana Itd. liczba śmierci E1,1 = 20 · liczba śmierci E2,1 = 31 · 1 . 51 1 . 51 liczba śmierci E1,2 = 19 · liczba śmierci E2,2 = 31 · 1 . 25 1 . 25 Po zsumowaniu: Ot1 = 14, Ot2 = 28 Et1 = 22.48, Et2 = 19.52 S= (14−22.48)2 22.48 + (28−19.52)2 19.52 = 6.88. W tablicy rozkładu χ2 odnajdujemy P < 0.01, okazuje się więc, że różnica między grupami jest statystycznie znacząca. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych log-rank – Breslow test Breslow test: V = P i wi · (Oi –Ei ) wi — waga Log-rank test: waga wszędzie jest jednakowa Breslow test: wi = Ni (czyli wcześniejsze zdarzenia mają większą wagę) Log-rank test lepszy, gdy: Śmiertelność w obu grupach jest proporcjonalna – krzywe przeżycia nie przecinają się (funkcje hazardu są paralelne) Breslow test jest lepszy, gdy: Śmiertelność w obu grupach nie jest proporcjonalna – krzywe przeżycia przecinają się. Moc tego testu zmniejsza się, kiedy zwiększa się liczba cenzorowanych obserwacji. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych log-rank – Breslow test {tj : j = 1, 2, . . . , r } – zbiór wszystkich momentów wystąpienia zdarzenia (np. śmierci obiektu); Oj – liczba wystąpień zdarzenia w chwili tj ; Nj – liczba obserwowanych obiektów zagrożonych w chwili tj ; Cj – liczba ocenzorowanych obserwacji w okresie [tj , tj+1 ); wj – waga; P r (Cj + Oj ) = Ni ; j=i Oja , Nja , Cja – analogicznie jak Oj , Nj , Cj tylko dla podgrupy a; Statystyka Coxa-Mantela dla próbki a: Va = Pr i=0 wi (Oia − Oi Nia ) Ni Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Pr Va = i=0 = Pr = Pr i=0 i=0 Va = wi (Oia − wi Oia − (wi − Oi Nia ) Ni Pr i=0 = j=0 wj Njj )Oia − PNa V , gdzie: ( j=0 ja P i Vja = i=0 (Cia + Oia ) O Pi Pr k wi − k=0 wk O Nk Pi Ok − k=0 wk Nk Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank – test dla danych cenzorowanych wi Oia − O w j j=0 j Nj i r ( j=0 i=0 Pr i=0 i wi O Ni Pr j=i (Cja + Oja ) Pi P P O wj Njj )Cia gdy wystąpiła obrerwacja Xja = ti ; gdy Xja jest ocenzorowaną wartością; log-rank = 0, wi = 1 ( – rhoP i k gdy wystąpiła obrerwacja Xja = ti ; 1 − k=0 O Pi OkNk Vja = − k=0 Nk gdy Xja jest ocenzorowaną wartością; Jeśli brak cenzorowania i remisów to: Ok = 1, Nk = N − k + 1. Pi Ok k=0 Nk = Pi 1 k=0 N−k+1 = PN 1 k=N−i+1 k Wanda Niemyska, Robert Źrałek N ≈ log ( N−i+1 ) Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest Funkcja survdiff Funkcja survdiff przeprowadza test na różnice między dwoma lub większą liczbą krzywych przeżycia używając rodziny G − rho testów lub wykazuje różnice krzywą doświadczalną a teoretyczną. Funkcja survdiff implementuje rodzinę testów sparametryzowaną współczynnikiem rho. Każda śmierć w próbce testowej jest przemnożona przez S(t)rho , gdzie S(t) jest funkcją przeżycia. Wartości szczególne rho: rho = 0 – log-rank lub Mantel-Haenszel test; rho = 1 – Peto & Peto test (modyfikacja testu Gehana-Wilcoxona); Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest Składnia Składnia: > survdiff (formula, data, subset, na.action, rho = 0) gdzie formula – obiekt postaci Surv (time, status) ∼ predictors, gdzie predictors jest cechą lub zbiorem cech dzielącym nam obserwacje na podgrupy; data – zbiór danych; subset – wyrażenie określające które wiersze z danych testowych mają zostać użyte w teście; na.action – filtr brakujących danych; rho – wartość określająca typ testu; Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest survdiff - przykład1 >survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane) Call: survdiff(formula = Surv(dane$czas, dane$status) ∼ plec.biorcy, dane) (O−E )2 )2 N Observed Expected (O−E E V plec.biorcy=K 58 8 9.88 0.358 0.631 plec.biorcy=M 78 16 14.12 0.251 0.631 Chisq= 0.6 on 1 degrees of freedom, p= 0.427 Zmienne w tabeli oznaczają: N – liczba osobników w grupie; obs – liczba obserwacji w grupie (czasem z wagą różną od 1); exp – oczekiwana wartość obserwacji (z wagą); Chisq – statystyka Chi-kwadrat; p – p-value; Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest 0.2 0.4 S(t) 0.6 0.8 1.0 Krzywe przeŜycia z podziałem ze względu na płeć biorcy 0.0 kobiety-biorcy męŜczy?ni-biorcy 0 5 10 15 Czas obserwacji Call: survdiff(formula = Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho=1) plec.biorcy=K plec.biorcy=M N 58 78 Observed 6.3 13.9 Expected 8.49 11.67 (O−E )2 E (O−E )2 V 0.563 0.410 1.15 1.15 Chisq= 1.2 on 1 degrees of freedom, p= 0.283 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest 0.2 0.4 S(t) 0.6 0.8 1.0 Krzywe przeŜycia z podziałem ze względu na wiek dawcy 0.0 wiek dawcy < 40 41 < wiek dawcy < 60 wiek dawcy > 61 0 5 10 15 Czas obserwacji >dane$myvalue=round(dane$wiek.dawcy/20)*20 >survdiff(Surv(dane$czas, dane$status) ∼ myvalue, dane) )2 (O−E )2 N Observed Expected (O−E E V myvalue=20 31 5 8.47 1.422 2.288 myvalue=40 70 11 12.22 0.121 0.252 myvalue=60 35 8 3.31 6.631 8.102 Chisq= 8.7 on 2 degrees of freedom, p= 0.0131 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest 0.2 0.4 S(t) 0.6 0.8 1.0 Krzywe przeŜycia z podziałem ze względu na plec dawcy i biorcy 0.0 plec.dawcy=K, plec.biorcy=K plec.dawcy=K, plec.biorcy=M plec.dawcy=M, plec.biorcy=K plec.dawcy=M, plec.biorcy=M 0 5 10 15 Czas obserwacji >survdiff(Surv(dane$czas, dane$status) ∼ plec.dawcy+plec.biorcy, dane) )2 N Observed Expected (O−E E plec.dawcy=K, plec.biorcy=K 21 3 4.26 0.3728 plec.dawcy=K, plec.biorcy=M 34 11 7.07 2.1844 plec.dawcy=M, plec.biorcy=K 37 5 5.62 0.0685 plec.dawcy=M, plec.biorcy=M 44 5 7.05 0.5955 Chisq= 3.3 on 3 degrees of freedom, p= 0.345 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic (O−E )2 V 0.466 3.203 0.096 0.863 Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest >survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 0) )2 (O−E )2 N Observed Expected (O−E E V plec.biorcy=K 58 8 9.88 0.358 0.631 plec.biorcy=M 78 16 14.12 0.251 0.631 Chisq= 0.6 on 1 degrees of freedom, p= 0.427 >survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 0.5) )2 (O−E )2 N Observed Expected (O−E E V plec.biorcy=K 58 7.06 9.12 0.467 0.896 plec.biorcy=M 78 14.84 12.77 0.334 0.896 Chisq= 0.9 on 1 degrees of freedom, p= 0.344 >survdiff(Surv(dane$czas, dane$status) ∼ plec.biorcy, dane, rho = 1) )2 (O−E )2 N Observed Expected (O−E E V plec.biorcy=K 58 6.3 8.49 0.563 1.15 plec.biorcy=M 78 13.9 11.67 0.410 1.15 Chisq= 1.2 on 1 degrees of freedom, p= 0.283 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest Zależność p-value od rho 0.263 0.260 0.261 0.262 p-value 0.264 0.265 ZaleŜność p-value od rho dla podziału względem plec.dawcy 0.0 0.2 0.4 Wanda Niemyska, Robert Źrałek 0.6 rho 0.8 1.0 Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest RandomSurvivalForest importance >plot(rsf(Survrsf(czas.obserwacji, status)∼., data = dane[,-6])) 0.60 wiek.dawcy MDRD36m plec.biorcy MDRD60m niezgodnosci.AB plec.dawcy wiek.biorcy MDRD12m 0.50 Error Rate 0.55 wagastart niezgodnosci.DR MDRDend MDRD30 wagaend 0.45 MDRD24m MDRD6m MDRD7 0 200 600 1000 Number of Trees Wanda Niemyska, Robert Źrałek -0.02 0.02 0.06 Importance Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 left daughter 2.00 4.00 0.00 6.00 8.00 10.00 12.00 0.00 0.00 14.00 16.00 18.00 20.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 22.00 0.00 0.00 right daughter 3.00 5.00 0.00 7.00 9.00 11.00 13.00 0.00 0.00 15.00 17.00 19.00 21.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 23.00 0.00 0.00 Funkcja survdiff Współczynnik rho RandomSurvivalForest split var MDRD7 MDRD36m MDRD36m wiek.dawcy MDRDend wiek.biorcy wiek.biorcy MDRD36m MDRD12m wiek.dawcy plec.dawcy Wanda Niemyska, Robert Źrałek split point 67.50 57.50 0.00 50.50 17.50 22.00 42.50 0.00 0.00 40.00 29.00 58.00 43.50 0.00 0.00 0.00 0.00 0.00 0.00 0.00 2.00 0.00 0.00 status -3.00 -3.00 -1.00 -3.00 -3.00 -3.00 -3.00 -1.00 -1.00 -3.00 -3.00 -3.00 -3.00 -1.00 -1.00 -1.00 -1.00 -1.00 -1.00 -1.00 -3.00 -1.00 -1.00 prediction 0.15 0.14 1.00 0.21 0.02 0.09 0.38 1.00 0.00 0.50 0.02 0.07 0.57 1.00 0.00 1.00 0.00 0.00 1.00 0.00 0.87 0.33 1.00 Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest 0.2 0.4 S(t) 0.6 0.8 1.0 Krzywe przeŜycia z podziałem ze względu na wiek.dawcy 0.0 wiek.dawcy < 43.5 wiek.dawcy >= 43.5 0 5 10 15 Czas obserwacji >dane$myvalue=dane$wiek.dawcy>= 43.5 >survdiff(Surv(dane$czas.obserwacji, dane$status) ∼ myvalue, data = dane) )2 (O−E )2 N Observed Expected (O−E E V myvalue=FALSE 70 10 17.19 3.01 11.9 myvalue=TRUE 66 14 6.81 7.59 11.9 Chisq= 11.9 on 1 degrees of freedom, p= 0.000574 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest 0.2 0.4 S(t) 0.6 0.8 1.0 Krzywe przeŜycia z podziałem ze względu na MDRD36m 0.0 MDRD36m <= 40 MDRD36m > 40 0 5 10 15 Czas obserwacji >dane$myvalue=round(dane$MDRD36m/40)*40 >survdiff(Surv(dane$czas.obserwacji, dane$status) ∼ myvalue, data = dane) )2 (O−E )2 N Observed Expected (O−E E V myvalue=40 88 18 12.6 2.36 5.22 myvalue=80 48 6 11.4 2.59 5.22 Chisq= 5.2 on 1 degrees of freedom, p= 0.0223 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Funkcja survdiff Współczynnik rho RandomSurvivalForest 0.2 0.4 S(t) 0.6 0.8 1.0 Krzywe przeŜycia z podziałem ze względu na MDRD7 0.0 MDRD7 <= median MDRD7 > median 0 5 10 15 Czas obserwacji >dane$myvalue=dane$MDRD7<=median(dane$MDRD7) >survdiff(Surv(dane$czas.obserwacji, dane$status) ∼ myvalue, data = dane) )2 (O−E )2 N Observed Expected (O−E E V myvalue=FALSE 68 12 11.1 0.0792 0.153 myvalue=TRUE 68 12 12.9 0.0678 0.153 Chisq= 0.2 on 1 degrees of freedom, p= 0.696 Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Bibliografia Stevenson, M., 2007, An Introduction to Survival Analysis. IVABS, s. 15–16. Therneau, T.M., Foundation, M., 1999, A package for Survival Analysis in S. s. 14–16. Jones, M.P, Crowley, J., 1989, A General Class of Nonparametric Tests for Survival Analysis. Biometrics, Vol. 45, No. 1, s. 157–170. Harrington, D.P., Fleming, T.R., 1982, A Class of Rank Test Procedures for Censored Survival Data. Biometrika, Vol. 69, No. 3, s. 553–566. Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic Wprowadzenie Rodzaje testów Analiza przeżycia w środowisku R Koniec Koniec! Dziękujemy za uwagę! Wanda Niemyska, Robert Źrałek Krzywe przeżycia - testowanie różnic