analiza danych
Transkrypt
analiza danych
SUM - WLK ‘2011 WYKŁAD PIĄTY: BIOSTATYSTYKA – C.D. Prof. dr hab. med. Jan E. Zejda ! UWAGA ! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU • Dokumentowanie efektu (analiza danych”) • Statystyczne aspekty testów przesiewowych TREŚĆ WYKŁADU • Dokumentowanie efektu (analiza danych”) • Statystyczne aspekty testów przesiewowych DOKUMENTOWANIE EFEKTU Badanie naukowe jest instrumentem umożliwiającym dokumentowanie obecności zakładanego efektu i pomiar jego wielkości (uproszczone spojrzenie - JEZ) EFEKT Określony (w celu badania) ilościowy lub jakościowy przejaw zjawiska stanowiącego przedmiot analizy danych i interpretacji uzyskanych wyników WIELKOŚĆ I OBECNOŚĆ EFEKTU Wielkość Obecność Wartość średnia x p Częstość % p Różnica x1-x2 ; %1-%2; … p Zależność r; b p Ryzyko RR p … … p CZTERY POZIOMY ANALIZY DANYCH - KONWENCJONALNA STRATEGIA • Analiza Opisowa • Prosta Analiza Różnic/Zależności • Stratyfikacyjna Analiza Różnic/Zależności • Złożona Analiza Wielu Zmiennych Przykład: wskazanie a sukces nCPAP (realne dane) DEFINICJA EFEKTU: SCENARIUSZ Cel Badania Odpowiedź na pytanie, czy częstość hiperbilirubinemii jest inna u noworodków donoszonych niż u wcześniaków ? EFEKT: Hiperbilirubinemia Dojrzałość Noworodka /zdefiniowany efekt można badać także w inny sposób, np. zależność/ CZTERY POZIOMY ANALIZY DANYCH - KONWENCJONALNA STRATEGIA • Analiza Opisowa • Prosta Analiza Różnic/Zależności • Stratyfikacyjna Analiza Różnic/Zależności • Złożona Analiza Wielu Zmiennych Przykład: wskazanie a sukces nCPAP (realne dane) ANALIZA OPISOWA: SCENARIUSZ Częstość hiperbilirubinemii: u noworodków donoszonych u wcześniaków u rodzonych siłami natury u rodzonych poprzez cięcie cesarskie u noworodków z Apgar >6 u noworodków z Apgar <7 … … ANALIZA OPISOWA: SCENARIUSZ Częstość hiperbilirubinemii: u noworodków donoszonych Naturalne klasyfikacje sugerujące sposób analizy (różnic w tym przypadku) u wcześniaków u rodzonych siłami natury u rodzonych poprzez cięcie cesarskie u noworodków z Apgar >6 u noworodków z Apgar <7 … … CZTERY POZIOMY ANALIZY DANYCH - KONWENCJONALNA STRATEGIA • Analiza Opisowa • Prosta Analiza Różnic/Zależności • Stratyfikacyjna Analiza Różnic/Zależności • Złożona Analiza Wielu Zmiennych Przykład: wskazanie a sukces nCPAP (realne dane) ANALIZA PROSTA: SCENARIUSZ Częstość hiperbilirubinemii: u noworodków donoszonych u wcześniaków u rodzonych siłami natury u rodzonych poprzez cięcie cesarskie u noworodków z Apgar >6 u noworodków z Apgar <7 … … Szereg prostych analiz różnic (test chi2 w tym przypadku) ANALIZA PROSTA: SCENARIUSZ Prosta Analiza Różnic/Zależności – kierunkowa (cel: hiperbilirubinemia a dojrzałość) – towarzyszące (hiperbilirubinemia a rodzaj porodu, …) podejrzenie wpływu czynnika zakłócającego mm lub potencjalnej interakcji ↓ METODY ELIMINACJI LUB KONTROLI WPŁYWU CZYNNIKÓW ZAKŁÓCAJĄCYCH • Randomizacja (tylko badania eksperymentalne) • Restrykcja (np. ocena pulmotoksyczności pyłu tylko u niepalaczy, „kryteria włączenia”) • Parowanie obserwacji (np. zapadalność na raka sutka u mężatek i panien w tym samym wieku) • Stratyfikacja (procedura Mantel-Haenszel) • Statystyczna analiza wielu zmiennych (analiza regresji) Etap planowania badania Etap analizy danych A. STRATYFIKACYJNA: SCENARIUSZ SENSSTRATUM ANALIZY STRATYFIKACYJNEJ = WARSTWA Rodzaj porodu tworzy dwie naturalne warstwy poszukiwania Czy częstość hiperbilirubinemii zależy od dojrzałości różnicy pomiędzy częstością hiperbilirubinemii u noworodków noworodka, po uwzględnieniu wpływu rodzaju porodu ? donoszonych i wcześniaków Warstwa Efekt Poród „SN” Hiperbilirubinemia ← dojrzałość noworodka Poród „CC” Hiperbilirubinemia ← dojrzałość noworodka A. STRATYFIKACYJNA: SCENARIUSZ CZĘSTOŚĆ HIPERBILIRUBINEMII Donos z ony Wcz e ś niak % 12 10 8 6 4 2 0 Por ód "SN" p = 0,1 Por ód "CC" p = 0,07 A. STRATYFIKACYJNA: SCENARIUSZ CZĘSTOŚĆ HIPERBILIRUBINEMII Donos z ony Wcz e ś niak % 12 10 8 6 4 2 0 Por ód "SN" Por ód "CC" p = 0,1 p = 0,07 p = 0,04 WYNIK ANALIZY STRATYFIKACYJNEJ (JEDNA WARTOŚĆ „p”) - PROCEDURA MANTEL-HAENSCHEL’A - A. STRATYFIKACYJNA: SCENARIUSZ CZĘSTOŚĆ HIPERBILIRUBINEMII Donos z ony Wcz e ś niak % 12 10 8 6 4 2 0 Por ód "SN" Por ód "CC" WNIOSEK PO UWZGLĘDNIENIU WPŁYWU RODZAJU PORODU CZĘSTOŚĆ HIPERBILIRUBINEMII OKAZUJE SIĘ WYŻSZA U NOWORODKÓW URODZONYCH PRZEDWCZEŚNIE W PORÓWNANIU Z NOWORODKAMI URODZONYMI O CZASIE LICZNE ANALIZY PROSTE I STRATYFIKACYJNE: PROBLEM WCZEŚNIAKI N. DONOSZONE Poród „SN” Apgar↑ Apgar↓ Poród „CC” Apgar↑ Poród „SN” Apgar↓ Apgar↑ Apgar↓ Poród „CC” Apgar↑ Apgar↓ HB11% HB12% HB21% HB22% HB11% HB12% HB21% HB22% i.t.d. √ w końcu brak danych do porównań √ narasta szum informacyjny CZTERY POZIOMY ANALIZY DANYCH - KONWENCJONALNA STRATEGIA • Analiza Opisowa • Prosta Analiza Różnic/Zależności • Stratyfikacyjna Analiza Różnic/Zależności • Złożona Analiza Wielu Zmiennych Przykład: wskazanie a sukces nCPAP (realne dane) ANALIZA WIELU ZMIENNYCH MODEL KONCEPCYJNY LUB SUGEROWANY PRZEZ WYNIKI ANALIZ PROSTYCH I STRATYFIKACYJNYCH zmienna zależna H-B = DOJRZAŁOŚĆ + PORÓD + APGAR zmienne niezależne (równanie regresji wielu zmiennych) ANALIZA WIELU ZMIENNYCH -ROZWIĄZANIE RÓWNANIAH-B = b1*DOJRZAŁOŚĆ Współczynniki Regresji ! + b2*PORÓD + b3*APGAR + b0 ANALIZA WIELU ZMIENNYCH Gdy zmienna zależna ma postać -zmiennej jakościowej (Hiperbilirubinemia: tak/nie) wówczas tzw. analiza regresji logistycznej -zmiennej ilościowej (Bilirubinemia: mg%) wówczas tzw. analiza regresji liniowej wnioskowanie jednakowe (‘b’ i ‘p’) INTERPRETACJA WYNIKU ANALIZY WIELU ZMIENNYCH „Po uwzględnieniu wpływu stanu klinicznego noworodka oraz rodzaju jego porodu stopień dojrzałości naworodka ma (nie ma) wpływ na obecność hiperbilirubinemii” Modelowanie (analiza wielu zmiennych) ujawnia złożone zależności, ale także służy predykcji: Jakie jest prawdopodobieństwo wystąpienia hiperbilirubinemii u noworodka urodzonego przedwcześnie siłami natury i znajdującego się w złym stanie klinicznym ? CZTERY POZIOMY ANALIZY DANYCH - KONWENCJONALNA STRATEGIA • Analiza Opisowa • Prosta Analiza Różnic/Zależności • Stratyfikacyjna Analiza Różnic/Zależności • Złożona Analiza Wielu Zmiennych Każdy poziom analizy jest ważny TREŚĆ WYKŁADU • Dokumentowanie efektu (analiza danych”) • Statystyczne aspekty testów przesiewowych INGERENCJE PROFILAKTYCZNE KRYTERIA DOBORU CHOROBY DO BADAŃ PRZESIEWOWYCH •choroba powinna stanowić istotny problem zdrowotny; •historia naturalna choroby powinna być dobrze poznana; ie s rze e w wo p •choroba powinna być rozpoznawalna w stadium utajonym a (bezobjawowym) lub we i wczesnym objawowym; an d a b •powinien istnieć właściwy test do badań przesiewowych; ia– n p o t •powinny istnieć akceptowane i skuteczne metody leczenia tej choroby, skuteczniejsze s we wczesnej fazie choroby; ego i g u r d •postępowanie terapeutyczne odnośnie choroby powinno być ustalone; a k y t k •profilaktykalamedyczna danej choroby nie może być jednorazową akcją, ale procesem i f długofalowym; o pr •koszt programu (włączając w to rozpoznanie i leczenie) musi być znany i ekonomicznie wyważony, w relacji do kosztów funkcjonowania systemu ochrony zdrowia. Wilson & Junger, 1968 KRYTERIA DOBORU CHOROBY DO BADAŃ PRZESIEWOWYCH •choroba powinna stanowić istotny problem zdrowotny; •historia naturalna choroby powinna być dobrze poznana; •choroba powinna być rozpoznawalna w stadium utajonym (bezobjawowym) lub we wczesnym objawowym; •powinien istnieć właściwy test do badań przesiewowych; •powinny istnieć akceptowane i skuteczne metody leczenia tej choroby, skuteczniejsze we wczesnej fazie choroby; •postępowanie terapeutyczne odnośnie choroby powinno być ustalone; •profilaktyka medyczna danej choroby nie może być jednorazową akcją, ale procesem długofalowym; •koszt programu (włączając w to rozpoznanie i leczenie) musi być znany i ekonomicznie wyważony, w relacji do kosztów funkcjonowania systemu ochrony zdrowia. Wilson & Junger, 1968 KRYTERIA DOBORU TESTU Prostota - test powinien być prosty do przeprowadzenia, łatwy w interpretacji, możliwy do przeprowadzenia przez personel paramedyczny lub inny. Akceptowalność – procedura musi być akceptowana przez badanych, szczególnie gdy wymagana jest zgoda badanego. Dokładność – test musi dostarczać prawdziwe pomiary objawów i stanów będących przedmiotem badania Koszt – wydatki poniesione na przeprowadzenie testu muszą uwzględniać ewentualne korzyści płynące z wczesnego wykrycia i leczenia choroby. Powtarzalność – podobne wyniki powinny być uzyskiwane w powtarzanych badaniach Czułość - zdolność testu do wykrycia rzeczywistych przypadków choroby. Swoistość – zdolność testu do prawidłowego klasyfikowania osób zdrowych jako zdrowych. Cochrane & Holland, 1971 TRAFNOŚĆ TESTU PRZESIEWOWEGO Wynik testu Choroba obecna (+) Choroba nieobecna (-) + a b - c d Czułość testu: odsetek dodatnich wyników wśród wszystkich chorych a / (a+c) Swoistość testu: odsetek ujemnych wyników wśród wszystkich zdrowych d / (b+d) Zdolność przewidywania pozytywnych rozpoznań: odsetek chorych wśród wszystkich z dodatnim wynikiem a / (a+b) Zdolność przewidywania negatywnych rozpoznań: odsetek zdrowych wśród wszystkich z ujemnym wynikiem d / (c+d)