analiza danych

Transkrypt

analiza danych
SUM - WLK ‘2011
WYKŁAD PIĄTY:
BIOSTATYSTYKA – C.D.
Prof. dr hab. med. Jan E. Zejda
! UWAGA !
SLAJDY WYBRANE I ZMODYFIKOWANE
POD KĄTEM PREZENTACJI W INTERNECIE
TREŚĆ WYKŁADU
• Dokumentowanie efektu (analiza danych”)
• Statystyczne aspekty testów przesiewowych
TREŚĆ WYKŁADU
• Dokumentowanie efektu (analiza danych”)
• Statystyczne aspekty testów przesiewowych
DOKUMENTOWANIE EFEKTU
Badanie naukowe jest instrumentem
umożliwiającym dokumentowanie obecności
zakładanego efektu i pomiar jego wielkości
(uproszczone spojrzenie - JEZ)
EFEKT
Określony (w celu badania) ilościowy lub
jakościowy przejaw zjawiska stanowiącego
przedmiot analizy danych i interpretacji
uzyskanych wyników
WIELKOŚĆ I OBECNOŚĆ EFEKTU
Wielkość
Obecność
Wartość średnia
x
p
Częstość
%
p
Różnica
x1-x2 ; %1-%2; …
p
Zależność
r; b
p
Ryzyko
RR
p
…
…
p
CZTERY POZIOMY ANALIZY DANYCH
- KONWENCJONALNA STRATEGIA • Analiza Opisowa
• Prosta Analiza Różnic/Zależności
• Stratyfikacyjna Analiza Różnic/Zależności
• Złożona Analiza Wielu Zmiennych
Przykład: wskazanie a sukces nCPAP (realne dane)
DEFINICJA EFEKTU: SCENARIUSZ
Cel Badania
Odpowiedź na pytanie, czy częstość hiperbilirubinemii jest
inna u noworodków donoszonych niż u wcześniaków ?
EFEKT: Hiperbilirubinemia
Dojrzałość Noworodka
/zdefiniowany efekt można badać także w inny sposób, np. zależność/
CZTERY POZIOMY ANALIZY DANYCH
- KONWENCJONALNA STRATEGIA • Analiza Opisowa
• Prosta Analiza Różnic/Zależności
• Stratyfikacyjna Analiza Różnic/Zależności
• Złożona Analiza Wielu Zmiennych
Przykład: wskazanie a sukces nCPAP (realne dane)
ANALIZA OPISOWA: SCENARIUSZ
Częstość hiperbilirubinemii:
u noworodków donoszonych
u wcześniaków
u rodzonych siłami natury
u rodzonych poprzez cięcie cesarskie
u noworodków z Apgar >6
u noworodków z Apgar <7
…
…
ANALIZA OPISOWA: SCENARIUSZ
Częstość hiperbilirubinemii:
u noworodków donoszonych
Naturalne klasyfikacje
sugerujące sposób analizy
(różnic w tym przypadku)
u wcześniaków
u rodzonych siłami natury
u rodzonych poprzez cięcie cesarskie
u noworodków z Apgar >6
u noworodków z Apgar <7
…
…
CZTERY POZIOMY ANALIZY DANYCH
- KONWENCJONALNA STRATEGIA • Analiza Opisowa
• Prosta Analiza Różnic/Zależności
• Stratyfikacyjna Analiza Różnic/Zależności
• Złożona Analiza Wielu Zmiennych
Przykład: wskazanie a sukces nCPAP (realne dane)
ANALIZA PROSTA: SCENARIUSZ
Częstość hiperbilirubinemii:
u noworodków donoszonych
u wcześniaków
u rodzonych siłami natury
u rodzonych poprzez cięcie cesarskie
u noworodków z Apgar >6
u noworodków z Apgar <7
…
…
Szereg prostych analiz
różnic (test chi2
w tym przypadku)
ANALIZA PROSTA: SCENARIUSZ
Prosta Analiza Różnic/Zależności
– kierunkowa (cel: hiperbilirubinemia a dojrzałość)
– towarzyszące (hiperbilirubinemia a rodzaj porodu, …)
podejrzenie wpływu czynnika zakłócającego
mm lub potencjalnej interakcji
↓
METODY ELIMINACJI LUB KONTROLI
WPŁYWU CZYNNIKÓW ZAKŁÓCAJĄCYCH
• Randomizacja (tylko badania eksperymentalne)
• Restrykcja (np. ocena pulmotoksyczności pyłu tylko
u niepalaczy, „kryteria włączenia”)
• Parowanie obserwacji (np. zapadalność na raka
sutka u mężatek i panien w tym samym wieku)
• Stratyfikacja (procedura Mantel-Haenszel)
• Statystyczna analiza wielu zmiennych (analiza
regresji)
Etap planowania badania
Etap analizy danych
A. STRATYFIKACYJNA: SCENARIUSZ
SENSSTRATUM
ANALIZY STRATYFIKACYJNEJ
= WARSTWA
Rodzaj porodu tworzy dwie naturalne warstwy poszukiwania
Czy
częstość
hiperbilirubinemii
zależy od
dojrzałości
różnicy
pomiędzy
częstością hiperbilirubinemii
u noworodków
noworodka, po uwzględnieniu
wpływu rodzaju porodu ?
donoszonych i wcześniaków
Warstwa
Efekt
Poród „SN”
Hiperbilirubinemia ← dojrzałość noworodka
Poród „CC”
Hiperbilirubinemia ← dojrzałość noworodka
A. STRATYFIKACYJNA: SCENARIUSZ
CZĘSTOŚĆ HIPERBILIRUBINEMII
Donos z ony
Wcz e ś niak
%
12
10
8
6
4
2
0
Por ód "SN"
p = 0,1
Por ód "CC"
p = 0,07
A. STRATYFIKACYJNA: SCENARIUSZ
CZĘSTOŚĆ HIPERBILIRUBINEMII
Donos z ony
Wcz e ś niak
%
12
10
8
6
4
2
0
Por ód "SN"
Por ód "CC"
p = 0,1
p = 0,07
p = 0,04
WYNIK ANALIZY STRATYFIKACYJNEJ (JEDNA WARTOŚĆ „p”)
- PROCEDURA MANTEL-HAENSCHEL’A -
A. STRATYFIKACYJNA: SCENARIUSZ
CZĘSTOŚĆ HIPERBILIRUBINEMII
Donos z ony
Wcz e ś niak
%
12
10
8
6
4
2
0
Por ód "SN"
Por ód "CC"
WNIOSEK
PO UWZGLĘDNIENIU WPŁYWU RODZAJU PORODU CZĘSTOŚĆ
HIPERBILIRUBINEMII OKAZUJE SIĘ WYŻSZA U NOWORODKÓW URODZONYCH
PRZEDWCZEŚNIE W PORÓWNANIU Z NOWORODKAMI URODZONYMI O CZASIE
LICZNE ANALIZY PROSTE
I STRATYFIKACYJNE: PROBLEM
WCZEŚNIAKI
N. DONOSZONE
Poród „SN”
Apgar↑
Apgar↓
Poród „CC”
Apgar↑
Poród „SN”
Apgar↓
Apgar↑
Apgar↓
Poród „CC”
Apgar↑
Apgar↓
HB11% HB12% HB21% HB22% HB11% HB12% HB21% HB22%
i.t.d.
√ w końcu brak danych do porównań
√ narasta szum informacyjny
CZTERY POZIOMY ANALIZY DANYCH
- KONWENCJONALNA STRATEGIA • Analiza Opisowa
• Prosta Analiza Różnic/Zależności
• Stratyfikacyjna Analiza Różnic/Zależności
• Złożona Analiza Wielu Zmiennych
Przykład: wskazanie a sukces nCPAP (realne dane)
ANALIZA WIELU ZMIENNYCH
MODEL KONCEPCYJNY LUB SUGEROWANY PRZEZ
WYNIKI ANALIZ PROSTYCH I STRATYFIKACYJNYCH
zmienna zależna
H-B = DOJRZAŁOŚĆ + PORÓD + APGAR
zmienne niezależne
(równanie regresji wielu zmiennych)
ANALIZA WIELU ZMIENNYCH
-ROZWIĄZANIE RÓWNANIAH-B
=
b1*DOJRZAŁOŚĆ
Współczynniki
Regresji !
+
b2*PORÓD
+
b3*APGAR
+
b0
ANALIZA WIELU ZMIENNYCH
Gdy zmienna zależna ma postać
-zmiennej jakościowej (Hiperbilirubinemia: tak/nie)
wówczas tzw. analiza regresji logistycznej
-zmiennej ilościowej (Bilirubinemia: mg%) wówczas tzw.
analiza regresji liniowej
wnioskowanie jednakowe (‘b’ i ‘p’)
INTERPRETACJA WYNIKU
ANALIZY WIELU ZMIENNYCH
„Po uwzględnieniu wpływu stanu klinicznego noworodka
oraz rodzaju jego porodu stopień dojrzałości naworodka
ma (nie ma) wpływ na obecność hiperbilirubinemii”
Modelowanie (analiza wielu zmiennych) ujawnia złożone
zależności, ale także służy predykcji:
Jakie jest prawdopodobieństwo wystąpienia hiperbilirubinemii u
noworodka urodzonego przedwcześnie siłami natury i
znajdującego się w złym stanie klinicznym ?
CZTERY POZIOMY ANALIZY DANYCH
- KONWENCJONALNA STRATEGIA • Analiza Opisowa
• Prosta Analiza Różnic/Zależności
• Stratyfikacyjna Analiza Różnic/Zależności
• Złożona Analiza Wielu Zmiennych
Każdy poziom analizy jest ważny
TREŚĆ WYKŁADU
• Dokumentowanie efektu (analiza danych”)
• Statystyczne aspekty testów przesiewowych
INGERENCJE PROFILAKTYCZNE
KRYTERIA DOBORU CHOROBY
DO BADAŃ PRZESIEWOWYCH
•choroba powinna stanowić istotny problem zdrowotny;
•historia naturalna choroby powinna być dobrze poznana;
ie
s
rze
e
w
wo
p
•choroba powinna być rozpoznawalna w stadium utajonym a
(bezobjawowym)
lub we
i
wczesnym objawowym;
an
d
a
b
•powinien istnieć właściwy test do badań przesiewowych;
ia–
n
p
o
t
•powinny istnieć akceptowane i skuteczne
metody leczenia tej choroby, skuteczniejsze
s
we wczesnej fazie choroby; ego
i
g
u
r
d
•postępowanie terapeutyczne odnośnie choroby powinno być ustalone;
a
k
y
t
k
•profilaktykalamedyczna danej choroby nie może być jednorazową akcją, ale procesem
i
f
długofalowym;
o
pr
•koszt programu (włączając w to rozpoznanie i leczenie) musi być znany i ekonomicznie
wyważony, w relacji do kosztów funkcjonowania systemu ochrony zdrowia.
Wilson & Junger, 1968
KRYTERIA DOBORU CHOROBY
DO BADAŃ PRZESIEWOWYCH
•choroba powinna stanowić istotny problem zdrowotny;
•historia naturalna choroby powinna być dobrze poznana;
•choroba powinna być rozpoznawalna w stadium utajonym (bezobjawowym) lub we
wczesnym objawowym;
•powinien istnieć właściwy test do badań przesiewowych;
•powinny istnieć akceptowane i skuteczne metody leczenia tej choroby, skuteczniejsze
we wczesnej fazie choroby;
•postępowanie terapeutyczne odnośnie choroby powinno być ustalone;
•profilaktyka medyczna danej choroby nie może być jednorazową akcją, ale procesem
długofalowym;
•koszt programu (włączając w to rozpoznanie i leczenie) musi być znany i ekonomicznie
wyważony, w relacji do kosztów funkcjonowania systemu ochrony zdrowia.
Wilson & Junger, 1968
KRYTERIA DOBORU TESTU
Prostota - test powinien być prosty do przeprowadzenia, łatwy w interpretacji,
możliwy do przeprowadzenia przez personel paramedyczny lub inny.
Akceptowalność – procedura musi być akceptowana przez badanych, szczególnie
gdy wymagana jest zgoda badanego.
Dokładność – test musi dostarczać prawdziwe pomiary objawów i stanów będących
przedmiotem badania
Koszt – wydatki poniesione na przeprowadzenie testu muszą uwzględniać
ewentualne korzyści płynące z wczesnego wykrycia i leczenia choroby.
Powtarzalność – podobne wyniki powinny być uzyskiwane w powtarzanych
badaniach
Czułość - zdolność testu do wykrycia rzeczywistych przypadków choroby.
Swoistość – zdolność testu do prawidłowego klasyfikowania osób zdrowych jako
zdrowych.
Cochrane & Holland, 1971
TRAFNOŚĆ TESTU PRZESIEWOWEGO
Wynik testu
Choroba obecna (+)
Choroba nieobecna (-)
+
a
b
-
c
d
Czułość testu:
odsetek dodatnich wyników wśród wszystkich chorych
a / (a+c)
Swoistość testu:
odsetek ujemnych wyników wśród wszystkich zdrowych
d / (b+d)
Zdolność przewidywania pozytywnych rozpoznań:
odsetek chorych wśród wszystkich z dodatnim wynikiem
a / (a+b)
Zdolność przewidywania negatywnych rozpoznań:
odsetek zdrowych wśród wszystkich z ujemnym wynikiem
d / (c+d)