Warszawa 2006 - Uniwersytetu Medycznego im. Karola

Transkrypt

Warszawa 2006 - Uniwersytetu Medycznego im. Karola
JERZY A. MOCZKO
Katedra i Zakład Informatyki i Statystyki
Akademia Medyczna im. Karola Marcinkowskiego w Poznaniu
V edycja „Programu Rozwoju Naukowego Młodych
Diabetologów”
Najczęstsze błędy z zakresu
statystyki medycznej
Konferencja Szkoleniowa
Warszawa – 25 luty 2006
ETYKA A STATYSTYKA
Jest rzeczą nieetyczną przeprowadzanie błędnego
doświadczenia naukowego. Jednym z aspektów
błędnych doświadczeń są niewłaściwie stosowane
metody statystyczne.
ROZKŁAD BŁĘDÓW NA
ROZMAITYCH ETAPACH BADANIA
WG SACKETTA 1
•
•
•
•
•
Planowanie (5)
Konstrukcja (22)
Zbieranie danych (18)
Analiza danych (5)
Prezentacja i interpretacja danych (6)
Sackett D.L. „Bias and Analytic Research”
J.Chronic Dis. 1979;32:51-63.
1
PLANOWANIE BADANIA
• BŁĄD PUBLIKACYJNY - tendencja do
publikowania wyłącznie tych prac, które raportują
wyniki pozytywne lub regionalne
• BŁĄD CYTOWANIA - skłonność do cytowania
prac, które potwierdzają własne argumenty badacza i
pomijanie prac, które tych argumentów nie
potwierdzają
KONSTRUKCJA BADANIA
• OKREŚLANIE BADANEJ POPULACJI I
PRÓBY
• WYZNACZENIE LICZEBNOŚCI PRÓBY
• METODA PRZYPISYWANIA PACJENTÓW
DO ODPOWIEDNIEGO RODZAJU LECZENIA
• RODZAJ METODY (RANDOMIZOWANA,
KRZYŻOWA, SEKWENCYJNA,
ADAPTACYJNA)
CZY JEST RZECZĄ ETYCZNĄ
STOSOWANIE RANDOMIZACJI (1)
ZASADNICZY PROBLEM ETYCZNY
POLEGA NA ZRÓWNOWAŻENIU DOBRA
JEDNOSTKI PODDANEJ BADANIU Z
POTENCJALNA KORZYŚCIĄ, JAKĄ TO
BADANIE MOŻE MIEĆ DLA PRZYSZŁYCH
PACJENTÓW
CZY JEST RZECZĄ ETYCZNĄ
STOSOWANIE RANDOMIZACJI (2)
METODA ZELENA
• POŁOWA PACJENTÓW ZOSTAJE LOSOWO
PRZYPISANA DO LECZENIA STANDARDOWEGO
(GRUPA 1)
• DRUGA POŁOWA MA PRZED SOBĄ WYBÓR: ALBO
NOWE LECZENIE (GRUPA 2) ALBO LECZENIE
STANDARDOWE (GRUPA 1)
LICZEBNOŚĆ BADANEJ PRÓBY
• PRÓBA O ZBYT WIELKIEJ LICZEBNOŚCI –
KONIECZNOŚĆ ZAANGAŻOWANIA
DODATKOWYCH OSOBNIKÓW, PODWYŻSZENIE
KOSZTÓW I CZASU TRWANIA BADANIA
• PRÓBA O ZBYT MAŁEJ LICZEBNOŚCI UNIEMOŻLIWIA WYKRYCIE WAŻNYCH Z
PUNKTU WIDZENIA KLINICZNEGO ZJAWISK –
ZWIĘKSZONE RYZYKO UZYSKIWANIA WYNIKÓW
FAŁSZYWIE NEGATYWNYCH (
BŁĘDY PIERWSZEGO I DRUGIEGO
RODZAJU
wynik testu
H0
H1
Rzeczywistość
H0
H1
ok
β
α
ok
błąd pierwszego rodzaju α polega na tym, że wynik testu wykazuje
istnienie istotnej statystycznie różnicy, podczas gdy w rzeczywistości ta
różnica nie jest istotna. Prawdopodobieństwo błędu I rodzaju nazywamy
poziomem istotności.
błąd drugiego rodzaju β polega na stwierdzeniu na podstawie
przeprowadzonego testu statystycznego, że średnie nie różnią się istotnie
statystycznie, podczas gdy w rzeczywistości taka różnica istnieje.
Określa on stopień akceptowanego przez eksperymentatora ryzyka
zagubienia rzeczywiście istniejącej różnicy między średnimi. Na
pojawienie się błędu drugiego rodzaju ma istotny wpływ zbyt mała
liczebność próby oraz duże rozproszenie pomiarów w próbie.
BŁĘDY PIERWSZEGO I DRUGIEGO
RODZAJU
Wartości α i β są ze sobą powiązane. Zmniejszenie
prawdopodobieństwa α powoduje wzrost
prawdopodobieństwa β.
CZUŁOŚĆ I SWOISTOŚĆ TESTU
DIAGNOSTYCZNEGO
RZECZYWISTOŚĆ
H0: TRUE
H0: FALSE
WYNIK
TESTU
H0: TRUE
( NORMA)
H0: FALSE
(NIEPRAWIDŁOWOŚĆ)
DEFINICJA
CZUŁOŚĆ
SWOISTOŚĆ
(NORMA)
(NIEPRAWIDŁOWOŚĆ)
PRAWDZIWIE
NEGATYWNY
(TN)
FAŁSZYWIE
NEGATYWNY
(FN)
BŁĄD II
RODZAJU (β )
PRAWDZIWIE
POZYTYWNY
(TP)
FAŁSZYWIE
POZYTYWNY
(FP)
BŁĄD I RODZAJU
(α )
Interpretacja
TP / (TP + FN) Proporcja liczby przypadków nieprawidłowych
poprawnie sklasyfikowanych przez test do liczby
wszystkich przypadków nieprawidłowych
TN / (TN + FP) Proporcja wszystkich przypadków normy
poprawnie sklasyfikowanych przez test do
wszystkich przypadków normy
NOMOGRAM ALTMANA
NOMOGRAM ALTMANA
WZORY LEHR’A
SKALE POMIAROWE
skala interwałowa
niesie najwięcej informacji, najsilniejsza
skala porządkowa
skala słabsza
skala nominalna
skala najsłabsza
BŁĘDY POMIAROWE
 BŁĘDY SYSTEMATYCZNE
 BŁĘDY LOSOWE (NIE POTRAFIMY ICH
WYELIMINOWAĆ, MOŻEMY JEDNAK OSZACOWAĆ
ICH WIELKOŚĆ I OCENIĆ ICH WPŁYW NA
WIAROGODNOŚĆ NASZYCH POMIARÓW)
BŁĘDY GRUBE
PODSTAWOWE TYPY
INFORMACJI MEDYCZNEJ
• ALFANUMERYCZNA
• SYGNAŁY
• OBRAZY
INFORMACJA
ALFANUMERYCZNA
• DANE
REJESTRACYJNE
• HISTORIA
CHOROBY
• WYNIKI
LABORATORYJNE
• EPIKRYZA
• RECEPTY
INFORMACJA
SYGNAŁOWA
•
•
•
•
•
•
•
•
ELEKTROKARDIOGRAFIA
ELEKTROENCEFALOGRAFIA
ELEKTROMIOGRAFIA
ELEKTRONYSTAGMOGRAFIA
ELEKTROGASTROGRAFIA
ELEKTROINTESTINOGRAFIA
ELEKTROOKULOGRAFIA
KARDIOTOKOGRAFIA
INFORMACJA OBRAZOWA
• KLASYCZNA
TECHNIKA
RENTGENOWSKA
• JĄDROWY
REZONANS
MAGNETYCZNY
• ULTRASONOGRAFIA
• MIKROSKOPIA
OPTYCZNA I
ELEKTRONOWA
• BADANIE DNA OKA
• TERMOGRAFIA
ORGANIZACJA DANYCH
Zmienne to wielkości, które obserwujemy,
mierzymy i którymi manipulujemy w trakcie
prowadzenia badania.
WPROWADZANIE DANYCH
WERYFIKACJA DANYCH
WERYFIKACJA DANYCH
• DANE KATEGORIALNE (KODOWANIE
SYMBOLICZNE I NUMERYCZNE)
• DANE NUMERYCZNE (BADANIE
ZAKRESU)
• DATY I GODZINY
• WARTOŚCI ODSKAKUJĄCE (obserwacje, które
wyróżniają się od większości danych i są niezgodne z pozostałymi
danymi. Wartości te mogą być prawdziwymi obserwacjami od
osobników z bardzo ekstremalnymi poziomami zmiennej.
Jednakże, mogą też być wynikiem błędów wprowadzania lub
błędnego doboru jednostek, i dlatego należy sprawdzić wszelkie
podejrzane wartości)
• DANE BRAKUJĄCE
GRAFICZNA PREZENTACJA DANYCH
INTERPRETACJA WYBRANYCH ZAPISÓW
STATYSTYKI OPISOWEJ
DOBÓR TESTU STATYSTYCZNEGO
 czy mamy do czynienia z problemem badania istotności
różnic czy też problemem badania zależności?
 w jakiej skali pomiarowej zostały wykonane pomiary
(interwałowej, porządkowej, nominalnej) ?
 jeżeli dane wyrażone są w skali interwałowej to czy
pochodzą z populacji o rozkładzie normalnym?
 ile grup porównujemy jednocześnie (dwie, więcej niż
dwie) ?
 jaki model badania został wykorzystany przy zbieraniu
danych (zmienne niepowiązane czy powiązane)?
MODEL BADANIA
 Model zmiennych niepowiązanych (niezależnych)
- dwie lub więcej prób pobranych z dwu lub więcej różnych
populacji.
 Model zmiennych powiązanych (sparowanych, zależnych)
- ten sam pacjent (zjawisko itp.) badane są dwukrotnie lub
większą ilość razy.
WYBÓR NAJCZĘŚCIEJ STOSOWANYCH TESTÓW
W BADANIACH MEDYCZNYCH I WARUNKI ICH
STOSOWANIA.
skala / liczba
warunki
grup
dodatkowe
interwałowa
interwałowa
dwie grupy
więcej niż dwie
grupy
grupy
zmienne powią- zmienne niepo-
zmienne powią-
powiązane
zane
wiązane
zane
normalność
test t-Studenta
test t-Studenta
analiza warian- analiza warian-
rozkładu
(niepowiąz.)
(powiązane)
cji
cji
test Wilcoxona
test Kruskala-
test Friedmana
brak normalno- test Manna-
Whitneya
test Manna-
Wallisa
test Wilcoxona
Whitneya
nominalna
więcej niż dwie
Zmienne nie-
ści rozkładu
porządkowa
dwie grupy
-
test Kruskala-
test Friedmana
Wallisa
test chi-kwadrat test znaków lub test chi-kwadrat test Qlub dokładny
test Fishera
test McNemara
lub dokładny
test Fishera
Cochrana
SPRAWDZANIE ZAŁOŻEŃ
• NORMALNOŚĆ
• HOMOGENICZNOŚĆ
(homoscedastyczność)
• ZWIĄZEK LINIOWY
INTERPRETACJA WYNIKÓW (1)
• Każdy test istotności jest miarą wiarygodności
hipotezy zerowej mówiącej o braku istotności
różnic.
• Wynik nieistotny oznacza po prostu, że wyniki
nie są dostatecznie wiarygodne, by móc odrzucić
hipotezę zerową
• Błędem jest stwierdzenie, że wszystkie wyniki
nieistotne wskazują na brak efektu mającego
znaczenie kliniczne
• Błędem jest stwierdzenie, że wszystkie wyniki
istotne wskazują na istnienie efektu mającego
znaczenie kliniczne
INTERPRETACJA WYNIKÓW (2)
Badania charakteryzujące się niską wartością
mocy (wynikającą z niedostatecznej liczebności próby) dają często
wyniki wskazujące na istnienie zjawisk, które, jeżeli byłyby
prawdziwe, miałyby znaczenie kliniczne, ale które statystycznie
biorąc nie są istotne.
Najbezpieczniej jest uważać tego rodzaju wyniki za nieprzekonujące
( nie dowiedzione) i w miarę możności wzmocnić je propozycją
zbierania dalszych danych.
INTERPRETACJA WYNIKÓW (3)
Gdy na jednym zbiorze danych przeprowadza się
kilka testów istotności wzrasta ryzyko
otrzymania wyników fałszywie pozytywnych
(tzn. wzrasta prawdopodobieństwo popełnienia
błędu i rodzaju – odrzucenie hipotezy zerowej,
gdy w rzeczywistości jest ona prawdziwa).
Jeśli na przykład policzymy korelacje pomiędzy dziesięcioma
zmiennymi (łącznie 45 współczynników korelacji), to możemy się
spodziewać, że przez przypadek około dwa z nich (tzn. jeden
na każde 20) będzie istotnych na poziomie p < 0,05,
nawet jeżeli wartości zmiennych były kompletnie losowe,
a w populacji generalnej nie występują żadne korelacje między
tymi zmiennymi.
INTERPRETACJA WYNIKÓW (4)
Wiele związków nie ma charakteru przyczynowego.
Błędne związki pojawiają się szczególnie wtedy, gdy
każda ze zmiennych jest skorelowana z jakąś trzecią
„ukrytą” (uwikłaną) zmienną.
Problem korelacyjny: długość włosów a wzrost
INTERPRETACJA WYNIKÓW (5)
Problem interpolacji i ekstrapolacji: czy należy
jeździć samochodem bardzo szybko, ponieważ
samochody jadące z prędkością powyżej 180 km/h
powodują mniej wypadków ?
Podobnie, jak niebezpieczne jest uogólnianie na podstawie
pojedynczych danych, tak samo musimy być bardzo ostrożni
z wyciąganiem wniosków jednostkowych z uogólnień.
CZUŁOŚĆ I SWOISTOŚĆ TESTU
DIAGNOSTYCZNEGO
RZECZYWISTOŚĆ
H0: TRUE
H0: FALSE
WYNIK
TESTU
H0: TRUE
( NORMA)
H0: FALSE
(NIEPRAWIDŁOWOŚĆ)
DEFINICJA
CZUŁOŚĆ
SWOISTOŚĆ
(NORMA)
(NIEPRAWIDŁOWOŚĆ)
PRAWDZIWIE
NEGATYWNY
(TN)
FAŁSZYWIE
NEGATYWNY
(FN)
BŁĄD II
RODZAJU (β )
PRAWDZIWIE
POZYTYWNY
(TP)
FAŁSZYWIE
POZYTYWNY
(FP)
BŁĄD I RODZAJU
(α )
Interpretacja
TP / (TP + FN) Proporcja liczby przypadków nieprawidłowych
poprawnie sklasyfikowanych przez test do liczby
wszystkich przypadków nieprawidłowych
TN / (TN + FP) Proporcja wszystkich przypadków normy
poprawnie sklasyfikowanych przez test do
wszystkich przypadków normy
INTERPRETACJA WYNIKÓW (6a)
CZUŁOŚĆ = SWOISTOŚĆ = 0.9
ROZPOWSZECHNIENIE = 50% (200/400)
CZUŁOŚĆ = SWOISTOŚĆ = 0.9
ROZPOWSZECHNIENIE = 2% (100/5000)
RZECZYWISTOŚĆ
H0: TRUE
H0: FALSE
WYNIK
TESTU
H0: TRUE
( CHOROBA -)
H0: FALSE
(CHOROBA +)
(CHOROBA -)
(CHOROBA +)
PRAWDZIWIE
NEGATYWNY
(TN)
180 (4410)
FAŁSZYWIE
POZYTYWNY
(FP)
20 (490)
FAŁSZYWIE
NEGATYWNY
(FN)
20 (10)
PRAWDZIWIE
POZYTYWNY
(TP)
180 (90)
CZUŁOŚĆ = TP / (TP + FN)
SWOISTOŚĆ = TN / (TN + FP)
INTERPRETACJA WYNIKÓW (6b)
W JAKIM ODSETKU ROZPOZNANE WYNIKI POZYTYWNE I
NEGATYWNE ODPOWIADAJĄ PRAWDZIWYM WARTOŚCIOM
POZYTYWNYM I NEGATYWNYM
Tab. 7a: przeważająca liczba wyników z testem negatywnym jest
prawdziwie negatywnych (180/200=90.0%); również 90% (180/200)
wyników rozpoznanych jako pozytywne było naprawdę prawdziwie
pozytywnych.
Tab. 7b: niemal wszystkie wyniki z testem negatywnym są prawdziwie
negatywne (4410/4420=99.77%); tylko 16% (90/580) wyników rozpoznanych jako pozytywne było naprawdę prawdziwie pozytywnych.
INTERPRETACJA WYNIKÓW (6c)
• CZUŁOŚĆ I SWOISTOŚĆ NIE SĄ MIARĄ
PRZEWIDYWALNOŚCI TESTÓW; PROWADZĄ
DO TYM WIĘKSZEGO NIEPOROZUMIENIA, IM
CHOROBA JEST MNIEJ ROZPOWSZECHNIONA.
• WYSOKA CZUŁOŚĆ JEST WARUNKIEM
KONIECZNYM, ALE NIE WYSTARCZAJĄCYM,
ABY MÓC PRZEPROWADZIĆ DOBRY TEST
PROGNOSTYCZNY.
• UŻYTECZNOŚĆ TESTU ZALEŻY OD KOSZTÓW
ZWIĄZANYCH Z UZYSKANIEM WYNIKÓW
FAŁSZYWIE POZYTYWNYCH.
PORADNIK STATYSTYCZNY
W INTERNECIE
WERSJA POLSKA
http://www.statsoft.pl/textbook/stathome.html
WERSJA ANGIELSKA
http://www.statsoft.com/textbook/stathome.html
TYPY BADAŃ EMPIRYCZNYCH
•Korelacyjne - nie ingerujemy w żadne zmienne
lecz jedynie mierzymy je i poszukujemy zależności pomiędzy
niektórymi zespołami zmiennych
•Eksperymentalne- manipulujemy niektórymi zmiennymi ,następnie mierzymy wpływ tych manipulacji na
pozostałe zmienne
Dane z badań korelacyjnych nie są wystarczającym dowodem
istnienia związku przyczynowego.
ZAGADNIENIE KORELACJI I REGRESJI
metody korelacyjne badają istnienie ewentualnego związku między
dwoma lub większą liczbą zmiennych oraz szacują siłę i istotność
statystyczną tego związku.
Aby zbadać czy istnieje zależność między dwoma parametrami
na skali interwałowej należy stworzyć wykres przedstawiający
rozrzut par punktów doświadczalnych (tzw. scattergram), pozwala
on w pierwszym przybliżeniu określić kształt badanego związku.
Na osi OX - parametr, który
jest określany jako zmienna
niezależna.
Na osi OY - parametr, który
jest określany jako zmienna
zależna
KSZTAŁT ZALEŻNOŚCI
 liniowy
(y=ax+b, y=a1x1+ a2x2+...+ anxn+b)
 nieliniowy
( y=a*exp(-bx)+c, y=a*sin(b*x+c)
y= a1x12+ a2x22+a3x1x2+b)
y=a*ln(b*x1)+c*x2
ZŁOŻONOŚĆ MODELU
 Model jednowymiarowy
y=f(x)
 Model wielowymiarowy
y=f(x1, x2, x3, x4,........, xn)
 Analiza kanoniczna
(y1, y2, y3, y4,........, ym) = f (x1, x2, x3, x4,........, xn)
Współczynnik korelacji liniowej
Pearsona – skala interwałowa
Może on przyjmować wartości z zakresu od -1 do +1.
Wartość +1 oznacza całkowitą dodatnią zależność liniową, tj.
wszystkie punkty pomiarowe leżą idealnie na linii prostej a
wzrostowi zmiennej niezależnej odpowiada wzrost zmiennej zależnej
Wartość -1 to całkowita ujemna zależność liniowa - wszystkie
punkty doświadczalne leżą idealnie na linii prostej, lecz wzrostowi
zmiennej niezależnej odpowiada spadek zmiennej zależnej.
Gdy współczynnik korelacji liniowej przyjmuje wartość bliską zeru
wówczas nie istnieje liniowa zależność między badanymi
parametrami.
parametrami
Współczynnik korelacji rangowej
Spearmana – skala porządkowa
Gdzie Di – różnica rang dla
zmiennej zależnej i niezależnej
Może on przyjmować wartości z zakresu od -1 do +1.
Wartość +1 oznacza całkowitą dodatnią zależność - wzrostowi
zmiennej niezależnej odpowiada wzrost zmiennej zależnej
Wartość -1 to całkowita ujemna zależność - wzrostowi zmiennej
niezależnej odpowiada spadek zmiennej zależnej.
Gdy współczynnik korelacji przyjmuje wartość bliską zeru
wówczas nie istnieje liniowa zależność między badanymi
parametrami.
parametrami
Kształt zależności - regresja liniowa
Interpolacja polega na
^
Y
= a*X + b
przewidywaniu wartości zmiennej
zależnej na podstawie wartości
zmiennej niezależnej leżących
wewnątrz obszaru wcześniej
obserwowanych zmian zmiennej
niezależnej (a więc tego zakresu
zmiennej niezależnej, na podstawie
których zbudowano wykorzystywany
model). Interpolacja jest więc z
reguły procedurą bezpieczną zakłada się tu jedynie ciągłość
funkcji wyrażającej zależność obu
zmiennych.
Ekstrapolacja jest przewidywaniem wartości zmiennej zależnej dla tych
wartości zmiennej niezależnej, które leżą poza obszarem zmienności tej
zmiennej użytym do budowy modelu predykcyjnego. W przeciwieństwie
do interpolacji, ekstrapolacja bywa często zabiegiem ryzykownym.
Badanie istotności
współczynnika korelacji
Aby zbadać czy istnieje statystycznie istotna liniowa zależność
między dwoma zmiennymi korzystamy z testu na ocenę istotności
współczynnika Pearsona
H0: r = 0 (parametry X i Y są niezależne)
H1: r ≠ 0 (parametry X i Y są zależne)
gdy pt > α to H0gdy pt ≤ α to H1
Współczynnik determinacji - kwadrat współczynnika
korelacji. Wyraża on procent zmienności zmiennej
zależnej wytłumaczony zmiennością zmiennej
niezależnej.
Medical Statistics
at a Glance
Aviva Petrie
Head of Biostatistics Unit and Senior Lecturer
Eastman Dental Institute
University College London
256 Grays Inn Road
London WCIX 8LD and
Honorary Lecturer in Medical Statistics
Medical Statistics Unit
London School of Hygiene and Tropical Medicine
Keppel Street
London WC1E7HT
Caroline Sabin
Professor of Medical Statistics and Epidemiology
Department of Primary Care and Population Sciences
Royal Free and University College Medical School
Rowland Hill Street
London NW3 2PF
Second edition
Preface 6
Handling data
Types of data 8
Data entry 10
Error checking and outliers 12
Displaying data graphically 14
Describing data: the 'average' 16
Describing data: the 'spread' 18
Theoretical distributions: the Normal distribution 20
Theoretical distributions: other distributions 22
Transformations 24
Sampling and estimation
Sampling and sampling distributions 26
Confidence intervals 28
Study design
Study design I 30
Study design II 32
Clinical trials 34
Cohort studies 37
Case-control studies 40
Hypothesis testing
Hypothesis testing 42
Errors in hypothesis testing 44
Basic techniques for analysing data
Numerical data
Numerical data: a single group 46
Numerical data: two related groups 49
Numerical data: two unrelated groups 52
Numerical data: more than two groups 55
Categorical data
23
Categorical data: a single proportion 58
Categorical data: two proportions 61
Categorical data: more than two categories 64
Regression and correlation
Correlation 67
The theory of linear regression 70
Performing a linear regression analysis 72
Multiple linear regression 76
Binary outcomes and logistic regression 79
Rates and Poisson regression 82
Generalized linear models 86
Explanatory variables in statistical models 88
Issues in statistical modelling 91
Important considerations
Checking assumptions 94
Sample size calculations 96
Presenting results 99
Additional chapters
Diagnostic tools 102
Assessing agreement 105
Evidence-based medicine 108
Methods for clustered data 110
Regression methods for clustered data 113
Systematic reviews and meta-analysis 116
Survival analysis 119
Bayesian methods 122
Appendix
A Statistical tables 124
B Altman's nomogram for sample size calculations 131
C Typical computer output 132
D Glossary of terms 144
Spis treści
Przedmowa 6
Obsługa danych
Rodzaje danych 8
Wprowadzanie danych 10
Analiza błędów i wartości odskakujące 12
Graficzna prezentacja danych 14
Opisywanie danych: wartość średnia 16
Opisywanie danych: rozrzut 18
Rozkłady teoretyczne: rozkład normalny 20
Rozkłady teoretyczne: inne rozkłady 22
Transformacje 24
Próbkowanie I estymacja
Próbkowanie i rozkłady próbkowania 26
Przedział ufności 28
Planowanie badania
Planowanie badania I 30
Planowanie badania II 32
Badania kliniczne 34
Badania kohortowe 37
Badania przypadek-kontrola 40
Testowanie hipotez
Testowanie hipotez 42
Błędy pojawiające się w testowaniu hipotez 44
Podstawowe techniki analizy danych
Dane numeryczne
Dane numeryczne: pojedyńcza grupa 46
Dane numeryczne: dwie grupy powiązane 49
Dane numeryczne: dwie grupy niepowiązane 52
Dane numeryczne: więcej niż dwie grupy 55
Dane kategorialne
23
Dane kategorialne: jedna proporcja 58
Dane kategorialne: dwie proporcje 61
Dane kategorialne: więcej niż dwie kategorie 64
Regresja i korelacja
Korelacja 67
Teoria regresji liniowej 70
Przeprowadzanie analizy regresji liniowej 72
Wielokrotna regresja liniowa 76
Wyniki binarne i analiza logistyczna 79
Częstości i regresja Poissona 82
Uogólnione modele liniowe 86
Zmienne wyjaśniające w modelach statystycznych 88
Zagadnienia związane z modelowaniem statystycznym 91
Ważne rozważania
Sprawdzanie założeń 94
Wyznaczanie wielkości próby 96
Prezentacja wyników 99
Rozdziały dodatkowe
Narzędzia diagnostyczne 102
Oszacowywanie zgodności 105
Medycyna poparta dowodami 108
Metody dla danych zgrupowanych 110
Metody regresyjne dla danych zgrupowanych 113
Przeglądy systematyczne i meta-analiza 116
Analiza przeżycia 119
Metody bayesowskie 122
Dodatki
A Tablice statystyczne 124
B Nomogram Altmana do oszacowania wielkości próby 131
C Typowe wydruki komputerowe 132
D Słowniczek terminów statystycznych 144
Indeks 153
A
B
CZY ZAWSZE MĄDRZE
BRZMIĄCY TEKST MA
WARTOŚĆ NAUKOWĄ ?
CZYLI JAK NIE DAĆ SIĘ
WPUŚCIĆ W MALINY
1.Niektóre materiały ceramiczne nie mają
prekursorów występujących w wodzie pitnej, co
może sugerować, iż
Wielokrotny zapis przebiegu
omawianego procesu w pamięci
operacyjnej
Wskazuje na konieczność stosowania
konwencjonalnych metod dyfuzji lecz
Wyklucza dopuszczalność prowadzenia
badań na dużych zwierzętach
2.Uwzględniając doniesienia z piśmiennictwa
światowego ostatniego pięciolecia należy przyjąć, iż
Opisana zależność występowania
złamań kości śródręcza od rodzaju
zastosowanej pasty do zębów
Rzuca światło na znaczną skuteczność
wykorzystanej w badaniach aparatury i
Umożliwia końcowe uzyskanie
pozytywnego efektu strukturalnego bez
pochodnej funkcjonalnej
3.Przyjmując za pewnik wiarygodność wyników
badań prowadzonych na grupach dyspanseryjnych
uznaliśmy, że
Przebieg wykresów z tabel 49 i 50
prowadzi do konkluzji, która w
konsekwencji
Wskazuje, że nie ma różnic statystycznie
istotnych między przytaczanymi faktami a
także
Dowodzi, że rezultatem tych prac
powinno być wytyczenie dalszych
kierunków rozwoju dyscypliny
4.Dziękując Panu Profesorowi i Panu Dziekanowi za
udzielenie mi wielu cennych wskazówek, które
umożliwiły mi wykonanie tych badań, chciałbym
tylko jeszcze wspomnieć, że
Obserwowana nieuchronność
powstania korzystnych
oddziaływań w skali molekularnej
Przybliża wizję perspektywicznych
możliwości wykrywania źródeł
promieniowania i dodatkowo
Udowadnia całkowitą nieprzydatność
uprofilowanych pracowni w realizacji
zaplanowanych testów
5.Biorąc pod uwagę prawdopodobieństwo
wystąpienia zaburzeń o różnym podłożu z przewagą
niedomogi obu półkul należy założyć, że
Skądinąd znane zjawisko
przedstawione przez mojego
przedmówcę
Przesądza o znaczącym wpływie
omawianych zagadnień na problemy
ochrony środowiska zewnętrznego a także
Potwierdza a tergo postawioną przeze
mnie osiem lat temu hipotezę zerową
6.Obserwując lansowany przez media określony
wzorzec zachowań prozdrowotnych jesteśmy
przekonani, iż
Dobór odpowiednich technik
wizualizacji oraz zamiar
optymalizacji wyników za wszelką
cenę
Narzuca konieczność wykonania analizy
statystycznej dokładnym testem Fischera,
niemniej
Zaprzecza powszechnie panującemu
przekonaniu o fatalnym wpływie
alkoholu etylowego na obyczaje godowe
naczelnych
7.Podsumowując wyniki przeprowadzonych badań i
krótkoterminowe własne obserwacje dochodzimy do
wniosku, że
Krótki czas inkubacji i łatwość
buforowania opisanego na
początku mojego wystąpienia
roztworu
Przywodzi na myśl badania komputerowe
prowadzone w sztokholmskim Instytucie
Biotechnologii jeszcze w latach
pięćdziesiątych a także
Daje pojęcie o niestosowalności w
codziennej praktyce testów T – Studenta
i Chi kwadrat
8.Część autorów reprezentuje
dyskutowany obecnie szeroko pogląd, że
Stosowanie opisanej szczegółowo
w innych moich doniesieniach
metodyki
Wynika w sposób oczywisty li tylko z
charakteru tego procesu oraz
Prowadzi do wniosku, że osiągnięcie celu
jest uzależnione od ścisłej współpracy
dwóch zespołów badawczych
9.Dane z tomografii komputerowej i badań
chromatograficznych jednakże przeczą temu, że
Występowanie
nieprzewidywalnych czynników
mających wpływ na końcowe
wyniki
Wprowadza stały element zagrożenia
możliwością pojawienia się fazy gazowej co
Zadowala większość zwolenników teorii
behawioralnej
10.Oceniając efekty pomiarów wykorzystujących
efekt Schwarza możemy dojść do wniosku, że
Znany niekorzystny wpływ
omawianego zjawiska na przebieg
reakcji
Może doprowadzić tylko do wyczerpania
szczupłych zasobów uczelni oraz
Przypomina o konieczności
wprowadzenia bardziej precyzyjnych
parametrów
B
C
D
A
JEŻELI NIE JESTEŚ PEWNY JAK ANALIZOWAĆ
SWOJE DANE - PROSZĘ, NIE NISZCZ
SWOJEGO KOMPUTERA
SKONTAKTUJ SIĘ ZE STATYSTYKIEM