Przykłady bloków: Przyporządkowanie Przykład
Transkrypt
Przykłady bloków: Przyporządkowanie Przykład
Wykład 10 Zrandomizowany plan blokowy • Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności’’ wewnątrz każdej grupy zabiegowej. • Dzielimy obiekty na bloki: Blok to grupa podobnych obiektów Podobieństwo dotyczy wartości zmiennych ubocznych (``zakłócających’’). Powinniśmy uwzględniać jedynie zmienne mogące mieć wpływ na wynik eksperymentu. Przykłady bloków: • Owocówki z jednej linii wsobnej • Pacjenci podobni pod względem wieku (płci, diagnozy i/lub historii choroby, itp.) • Rośliny kukurydzy rosnące na tym samym stanowisku Przyporządkowanie Przykład • Obiekty dzielimy na jednorodne bloki, biorąc pod uwagę zmienne uboczne mogące mieć wpływ na wynik eksperymentu. • Dokonujemy randomizacji w obrębie każdego z bloków (losowo przyporządkowujemy obiekty z bloku do poszczególnych zabiegów). • W każdej grupie zabiegowej otrzymujemy tę samą liczbę obiektów z każdego bloku • Tak więc rozkłady zmiennych ubocznych w grupach zabiegowych są podobne. Porównujemy efekt działania nowego lekarstwa z placebo: • Obiekty – ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi • Niektóre miały lumpektomię, inne radykalną mastektomię (2) • Niektóre były po naświetlaniach, inne nie (2) • U niektórych zidentyfikowano ryzyko genetyczne BRCA1, BRCA2, u innych nie (3) • Dzielimy pacjentki na 2×2×3=12 bloków, tzn.: • Inne czynniki używane do blokowania: lumpektomia, naświetlania, BRCA1 lumpektomia, naświetlania, BRCA2, …. mastektomia, brak naświetlań, bez ryz. gen. • W każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga--placebo • Dlatego grupy kobiet biorących lekarstwo i placebo mają podobną strukturę Laboratorium lub osoba dokonująca pomiarów Laboratorium lub osoba wykonująca zabieg Geografia Genetyka Czynniki socjo-ekonomiczne • Blokujemy tylko względem tych czynników, które mogą mieć wpływ na odpowiedź. 1 Powiązane pary Stratyfikacja • Jest to „blokowanie” względem zmiennej ubocznej, której wartości można uporządkować (np. ilościowej). • Dzielimy na tzw. warstwy (zamiast na bloki). • Przykłady: • Obserwacje występują w parach • Przykłady: Układ blokowy dla dwu zabiegów, gdzie każdy blok składa się z dwu obiektów Dwa pomiary na tym samym obiekcie (dwa kolejne dni, dwie strony, przed/po…) Obserwujemy dwie grupy w czasie – Niskie, średnie, wysokie dochody – Grupy wiekowe – Stopień rozwoju choroby • Randomizujemy w obrębie każdej warstwy. • Czasami definiujemy warstwy przed próbkowaniem, aby pobrać podobną liczbę obserwacji z każdej; próbkowanie warstwowe. Przykłady cd.: Test Studenta dla powiązanych par • Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków • Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby itd. • Ten sam obiekt mierzony przy dwu okazjach • Do produkcji butów używamy dwóch różnych materiałów: A i B. • Obserwacje: zużycie podeszew w butach noszonych przez 10 chłopców. – Każdy chłopiec ma podeszwę w jednym bucie zrobioną z materiału A, a w drugim z materiału B – Randomizujemy (A na lewy albo na prawy) A-B 1 13.2 14.0 -0.8 2 8.2 8.8 -0.6 … … … …. 10 13.3 13.6 -0.3 wear B 10 A 8 Chłopiec 12 14 Zużycie podeszew średnia -0.41 s 0.38 2 4 6 8 10 boys 2 0.8 1.0 14 b-a 0.2 0.4 0.6 12 10 -0.2 0.0 8 A B 2 4 6 8 10 • Hipoteza – H0 : µd = µA - µB=0 – Ha : µd ≠ 0 • • • • Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d) liczymy ts = średnia(d)/SE(d) = df = nd-1= P-wartość= • Tablica wartości krytycznych z książki ``Introduction to the Practice of Statistics’’, D.S. Moore, G. P. McCabe • Co się stanie, jeżeli wykonamy test Studenta dla prób niezależnych ? • Ta sama hipoteza Y1 • Y2 =10.63, SEY1 −Y2 =1.11 • ts=(10.63-11.04)/1.11=-0.369 • P-wartość = Skąd taka rozbieżność? • Bardzo różne SE =11.04 – Test dla par : SE = 0.12 – Test dla dwóch niezależnych prób: SE=1.11 • Duże zróżnicowanie między obiektami może ukryć wpływ zabiegu! • To zróżnicowanie można zneutralizować łącząc obiekty w pary (neutralizujemy wpływ zmiennej ubocznej=ruchliwość dziecka). 3 Kiedy użyć testu dla par, a kiedy testu dla niezależnych prób ? Na ogół łatwo stwierdzić, czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej. Założenie • Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny. Kiedy zaplanować eksperyment w oparciu o powiązane pary ? Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki jednorodne ze względu na zmienne zakłócające. Test znaków • Co zrobić jeżeli obserwacje nie mają rozkładu normalnego? • Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya. • Gdy występują sparowane obserwacje możemy zastosować prosty test znaków. • Obliczamy znak różnicy między pierwszym i drugim elementem każdej pary obserwacji. • Jeżeli zabiegi się nie różnią efektem, to p-stwo, że w dowolnej parze dostaniemy plus powinno być ½. • Liczba plusów powinna być w przybliżeniu równa liczba minusów. • Niech n = #par z niezerowymi wynikami. • Statystyka testowa Bs = max(N+, N–) dla testu dwustronnego • Wartości krytyczne na kolejnym slajdzie. (dla testu jedno i dwustronnego) • Odrzucamy H0, gdy Bs ≥ wartości krytycznej • Można też obliczyć p-wartości korzystając ze wzoru na rozkład dwumianowy z p=½. • π = p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi. • H0: π = ....... • HA: π ........ • Dla każdej pary obserwacji zapisujemy (+) gdy y1–y2 jest dodatnie lub (–) gdy jest ujemne • Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy zer) CRITICAL VALUES FOR THE SIGN TEST, N = 5..44 Alpha | 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 | 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) | ------+-------------------------------------------------+---N| ----| 5| 5 . . . . . 6| 6 6 . . . . 7| 7 7 7 . . . 8| 7 8 8 8 . . 9| 8 8 9 9 9 . | | 10 | 9 9 10 10 10 10 11 | 9 10 10 11 11 11 12 | 10 10 11 11 12 12 13 | 10 11 12 12 12 13 14 | 11 12 12 13 13 13 | | 15 | 12 12 13 13 14 14 16 | 12 13 14 14 14 15 17 | 13 13 14 15 15 16 18 | 13 14 15 15 16 16 19 | 14 15 15 16 16 17 | | 20 | 15 15 16 17 17 18 21 | 15 16 17 17 18 18 22 | 16 17 17 18 18 19 23 | 16 17 18 19 19 20 24 | 17 18 19 19 20 20 | This public domain table was made by William Knight <http://www.math.unb.ca/~knight> 4 CRITICAL VALUES FOR THE SIGN TEST, N =25..44 Alpha | 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 | 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) | 25 | 26 | 27 | 28 | 29 | | 30 | 31 | 32 | 33 | 34 | | 35 | 36 | 37 | 38 | 39 | | 40 | 41 | 42 | 43 | 44 | 18 18 19 19 20 18 19 20 20 21 19 20 20 21 22 20 20 21 22 22 20 21 22 22 23 21 22 23 23 24 22 23 24 24 25 23 24 24 25 25 23 24 24 25 26 24 25 25 26 27 25 26 27 27 28 26 27 27 28 28 26 27 27 28 28 27 28 28 29 29 28 29 29 30 31 29 30 30 31 31 20 21 22 22 23 | 24 24 25 25 26 | 27 27 28 29 29 | 30 30 31 32 32 | 21 22 22 23 24 • Dla testu jednostronnego • albo HA jest π < 0.5 (w dowolnej parze druga obserwacja ma większą szansę być większa) (Bs = N–), • albo HA jest π > 0.5 (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (Bs = N+) 24 25 26 26 27 27 28 29 29 30 31 31 32 32 33 P-wartość Przykład: przeszczepy skóry • Niech Y ma rozkład dwumianowy (n, 0.5) • Gdy HA jest π > 0.5, wtedy Bs = N+, i Pwartość wynosi Pr(Y ≥ Bs ) • Gdy HA jest π < 0.5, wtedy Bs = N–, i Pwartość wynosi Pr(Y ≥ Bs ) • Gdy HA jest π ≠ 0.5, wtedy Bs = max(N+, N–), i P-wartość wynosi 2×Pr(Y ≥ Bs ) dobre 37 19 57 93 16 23 20 63 29 60 18 złe 29 13 15 26 11 18 26 43 18 42 19 znak + + + + + + - + + + - • Po dwóch stronach ciała 11 ochotników zastosowano przeszczepy skóry. • Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie. • Obserwujemy czas do odrzucenia przeszczepu (nie ma on rozkładu normalnego, więc nie można stosować testu Studenta). • Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu ? 5 Test znakowany Wilcoxona • Podobny do testu znaków, ale bardziej czuły • Metoda • Testu znaków używamy, gdy dane nie mają rozkładu normalnego, lub dane zapisane są w postaci preferencji, a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp. – Liczymy różnice w parach – Znajdujemy wartość bezwzględną – Przyporządkowujemy rangi wartościom bezwzględnym (1 dla najmniejszej, n dla największej) – Każdej randze przyporządkowujemy jej znak (+,-) Obs • • • • W+ : suma rang dodatnich W - : suma rang ujemnych Ws : min(W +, W -) Odrzucamy H0 gdy W s ≤ wartość krytyczna Y1 Y2 d |d| Ranga Ranga Znakowana 1 33 25 8 8 6 6 2 39 38 1 1 1 1 3 25 27 -2 2 2 -2 4 29 20 9 9 7 7 5 50 54 -4 4 3 -3 6 45 40 5 5 4 4 7 36 30 6 6 5 5 Tabela wartości krytycznych jest dostępna w kartotece z wykładami. Źródło: http://fsweb.berry.edu/academic/education/vbissonnette/tables/wilcox_t.pdf Przed & Po vs. Grupa kontrolna • Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty Dostajemy pary zależnych obserwacji • Czasem parujemy podobne (ze względu na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej Również dostajemy pary zależnych obserwacji • Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary Takie obserwacje traktujemy jako dwie niezależne próby 6 • Niekiedy oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu. Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu Obiekty w grupie kontrolnej dostarczają nam informacji, jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu. Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu Cztery grupy obserwacji Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par. Podobnie obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par. Dowiemy się czy była zmienność w każdej z grup. Naprawdę interesuje nas jednak porównanie zmian wartości cechy (między grupą zabiegową i kontrolną) Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu niezależnych prób (zabiegowej i kontrolnej) 7