Przykłady bloków: Przyporządkowanie Przykład

Transkrypt

Przykłady bloków: Przyporządkowanie Przykład
Wykład 10
Zrandomizowany plan blokowy
• Staramy się kontrolować efekty zróżnicowania
badanych jednostek eksperymentalnych
poprzez zapewnienie ich ``jednorodności’’
wewnątrz każdej grupy zabiegowej.
• Dzielimy obiekty na bloki:
Blok to grupa podobnych obiektów
Podobieństwo dotyczy wartości zmiennych
ubocznych (``zakłócających’’).
Powinniśmy uwzględniać jedynie zmienne mogące
mieć wpływ na wynik eksperymentu.
Przykłady bloków:
• Owocówki z jednej linii wsobnej
• Pacjenci podobni pod względem wieku
(płci, diagnozy i/lub historii choroby, itp.)
• Rośliny kukurydzy rosnące na tym samym
stanowisku
Przyporządkowanie
Przykład
• Obiekty dzielimy na jednorodne bloki, biorąc pod
uwagę zmienne uboczne mogące mieć wpływ
na wynik eksperymentu.
• Dokonujemy randomizacji w obrębie każdego z
bloków (losowo przyporządkowujemy obiekty z
bloku do poszczególnych zabiegów).
• W każdej grupie zabiegowej otrzymujemy tę
samą liczbę obiektów z każdego bloku
• Tak więc rozkłady zmiennych ubocznych w
grupach zabiegowych są podobne.
Porównujemy efekt działania nowego lekarstwa z placebo:
• Obiekty – ochotniczki, u których w ciągu ostatniego roku
stwierdzono raka piersi
• Niektóre miały lumpektomię, inne radykalną
mastektomię (2)
• Niektóre były po naświetlaniach, inne nie (2)
• U niektórych zidentyfikowano ryzyko genetyczne
BRCA1, BRCA2, u innych nie (3)
• Dzielimy pacjentki na 2×2×3=12 bloków, tzn.:
• Inne czynniki używane do blokowania:
lumpektomia, naświetlania, BRCA1
lumpektomia, naświetlania, BRCA2,
….
mastektomia, brak naświetlań, bez ryz. gen.
• W każdym bloku losowo wybrana połowa kobiet
otrzymuje lekarstwo, a druga--placebo
• Dlatego grupy kobiet biorących lekarstwo i
placebo mają podobną strukturę
Laboratorium lub osoba dokonująca pomiarów
Laboratorium lub osoba wykonująca zabieg
Geografia
Genetyka
Czynniki socjo-ekonomiczne
• Blokujemy tylko względem tych czynników,
które mogą mieć wpływ na odpowiedź.
1
Powiązane pary
Stratyfikacja
• Jest to „blokowanie” względem zmiennej
ubocznej, której wartości można uporządkować
(np. ilościowej).
• Dzielimy na tzw. warstwy (zamiast na bloki).
• Przykłady:
• Obserwacje występują w parach
• Przykłady:
Układ blokowy dla dwu zabiegów, gdzie
każdy blok składa się z dwu obiektów
Dwa pomiary na tym samym obiekcie
(dwa kolejne dni, dwie strony, przed/po…)
Obserwujemy dwie grupy w czasie
– Niskie, średnie, wysokie dochody
– Grupy wiekowe
– Stopień rozwoju choroby
• Randomizujemy w obrębie każdej warstwy.
• Czasami definiujemy warstwy przed
próbkowaniem, aby pobrać podobną liczbę
obserwacji z każdej; próbkowanie warstwowe.
Przykłady cd.:
Test Studenta dla powiązanych par
• Obiekty naturalnie występują w parach,
takich jak pary identycznych blizniaków
• Obiekty łaczymy w pary o podobnym
wieku, płci, zawodzie, stanie rozwoju
choroby itd.
• Ten sam obiekt mierzony przy dwu
okazjach
• Do produkcji butów używamy dwóch
różnych materiałów: A i B.
• Obserwacje: zużycie podeszew w butach
noszonych przez 10 chłopców.
– Każdy chłopiec ma podeszwę w jednym bucie
zrobioną z materiału A, a w drugim z
materiału B
– Randomizujemy (A na lewy albo na prawy)
A-B
1
13.2
14.0
-0.8
2
8.2
8.8
-0.6
…
…
…
….
10
13.3
13.6
-0.3
wear
B
10
A
8
Chłopiec
12
14
Zużycie podeszew
średnia
-0.41
s
0.38
2
4
6
8
10
boys
2
0.8
1.0
14
b-a
0.2
0.4
0.6
12
10
-0.2
0.0
8
A
B
2
4
6
8
10
• Hipoteza
– H0 : µd = µA - µB=0
– Ha : µd ≠ 0
•
•
•
•
Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d)
liczymy ts = średnia(d)/SE(d) =
df = nd-1=
P-wartość=
• Tablica wartości krytycznych z książki
``Introduction to the Practice of Statistics’’,
D.S. Moore, G. P. McCabe
• Co się stanie, jeżeli wykonamy test Studenta dla prób
niezależnych ?
• Ta sama hipoteza
Y1
•
Y2
=10.63,
SEY1 −Y2
=1.11
• ts=(10.63-11.04)/1.11=-0.369
• P-wartość =
Skąd taka rozbieżność?
• Bardzo różne SE
=11.04
– Test dla par : SE = 0.12
– Test dla dwóch niezależnych prób: SE=1.11
• Duże zróżnicowanie między obiektami
może ukryć wpływ zabiegu!
• To zróżnicowanie można zneutralizować
łącząc obiekty w pary (neutralizujemy
wpływ zmiennej ubocznej=ruchliwość
dziecka).
3
Kiedy użyć testu dla par, a kiedy testu dla
niezależnych prób ?
Na ogół łatwo stwierdzić, czy istnieją naturalne
pary obiektów z jednej i drugiej grupy
zabiegowej.
Założenie
• Test Studenta dla par jest oparty na
założeniu, że różnice mają w przybliżeniu
rozkład normalny.
Kiedy zaplanować eksperyment w oparciu o
powiązane pary ?
Trudniejsze: oczekujemy, że zmienne zakłócające
mogą istotnie zwiększyć rozrzut wyników i
staramy się utworzyć dwuelementowe bloki
jednorodne ze względu na zmienne zakłócające.
Test znaków
• Co zrobić jeżeli obserwacje nie mają rozkładu
normalnego?
• Dla dwóch niezależnych prób liczyliśmy test
Wilcoxona-Manna-Whitneya.
• Gdy występują sparowane obserwacje możemy
zastosować prosty test znaków.
• Obliczamy znak różnicy między pierwszym i drugim
elementem każdej pary obserwacji.
• Jeżeli zabiegi się nie różnią efektem, to p-stwo, że w
dowolnej parze dostaniemy plus powinno być ½.
• Liczba plusów powinna być w przybliżeniu równa
liczba minusów.
• Niech n = #par z niezerowymi wynikami.
• Statystyka testowa Bs = max(N+, N–)
dla testu dwustronnego
• Wartości krytyczne na kolejnym slajdzie.
(dla testu jedno i dwustronnego)
• Odrzucamy H0, gdy Bs ≥ wartości
krytycznej
• Można też obliczyć p-wartości korzystając
ze wzoru na rozkład dwumianowy z p=½.
• π = p-stwo, że w dowolnej ustalonej parze
pierwszy zabieg daje lepszy wynik niż drugi.
• H0: π = .......
• HA: π ........
• Dla każdej pary obserwacji zapisujemy (+) gdy
y1–y2 jest dodatnie lub (–) gdy jest ujemne
• Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy
zer)
CRITICAL VALUES FOR THE SIGN TEST, N = 5..44
Alpha
|
1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |
2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |
------+-------------------------------------------------+---N|
----|
5|
5
.
.
.
.
.
6|
6
6
.
.
.
.
7|
7
7
7
.
.
.
8|
7
8
8
8
.
.
9|
8
8
9
9
9
.
|
|
10 |
9
9
10
10
10
10
11 |
9
10
10
11
11
11
12 |
10
10
11
11
12
12
13 |
10
11
12
12
12
13
14 |
11
12
12
13
13
13
|
|
15 |
12
12
13
13
14
14
16 |
12
13
14
14
14
15
17 |
13
13
14
15
15
16
18 |
13
14
15
15
16
16
19 |
14
15
15
16
16
17
|
|
20 |
15
15
16
17
17
18
21 |
15
16
17
17
18
18
22 |
16
17
17
18
18
19
23 | 16
17
18
19
19
20
24 | 17
18
19
19
20
20
|
This public domain table was made by
William Knight <http://www.math.unb.ca/~knight>
4
CRITICAL VALUES FOR THE SIGN TEST, N =25..44
Alpha
|
1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |
2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |
25 |
26 |
27 |
28 |
29 |
|
30 |
31 |
32 |
33 |
34 |
|
35 |
36 |
37 |
38 |
39 |
|
40 |
41 |
42 |
43 |
44 |
18
18
19
19
20
18
19
20
20
21
19
20
20
21
22
20
20
21
22
22
20
21
22
22
23
21
22
23
23
24
22
23
24
24
25
23
24
24
25
25
23
24
24
25
26
24
25
25
26
27
25
26
27
27
28
26
27
27
28
28
26
27
27
28
28
27
28
28
29
29
28
29
29
30
31
29
30
30
31
31
20
21
22
22
23
|
24
24
25
25
26
|
27
27
28
29
29
|
30
30
31
32
32
|
21
22
22
23
24
• Dla testu jednostronnego
• albo HA jest π < 0.5 (w dowolnej parze
druga obserwacja ma większą szansę być
większa) (Bs = N–),
• albo HA jest π > 0.5 (w dowolnej parze
pierwsza obserwacja ma większą szansę
być większa) (Bs = N+)
24
25
26
26
27
27
28
29
29
30
31
31
32
32
33
P-wartość
Przykład: przeszczepy skóry
• Niech Y ma rozkład dwumianowy (n, 0.5)
• Gdy HA jest π > 0.5, wtedy Bs = N+, i Pwartość wynosi Pr(Y ≥ Bs )
• Gdy HA jest π < 0.5, wtedy Bs = N–, i Pwartość wynosi Pr(Y ≥ Bs )
• Gdy HA jest π ≠ 0.5, wtedy Bs = max(N+,
N–), i P-wartość wynosi 2×Pr(Y ≥ Bs )
dobre
37
19
57
93
16
23
20
63
29
60
18
złe
29
13
15
26
11
18
26
43
18
42
19
znak
+
+
+
+
+
+
-
+
+
+
-
• Po dwóch stronach ciała 11 ochotników
zastosowano przeszczepy skóry.
• Jeden przeszczep ma dobre dopasowanie HLA
z odbiorca, drugi nie.
• Obserwujemy czas do odrzucenia przeszczepu
(nie ma on rozkładu normalnego, więc nie
można stosować testu Studenta).
• Czy dobre dopasowanie HLA zwiększa czas
przetrwania przeszczepu ?
5
Test znakowany Wilcoxona
• Podobny do testu znaków, ale bardziej czuły
• Metoda
• Testu znaków używamy, gdy
dane nie mają rozkładu normalnego, lub
dane zapisane są w postaci preferencji,
a nie wielkości liczbowej, np.
lepsze/gorsze, mniejsze/większe itp.
– Liczymy różnice w parach
– Znajdujemy wartość bezwzględną
– Przyporządkowujemy rangi wartościom
bezwzględnym (1 dla najmniejszej, n dla
największej)
– Każdej randze przyporządkowujemy jej znak (+,-)
Obs
•
•
•
•
W+ : suma rang dodatnich
W - : suma rang ujemnych
Ws : min(W +, W -)
Odrzucamy H0 gdy W s ≤ wartość krytyczna
Y1
Y2
d
|d|
Ranga
Ranga
Znakowana
1
33
25
8
8
6
6
2
39
38
1
1
1
1
3
25
27
-2
2
2
-2
4
29
20
9
9
7
7
5
50
54
-4
4
3
-3
6
45
40
5
5
4
4
7
36
30
6
6
5
5
Tabela wartości krytycznych jest dostępna w
kartotece z wykładami. Źródło:
http://fsweb.berry.edu/academic/education/vbissonnette/tables/wilcox_t.pdf
Przed & Po vs. Grupa kontrolna
• Czasami obserwujemy obiekty przed i po
pewnym zabiegu i mierzymy wpływ
zabiegu na poszczególne obiekty
Dostajemy pary zależnych obserwacji
• Czasem parujemy podobne (ze względu
na zmienne zakłócające) obiekty z grupy
zabiegowej i kontrolnej
Również dostajemy pary zależnych
obserwacji
• Czasami obiektów w grupie kontrolnej i
zabiegowej nie można w naturalny sposób
połączyć w pary
Takie obserwacje traktujemy jako dwie
niezależne próby
6
• Niekiedy oczekujemy, że obiekty w naturalny
sposób się zmieniają w trakcie eksperymentu.
Chcemy odróżnić zmiany wywołane zabiegiem
od zmian wynikających z upływu czasu
Obserwujemy grupę zabiegową i kontrolną
przed i po zabiegu
Obiekty w grupie kontrolnej dostarczają nam
informacji, jakiej zmiany należy oczekiwać
jedynie w wyniku upływu czasu. Obiekty w
grupie zabiegowej dostarczają nam informacji o
wpływie zabiegu
Cztery grupy obserwacji
Możemy porównać obiekty z grupy zabiegowej
przed i po zabiegu za pomocą testu dla par.
Podobnie obiekty z grupy kontrolnej możemy
porównać przed i po zabiegu za pomocą testu
dla par.
Dowiemy się czy była zmienność w każdej z
grup.
Naprawdę interesuje nas jednak porównanie
zmian wartości cechy (między grupą
zabiegową i kontrolną)
Zwykle w takim przypadku analizujemy różnice
po-przed za pomocą testu dla dwu
niezależnych prób (zabiegowej i kontrolnej)
7