plik pdf

Transkrypt

plik pdf
Errata do wydania I
Dziękuję uważnym czytelnikom za wyśledzenie poniższych usterek. Szczególnie dziękuję Krzysztofowi Trajkowskiemu, Michałowi Lewickiemu, Barbarze Rubikowskiej, Janowi Gąsce i Dominice Nowickiej, którzy znaleźli wiele
z poniższych błędów.
Gdzie
strona x linia 21
strona x linia 17
strona 9 linia 14
Jest
zmatematyowanych
che
pytaniem
Powinno być
zmatematyzowanych
chce
pytanie
strona 12 linia 10
E
E
strona
strona
strona
strona
strona
strona
strona
strona
strona
δ
δθlnf (x;θ)
2
strona
strona
strona
strona
strona
strona
strona
strona
strona
strona
strona
strony
21 linia -8
24 linia 10
24 linia 14
25 linia 3
31 linia 8
35 linia -1
36 linia 3
36 linia 8
36 linia -7
39 linia -3
40 linia -8
40, 41, 66, 68, 71, 97
q≤p
βp−q+1
i>p−q
interpretacje
X β̂X − X β̂W
gdy długość wektora x0 jest ustalona.
to zmieniamy rozkład β̂
zmieniamy rozkład ŷ
|CA|2
i statystyka T200 = |yC|+|CB|2
jest rów0
noważna T2 , ponieważ |CB| i |CA| są
prostopadłe. Oznacza to, że wynik testowania z użyciem statystyk T20 i T200
będzie identyczny, niezależnie od tego,
czy Z będzie w modelu.
odrzucimy
współczynniki β i σ 2
współczynniki β i σ 2
bo
macierzowej
model (2.3)
modelu (2.3)
modelu 2.3
modelu (2.3)
funckji
l(θ|x)
brak kursywy
strona
strona
strona
strona
strona
45
45
45
46
46
hi -te
Ponieważ hi
ristd =
stosowama
oceny β na obserwację i
16
16
16
17
18
19
19
19
21
linia -13
linia -12
linia -10
linia -6
rysunek 1.4
linia -9
linia -7
linia -6
linia 3
linia
linia
linia
linia
linia
-8
-7
-1
13
14
δ
δθ
2
ln f (x; θ)
p−q
βq+1
i>q
interpretację
X β̂X − W β̂W
gdy zbiór zmiennych X jest ustalony.
ocena β̂ ma inny rozkład
inny jest też rozkład ŷ
2
. Więc statystyka T200 = |CA|
jest bliska
|yB|2
2
statystce T20 = |yB||CA|
2 +|BC|2 . Oznacza to,
że wynik testowania z użyciem statystyk T20 i T200 będzie podobny, niezależnie od tego, czy Z będzie w modelu.
najprawdopodobniej odrzucimy
współczynniki β i parametr σ 2
współczynniki β i parametr σ 2
do
wektorowej
model (2.2)
modelu (2.2)
modelu (2.2)
modelu (2.2)
funkcji
l(β, σ|y)
w kodzie R komentarz powinien być jasnoszary oraz pisany kursywą
hi
Ponieważ wartości hi
ri
r ∼ N (0, (I −H)σ 2 ),
ristd = sd(r
=
i)
stosowana
obserwacji i na ocenę β
Pn strona 46 linia 17
strona 46 linia -9
strona 47 linia -13
strona 50 podpisy osi dwóch
ostatnich wykresów
strona 63 linia -14
strona 63 linia -13
strona 66 linia -6
strona 68 linia -15
strona 73 linia 2
strona 73 linia 3
j=1
Di =
Di = Pn
2
hi ri
1−hi σ̂ 2
j=1
xj β̂−xj βd
(−i)
2
(y−xj β̂ )
2
/(n−p)
bliska macierzy permutowalnej
lm(y − x)
= hi ristd,2
macierzą permutowalną
lm(y ∼ x)
niezrównażonego
zrównażonego
przedstawione
hiptoez
jest wysoka
maleje
niezrównoważonego
równoważonego
przedstawiona
hipotez
następuje później
następuje wcześniej
hi
2
1−hi ri
1
/p
=
Gdzie
strona 74 linia 22
strona 74 linia -16
strona 79 linia 15
strona 80 linia 15
strona 81 linia -17
strona 87 linia 1
strona 88 linia 2
strona 89 linia -9
strona 94 linia 1
strona 94 linia 3
strona 94 linia 4
strona 94 linia 5
strona 94 linia 7
strona 103 linia -15
strona 103 linia -12
strona 104 linia 9
strona 105 linia 8
Jest
że nie traci się wtedy kontroli
wprowadzenie
p.adj=”holm”
korektę Holma
fligner.test(). Funkcja levene.test()
nieliniowość
linowych
ograniczonych
NfkB (a) i CD28 (b)
Po lewej stronie
poziomem
Na prawym wykresie
NfkB (a) i IFN (b); wykresy
. Oto typowe przykłady:
województwa
yijk wartość k-tego
(jeżeli przyjmiemy alternatywną parametryzację, to
)
zmiennej x2. Opowiadający
0,18
wyłączenie
”miasto”
relacje
co do parametrów
średnimi
strona
strona
strona
strona
strona
strona
strona
strona
105
105
107
110
110
111
112
112
linia
linia
linia
linia
linia
linia
linia
linia
10
-2
8
4
-20
-6
11
-16
strona
strona
strona
strona
strona
114
114
117
118
118
linia
linia
linia
linia
linia
-7
-6
3
5
15
stężeniem
intensywnością
się w fazie p-folikularnej.
0.25
tylko p-wartości. Prześledźmy każdy z
tych modeli w szczegółach.
strona
strona
strona
strona
118
119
119
119
linia
linia
linia
linia
-1
1
2
3
strona
strona
strona
strona
119
119
120
120
linia
linia
linia
linia
-3
-2
1
8
strona 123 linia 15
dla zmiennej X
zmiennej Z
zmiennych
istotność pary obu zmiennych, jeżeli
porównać ją do modelu pustego.
zmiennej X
Z
podania
gdy używaliśmy analizy dwukierunkowej, gdyż porównywany model ma w
zakłócenie losowe
określając argument k
strona 123 linia 18
,
strona 123 linia -11
Jeżeli jest w nim wyraz wolny, to najmniejszy model zawiera tylko wyraz
wolny. Jeżeli w modelu M nie ma wyrazu wolnego to mały model oznacza
model tylko z zerem.
liczbę
n
strona 123 linia -6
strona 124 linia -10
2
Powinno być
że traci się wtedy kontrolę
wprowadzenia
p.adj=”bonferroni”
korektę Bonferroniego
levene.test(). Funkcja ta
nieliniową
liniowych
ograniczeniach
NfkB i CD28
Na wykresie (a)
poziomom
Na wykresie (b)
NfkB i IFN. Wykresy
, kilka typowych to:
gminy
yi,j,m wartość m-tego
, która w alternatywnej parametryzacji
zmiennej x1. Odpowiadający
0,4936
wyłącznie
”city”
relację
współczynnikami zależności liniowych
w grupach
ilością
ilość
w folikularnej fazie cyklu (p).
0,25
p-wartości dla pięciu różnych testów
dotyczących hipotez o zerowości współczynników βX i βZ .
istotności współczynnika βX
współczynnika βZ
współczynników
istotność pary obu współczynników testowanych jednocześnie.
współczynnika βX
współczynnika βZ
uwzględniania
powyżej, gdyż w efekcie Residuals jest
wskazując argument o nazwie k tej
funkcji, który odpowiada wartości h z
powyższego opisu.
przecinek powinien być po wzorach a
nie przed
Jeżeli w modelu M jest wyraz wolny,
to model M0 zawiera tylko wyraz wolny. Jeżeli w modelu M nie ma wyrazu
wolnego M0 oznacza model bez współczynników.
p — liczbę
liczba obserwacji n
Gdzie
strona 124 linia -4
Jest
jest całkowicie losowa.
strona 124 linia -1
strona 125 linia 1
dla podobnych symulowanych danych
mamy p = 99 i n = 100.
Problemem jest
strona
strona
strona
strona
strona
strona
strona
strona
strona
strona
strona
126
126
126
126
127
130
132
134
134
135
137
linia
linia
linia
linia
linia
linia
linia
linia
linia
linia
linia
i-tej
najbardziej skorelowane
rnorm(rnorm(9800))
PCA
rnorm(rnorm(9800))
o elastazie nie ma zbyt wielu zmiennych
zmiennej
(params[,1])
(params[,3])
mieć wpływ na cechę
testu F.
strona
strona
strona
strona
strona
137
145
150
150
158
linia -3
linia 9
linia 10
(3.7)
linia 5
13
-8
-7
-2
3
5
5
9
12
-8
-6
xyplot(pval~pozycja|chr
przymniemy
Zobaczmy to na przykładzie.
|V (θ)|
XT
"
strona 158 linia -3
strona
strona
strona
strona
strona
strona
strona
strona
strona
strona
4
strona
strona
strona
strona
strona
strona
174 linia 3
174 linia -3
198 linia -11
204 linia 2
204 linia 4
204 linia 7
210 linia 3
211 linia 7
237 linia -5
271 tabela 5.12 wiersz
312
316
316
317
317
318
linia
linia
linia
linia
linia
linia
6
-7
-6
11
-3
3
#
XT X
XT Z
T
T
Z X Z Z + D̂−1
dane krowa
statystki Walda
Argument lower.tail=T
var=CENTRE13
var=ICD10
var=CENTRE13
modelFullIIbs i modelFullIIbs
objasnianej.
ontologi
test współliniowości zmiennych w modelu
macierzowa
Galicki
Calinski
Grzadziel
Krzysko
Zmyslony
Powinno być
była losowana całkowicie niezależnie od
zmiennej objaśniającej.
dane losujemy w ten sam sposób.
Źródłem problemów w powyższych
przykładach jest
j-tej
z najbardziej skorelowanych
rnorm(9800)
PCA)
rnorm(9800)
są tylko cztery zmienne objaśniające
zmienne
(params[,3])
(params[,1])
korelować z cechą
testu F, weryfikującego istotność efektów poszczególnych genów.
xyplot(-log(pval)~pos|chr
przyjmiemy
Rozważmy następujący przykład.
|V (θ)|−1/2
XT y
"
#−1
XT X
XT Z
σ2
T
T
Z X Z Z + D̂−1
dana krowa
statystyki Walda
Argument lower.tail=F
var="CENTRE13"
var="ICD10"
which=1:20
modelFullIIbs i modelFullIIba
objaśnianej.
ontologii
test na liniowość modelu
macierzową
Gałecki
Caliński
Grządziel
Krzyśko
Zmyślony
Zbiory danych z pakietu PBImisc:
• W zbiorze danych ’vaccination’ zmieniły się nazwy kolumn, stare to ’reaction.time’, ’number.of.vaccines’,
nowe to ’response’, ’dose’. W książce w rozdziale dotyczącym testów post-hoc używane są stare nazwy.
• W zbiorze danych ’kidney’ jest ’reciver.age’, powinno być ’recipient.age’.
Wykresy:
Szymon Drobniak zauważył problem z łączeniem funkcji graficznej bwplot() z pakietu lattice i funkcji abline()
z pakietu graphics (strona 75).
Najłatwiej go rozwiązać używając tylko funkcji z pakietu lattice:
3
bwplot(change.2191~Mutation, data=AML, panel=function(...) {
panel.abline(h=0, col="grey", lwd=2)
panel.bwplot(...)
})
albo tylko funkcji z pakietu graphics:
boxplot(change.2191~Mutation, data=AML)
abline(h=0, col="grey", lwd=2)
Uzupełnienie: pakiet kinship
W programie R w wersjach 2.15 i nowszych pakiet kinship jest niedostępny. Zamiast niego należy używać pakietu
kinship2.
Uzupełnienie:
Na stronie 69 napisałem co robić z jednokierunkową analizą wariancji gdy nie można przyjąć hipotezy o normalności. Zabrakło jednak wskazówek co zrobić gdy nie można przyjąć hipotezy o jednorodności wariancji.
W takim przypadku jednym z rozwiązań jest wykorzystanie funkcji oneway.test(), który jest rozszerzeniem
analizy wariancji uwzględniający niejednorodność w podobny sposób jak test Welch’a (czyli ważona ocena wariancji
oraz odpowiedni sposób liczenia odpowiednika liczby stopni swobody dla tej oceny wariancji).
Do analizy post-hoc wykorzystać można funkcję pairwise.t.test().
Na stronie 107 jest informacja, że macierz modelu ma 171 kolumn, ale na wcześniejszej stronie wynik analizy
wariancji pokazuje 90 regresorów. Macierz modelu może być większa, ale liczba regresorów zależy od rzędu macierzy
a nie liczby jej kolumn, więc w tym przypadku rząd macierz modelu to 90, choć kolumn jest 171.
4