plik pdf
Transkrypt
plik pdf
Errata do wydania I Dziękuję uważnym czytelnikom za wyśledzenie poniższych usterek. Szczególnie dziękuję Krzysztofowi Trajkowskiemu, Michałowi Lewickiemu, Barbarze Rubikowskiej, Janowi Gąsce i Dominice Nowickiej, którzy znaleźli wiele z poniższych błędów. Gdzie strona x linia 21 strona x linia 17 strona 9 linia 14 Jest zmatematyowanych che pytaniem Powinno być zmatematyzowanych chce pytanie strona 12 linia 10 E E strona strona strona strona strona strona strona strona strona δ δθlnf (x;θ) 2 strona strona strona strona strona strona strona strona strona strona strona strony 21 linia -8 24 linia 10 24 linia 14 25 linia 3 31 linia 8 35 linia -1 36 linia 3 36 linia 8 36 linia -7 39 linia -3 40 linia -8 40, 41, 66, 68, 71, 97 q≤p βp−q+1 i>p−q interpretacje X β̂X − X β̂W gdy długość wektora x0 jest ustalona. to zmieniamy rozkład β̂ zmieniamy rozkład ŷ |CA|2 i statystyka T200 = |yC|+|CB|2 jest rów0 noważna T2 , ponieważ |CB| i |CA| są prostopadłe. Oznacza to, że wynik testowania z użyciem statystyk T20 i T200 będzie identyczny, niezależnie od tego, czy Z będzie w modelu. odrzucimy współczynniki β i σ 2 współczynniki β i σ 2 bo macierzowej model (2.3) modelu (2.3) modelu 2.3 modelu (2.3) funckji l(θ|x) brak kursywy strona strona strona strona strona 45 45 45 46 46 hi -te Ponieważ hi ristd = stosowama oceny β na obserwację i 16 16 16 17 18 19 19 19 21 linia -13 linia -12 linia -10 linia -6 rysunek 1.4 linia -9 linia -7 linia -6 linia 3 linia linia linia linia linia -8 -7 -1 13 14 δ δθ 2 ln f (x; θ) p−q βq+1 i>q interpretację X β̂X − W β̂W gdy zbiór zmiennych X jest ustalony. ocena β̂ ma inny rozkład inny jest też rozkład ŷ 2 . Więc statystyka T200 = |CA| jest bliska |yB|2 2 statystce T20 = |yB||CA| 2 +|BC|2 . Oznacza to, że wynik testowania z użyciem statystyk T20 i T200 będzie podobny, niezależnie od tego, czy Z będzie w modelu. najprawdopodobniej odrzucimy współczynniki β i parametr σ 2 współczynniki β i parametr σ 2 do wektorowej model (2.2) modelu (2.2) modelu (2.2) modelu (2.2) funkcji l(β, σ|y) w kodzie R komentarz powinien być jasnoszary oraz pisany kursywą hi Ponieważ wartości hi ri r ∼ N (0, (I −H)σ 2 ), ristd = sd(r = i) stosowana obserwacji i na ocenę β Pn strona 46 linia 17 strona 46 linia -9 strona 47 linia -13 strona 50 podpisy osi dwóch ostatnich wykresów strona 63 linia -14 strona 63 linia -13 strona 66 linia -6 strona 68 linia -15 strona 73 linia 2 strona 73 linia 3 j=1 Di = Di = Pn 2 hi ri 1−hi σ̂ 2 j=1 xj β̂−xj βd (−i) 2 (y−xj β̂ ) 2 /(n−p) bliska macierzy permutowalnej lm(y − x) = hi ristd,2 macierzą permutowalną lm(y ∼ x) niezrównażonego zrównażonego przedstawione hiptoez jest wysoka maleje niezrównoważonego równoważonego przedstawiona hipotez następuje później następuje wcześniej hi 2 1−hi ri 1 /p = Gdzie strona 74 linia 22 strona 74 linia -16 strona 79 linia 15 strona 80 linia 15 strona 81 linia -17 strona 87 linia 1 strona 88 linia 2 strona 89 linia -9 strona 94 linia 1 strona 94 linia 3 strona 94 linia 4 strona 94 linia 5 strona 94 linia 7 strona 103 linia -15 strona 103 linia -12 strona 104 linia 9 strona 105 linia 8 Jest że nie traci się wtedy kontroli wprowadzenie p.adj=”holm” korektę Holma fligner.test(). Funkcja levene.test() nieliniowość linowych ograniczonych NfkB (a) i CD28 (b) Po lewej stronie poziomem Na prawym wykresie NfkB (a) i IFN (b); wykresy . Oto typowe przykłady: województwa yijk wartość k-tego (jeżeli przyjmiemy alternatywną parametryzację, to ) zmiennej x2. Opowiadający 0,18 wyłączenie ”miasto” relacje co do parametrów średnimi strona strona strona strona strona strona strona strona 105 105 107 110 110 111 112 112 linia linia linia linia linia linia linia linia 10 -2 8 4 -20 -6 11 -16 strona strona strona strona strona 114 114 117 118 118 linia linia linia linia linia -7 -6 3 5 15 stężeniem intensywnością się w fazie p-folikularnej. 0.25 tylko p-wartości. Prześledźmy każdy z tych modeli w szczegółach. strona strona strona strona 118 119 119 119 linia linia linia linia -1 1 2 3 strona strona strona strona 119 119 120 120 linia linia linia linia -3 -2 1 8 strona 123 linia 15 dla zmiennej X zmiennej Z zmiennych istotność pary obu zmiennych, jeżeli porównać ją do modelu pustego. zmiennej X Z podania gdy używaliśmy analizy dwukierunkowej, gdyż porównywany model ma w zakłócenie losowe określając argument k strona 123 linia 18 , strona 123 linia -11 Jeżeli jest w nim wyraz wolny, to najmniejszy model zawiera tylko wyraz wolny. Jeżeli w modelu M nie ma wyrazu wolnego to mały model oznacza model tylko z zerem. liczbę n strona 123 linia -6 strona 124 linia -10 2 Powinno być że traci się wtedy kontrolę wprowadzenia p.adj=”bonferroni” korektę Bonferroniego levene.test(). Funkcja ta nieliniową liniowych ograniczeniach NfkB i CD28 Na wykresie (a) poziomom Na wykresie (b) NfkB i IFN. Wykresy , kilka typowych to: gminy yi,j,m wartość m-tego , która w alternatywnej parametryzacji zmiennej x1. Odpowiadający 0,4936 wyłącznie ”city” relację współczynnikami zależności liniowych w grupach ilością ilość w folikularnej fazie cyklu (p). 0,25 p-wartości dla pięciu różnych testów dotyczących hipotez o zerowości współczynników βX i βZ . istotności współczynnika βX współczynnika βZ współczynników istotność pary obu współczynników testowanych jednocześnie. współczynnika βX współczynnika βZ uwzględniania powyżej, gdyż w efekcie Residuals jest wskazując argument o nazwie k tej funkcji, który odpowiada wartości h z powyższego opisu. przecinek powinien być po wzorach a nie przed Jeżeli w modelu M jest wyraz wolny, to model M0 zawiera tylko wyraz wolny. Jeżeli w modelu M nie ma wyrazu wolnego M0 oznacza model bez współczynników. p — liczbę liczba obserwacji n Gdzie strona 124 linia -4 Jest jest całkowicie losowa. strona 124 linia -1 strona 125 linia 1 dla podobnych symulowanych danych mamy p = 99 i n = 100. Problemem jest strona strona strona strona strona strona strona strona strona strona strona 126 126 126 126 127 130 132 134 134 135 137 linia linia linia linia linia linia linia linia linia linia linia i-tej najbardziej skorelowane rnorm(rnorm(9800)) PCA rnorm(rnorm(9800)) o elastazie nie ma zbyt wielu zmiennych zmiennej (params[,1]) (params[,3]) mieć wpływ na cechę testu F. strona strona strona strona strona 137 145 150 150 158 linia -3 linia 9 linia 10 (3.7) linia 5 13 -8 -7 -2 3 5 5 9 12 -8 -6 xyplot(pval~pozycja|chr przymniemy Zobaczmy to na przykładzie. |V (θ)| XT " strona 158 linia -3 strona strona strona strona strona strona strona strona strona strona 4 strona strona strona strona strona strona 174 linia 3 174 linia -3 198 linia -11 204 linia 2 204 linia 4 204 linia 7 210 linia 3 211 linia 7 237 linia -5 271 tabela 5.12 wiersz 312 316 316 317 317 318 linia linia linia linia linia linia 6 -7 -6 11 -3 3 # XT X XT Z T T Z X Z Z + D̂−1 dane krowa statystki Walda Argument lower.tail=T var=CENTRE13 var=ICD10 var=CENTRE13 modelFullIIbs i modelFullIIbs objasnianej. ontologi test współliniowości zmiennych w modelu macierzowa Galicki Calinski Grzadziel Krzysko Zmyslony Powinno być była losowana całkowicie niezależnie od zmiennej objaśniającej. dane losujemy w ten sam sposób. Źródłem problemów w powyższych przykładach jest j-tej z najbardziej skorelowanych rnorm(9800) PCA) rnorm(9800) są tylko cztery zmienne objaśniające zmienne (params[,3]) (params[,1]) korelować z cechą testu F, weryfikującego istotność efektów poszczególnych genów. xyplot(-log(pval)~pos|chr przyjmiemy Rozważmy następujący przykład. |V (θ)|−1/2 XT y " #−1 XT X XT Z σ2 T T Z X Z Z + D̂−1 dana krowa statystyki Walda Argument lower.tail=F var="CENTRE13" var="ICD10" which=1:20 modelFullIIbs i modelFullIIba objaśnianej. ontologii test na liniowość modelu macierzową Gałecki Caliński Grządziel Krzyśko Zmyślony Zbiory danych z pakietu PBImisc: • W zbiorze danych ’vaccination’ zmieniły się nazwy kolumn, stare to ’reaction.time’, ’number.of.vaccines’, nowe to ’response’, ’dose’. W książce w rozdziale dotyczącym testów post-hoc używane są stare nazwy. • W zbiorze danych ’kidney’ jest ’reciver.age’, powinno być ’recipient.age’. Wykresy: Szymon Drobniak zauważył problem z łączeniem funkcji graficznej bwplot() z pakietu lattice i funkcji abline() z pakietu graphics (strona 75). Najłatwiej go rozwiązać używając tylko funkcji z pakietu lattice: 3 bwplot(change.2191~Mutation, data=AML, panel=function(...) { panel.abline(h=0, col="grey", lwd=2) panel.bwplot(...) }) albo tylko funkcji z pakietu graphics: boxplot(change.2191~Mutation, data=AML) abline(h=0, col="grey", lwd=2) Uzupełnienie: pakiet kinship W programie R w wersjach 2.15 i nowszych pakiet kinship jest niedostępny. Zamiast niego należy używać pakietu kinship2. Uzupełnienie: Na stronie 69 napisałem co robić z jednokierunkową analizą wariancji gdy nie można przyjąć hipotezy o normalności. Zabrakło jednak wskazówek co zrobić gdy nie można przyjąć hipotezy o jednorodności wariancji. W takim przypadku jednym z rozwiązań jest wykorzystanie funkcji oneway.test(), który jest rozszerzeniem analizy wariancji uwzględniający niejednorodność w podobny sposób jak test Welch’a (czyli ważona ocena wariancji oraz odpowiedni sposób liczenia odpowiednika liczby stopni swobody dla tej oceny wariancji). Do analizy post-hoc wykorzystać można funkcję pairwise.t.test(). Na stronie 107 jest informacja, że macierz modelu ma 171 kolumn, ale na wcześniejszej stronie wynik analizy wariancji pokazuje 90 regresorów. Macierz modelu może być większa, ale liczba regresorów zależy od rzędu macierzy a nie liczby jej kolumn, więc w tym przypadku rząd macierz modelu to 90, choć kolumn jest 171. 4