Jak optymalne są adaptacyjne testy wynikowe dla testowania
Transkrypt
Jak optymalne są adaptacyjne testy wynikowe dla testowania
Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Jak optymalne są adaptacyjne testy wynikowe dla testowania jednostajności? Tadeusz Inglot Alicja Janic Instytut Matematyczny, Polska Akademia Nauk oraz Instytut Matematyki i Informatyki, Politechnika Wrocławska Instytut Matematyki i Informatyki, Politechnika Wrocławska 2 grudnia 2007 Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Problem testowania Gładki test Neymana Reguły wyboru Jak wyznaczamy bariery cj,n ? Adaptacyjne statystyki testowe Problem testowania Niech X = (X1 , ..., Xn ) będzie próbą z ciagłego rozkładu P na odcinku [0, 1] z gęstością p. Testujemy H0 : p = p0 , gdzie p0 (x) = 1 dla x ∈ [0, 1] Klasa gładkich alternatyw k X pk (x, θ) = p0 (x)ck (θ) exp{ θj bj (x)}, (1) j=1 gdzie θ ∈ Rk , ck (θ)- stała normująca, b1 , b2 , ... układ ortonormalny w L2 [0, 1]. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Problem testowania Gładki test Neymana Reguły wyboru Jak wyznaczamy bariery cj,n ? Adaptacyjne statystyki testowe ,Score’ statystyka Rao dla testowania θ = 0 w rodzinie (1): Nk = k X n nb̂2j , gdzie b̂j = 1X bj (Xi ), j = 1, ..., k. n (2) i=1 j=1 b̂j - empiryczne współczynniki Fouriera. Test oparty na Nk nazywamy gładkim testem Neymana. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Problem testowania Gładki test Neymana Reguły wyboru Jak wyznaczamy bariery cj,n ? Adaptacyjne statystyki testowe Reguła Schwarza (BIC) S = min{1 ≤ k ≤ d(n) : Nk − k log n ≥ Nj − j log n, j = 1, ..., d(n)}. (3) Reguła Akaike (AIC) A = min{1 ≤ k ≤ d(n) : Nk − 2k ≥ Nj − 2j, j = 1, ..., d(n)}. (4) Testy oparte na NS i NA nazywamy adaptacyjnymi testami Neymana. NS - T. Ledwina (1994) J. Amer. Statist. Assoc. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Problem testowania Gładki test Neymana Reguły wyboru Jak wyznaczamy bariery cj,n ? Adaptacyjne statystyki testowe Nowa reguła L, S ≤ L ≤ A Wybieramy D = Dn i określamy zdarzenie W W = D [ {Yj = j}, 1 ≤ D d(n), j=1 gdzie Yj oznacza liczbę nb̂2r , r = 1, ..., d(n) przekraczających barierę c2j,n , j = 1, ..., D. Kara w regule π(j, n) = j log n · 1W c + 2j · 1W . (5) Reguła L = min{1 ≤ k ≤ d(n) : Nk − π(k, n) ≥ Nj − π(j, n), j = 1, ..., d(n)}. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Problem testowania Gładki test Neymana Reguły wyboru Jak wyznaczamy bariery cj,n ? Adaptacyjne statystyki testowe Jak wyznaczamy cj,n , j = 1, ..., D? Bariery cj,n wybieramy tak, aby P0 (W ) = δ i P0 (Yj = j) ' δD−1 . Przy H0 √ √ ( nb̂1 , ..., nb̂d(n) ) ≈ (Z1 , ...Zd(n) ). Zatem Yj ≈ B(d(n), pj,n ), gdzie pj,n = P(|Z1 | ≥ cj,n ) = 2[1 − Φ(cj,n )]. Stąd P0 (Yj = j) ' d(n) j Tadeusz Inglot, Alicja Janic [2(1 − Φ(cj,n ))]j . Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Problem testowania Gładki test Neymana Reguły wyboru Jak wyznaczamy bariery cj,n ? Adaptacyjne statystyki testowe Jak wyznaczamy cj,n , j = 1, ..., D? Wyznaczamy cj,n z równania 1 1 − Φ(cj,n ) = 2 δD −1 d(n) j −1 !1/j , j = 1, ..., D. (7) Reguła wyboru T (Inglot i Ledwina (2006)) Reguła T jest szczególnym przypadkiem reguły L: D = 1, d(n) = 12, δ ∼ 0.0106 dla n = 100. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Problem testowania Gładki test Neymana Reguły wyboru Jak wyznaczamy bariery cj,n ? Adaptacyjne statystyki testowe Klasa statystyk NL Statystyka NL = NL (D, δ) zależy od wyboru D i δ np. NL (1, 0.01) = NT (Inglot i Ledwina (2006)) NL (D, 0) = NS (Ledwina (1994)) NL (D, 1) = NA (w praktyce NA ' NL (D, 0.5)) Zatem NS ≤ NL ≤ NA . Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Rozkład reguły L i statystyki NL Twierdzenie 1 Przy pewnych założeniach o Dn i δn P0 (Wn ) → 0 dla n → ∞ i w konsekwencji P0 (L = S) → 1 gdy n → ∞. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Rozkład reguły L i statystyki NL Kallenberg i Ledwina (1995), Inglot i Ledwina (1996) Twierdzenie 2 Przy założeniach o Dn i δn jak w Twierdzeniu 1 oraz przy pewnych założeniach o szybkości zbieżności d(n) P0 (S > 1) → 0 i w konsekwencji P0 (L > 1) → 0 oraz D NL → χ21 przy H0 . Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Tabela 1 Wartości krytyczne NL (D, δ). Układ wielomianów Legendre’a. n = 100, d(n) = 12, α = 0.05, 30 000 MC. NL (D, δ) D 1 2 3 6 δ=0 5.586 5.586 5.586 5.586 δ = .01 5.993 5.993 5.972 5.957 δ = .03 6.836 6.850 6.747 6.511 Tadeusz Inglot, Alicja Janic δ = .05 7.908 7.731 7.650 7.187 δ = .09 10.667 10.634 10.311 9.026 δ = .5 14.962 14.985 14.911 14.725 Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Rozważamy alternatywy p12 (x, ±0.25ej ), gdzie e1 , ..., e12 jest standardową bazą w przestrzeni Euklidesowej R12 a pk (x, θ) oznacza gęstość (1). Przy porównaniu symulowanych mocy rozważamy testy: jednostronny test Neymana-Pearsona - N P , dwustronny optymalny test Bayesowski - T ∗ , test maksimum - M = max1≤j≤12 {nb̂2j }, P 2 gładki test Neymana - N12 = 12 j=1 nb̂j . Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Tabela 2 Porównanie mocy i mocy średniej 1 − β (w %) dla NL (D, δ), T ∗ , N P , M i N12 . Układ wielomianów Legendre’a. n = 100, α = 0.05, d(n) = 12, 10 000 MC, alternatywy p12 (x, θj ), jednostajny rozkład a priori. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Tabela 2 θj NP T ? M NS (δ = 0) .25e1 .25e2 .25e3 .25e4 .25e5 .25e6 .25e7 .25e8 .25e9 .25e10 .25e11 .25e12 80 81 80 80 82 82 80 83 81 83 79 82 38 48 39 46 40 45 40 45 40 45 39 46 36 46 37 44 38 44 38 43 37 43 37 42 57 68 38 30 14 13 07 08 06 07 06 06 (NT ) .01 53 66 38 34 26 31 26 30 24 27 21 24 Tadeusz Inglot, Alicja Janic NL (1, δ) .05 37 53 42 47 40 45 36 40 30 34 25 28 (NA ) 0.5 18 32 25 37 32 43 37 45 35 38 27 29 NL (6, δ) N12 .05 44 59 41 39 29 37 29 35 27 32 25 28 28 42 30 39 30 39 30 38 30 37 30 37 Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Tabela 2 cd. θj -.25e1 -.25e2 -.25e3 -.25e4 -.25e5 -.25e6 -.25e7 -.25e8 -.25e9 -.25e10 -.25e11 -.25e12 1−β NP 80 79 79 79 80 79 81 78 80 79 81 79 80.3 T ? 39 28 39 30 39 32 39 33 40 34 40 35 39.1 M 36 27 37 29 37 31 38 32 38 33 38 33 37.2 NS (NT ) NL (1, δ) (NA ) NL (6, δ) N12 (δ = 0) .01 53 51 38 20 26 20 26 20 24 18 22 15 30.5 .05 38 32 41 31 40 32 37 27 31 22 26 17 34.6 0.5 18 10 24 19 31 26 37 29 36 23 27 17 29.0 .05 44 40 40 21 30 22 29 22 28 20 25 17 31.8 28 14 29 19 31 21 29 22 30 23 31 25 29.7 57 54 38 15 14 07 07 06 06 05 06 06 20.0 Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Tabela 3 Porównanie mocy i mocy średniej (w %) dla NL (D, δ) i N12 . Układ wielomianów Legendre’a. n = 100, α = 0.05, d(n) = 12, 10 000 MC, alternatywy p6 (x, θj ), jednostajny rozkład a priori. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Table 3 θ .165 .11 .11 0 0 0 .165 .165 .165 .11 .165 .11 0 0 0 0 0 0 .11 .11 .165 0 0 0 .11 0 0 0 0 0 .165 .11 .11 .11 .11 0 0 0 0 .11 .165 .11 0 .11 .11 Tadeusz Inglot, Alicja Janic 0 0 0 .11 .11 .165 0 0 .11 NS NT 52 55 47 23 20 20 39 34 32 50 54 46 27 25 26 37 33 33 NL (D, 0.05) D=1 D=3 42 46 42 37 35 36 32 30 29 45 49 45 39 37 38 36 33 33 Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Wartości krytyczne Alternatywy i Testy Symulacje mocy Tabela 3 cd. θ 0 0 0 0 0 0 .11 .11 .11 .165 .165 .165 0 0 0 .11 .11 .11 .11 .11 0 0 .11 .11 0 0 .11 .165 .11 .11 .165 0 .11 .165 .11 0 0 .165 0 0 0 .165 0 0 0 average power Tadeusz Inglot, Alicja Janic 0 0 .11 0 .11 .11 0 0 .165 NS NT 52 47 41 30 27 31 42 33 32 36.5 52 46 42 31 29 33 41 34 36 37.5 NL (D, 0.05) D=1 D=3 46 41 38 36 35 38 40 33 36 37.3 49 45 42 38 38 41 43 35 38 40.2 Jak optymalne są adaptacyjne testy wynikowe dla testowania Adaptacyjne testy wynikowe Rezultaty teoretyczne Symulacje Bibliografia Akaike, H. (1974). A new look at statistical model identification. IEEE Trans. Automat. Control 19:716-723. Inglot, T., Ledwina, T. (1996). Asymptotic optimality of data-driven Neyman’s tests for uniformity. Ann. Statist. 24:1982-2019. Inglot T., Ledwina, T. (2006). Towards data driven selection of a penalty function for data driven Neyman tests. Linear Algebra Appl. 417: 124-133. Kallenberg, W.C.M., Ledwina, T. (1995). Consistency and Monte Carlo simulation of a data driven version of smooth goodness of fit tests. Ann. Statist. 23:1594-1608. Ledwina, T. (1994). Data driven version of Neyman’s smooth test of fit. J. Amer. Statist. Assoc. 89:1000-1005. Schwarz, G. (1978). Estimating the dimension of a model. Ann. Statist. 6:461-464. Tadeusz Inglot, Alicja Janic Jak optymalne są adaptacyjne testy wynikowe dla testowania