1 Teoria Gier
Transkrypt
1 Teoria Gier
1 1 1.1 TEORIA GIER Teoria Gier Wstęp Niech A oznacza zbiór możliwych akcji (natomiast I σ-ciało jego podzbiorów), a Θ zbiór ”stanów natury”. Niech dana będzie również funkcja L : Θ × A → R, nazywać ją będziemy funkcją straty. Wówczas trójkę hΘ, A, Li nazywamy grą. Niech X będzie zbiorem wyników obserwacji, a A σ-ciałem podzbiorów X . Niech wreszcie P = {Pθ | θ ∈ Θ} będzie rodziną miar probabilistycznych na X . Definicja 1.1 Funkcję mierzalną d : (X , A) → (A, I) dla której istnieje i jest skończona dla każdego θ ∈ Θ wartość oczekiwana Z R(θ, d) := Eθ [L(θ, d(X))] = L(θ, d(x)) Pθ (dx) X nazywamy regułą decyzyjną a całkę R(θ, d) nazywamy funkcją ryzyka reguły decyzyjnej d. Niech D oznacza zbiór wszystkich reguł decyzyjnych w danej grze hΘ, A, Li. Niech H będzie najmniejszym σ-ciałem podzbiorów D, względem którego funkcje R(θ, ·) są mierzalne dla każdego θ ∈ Θ oraz zawierającym wszystkie jednoelementowe podzbiory D. Definicja 1.2 Miarę probabilistyczną δ na D dla której istnieje i skończona jest całka Z R∗ (θ, δ) = R(θ, z) δ(dz) D nazywamy zrandomizowaną regułą decyzyjną. Całkę R∗ (θ, δ) nazywamy funkcją ryzyka zrandomizowanej reguły decyzyjnej. Niech D∗ będzie zbiorem zrandomizowanych reguł decyzyjnych. Wtedy D wkłada się w D∗ . Mamy nową grę hΘ, D∗ , R∗ i Lemat 1.3 Zbiór D∗ jest wypukły. Niech I będzie najmniejszym σ-ciałem podzbiorów A zawierającym jako swoje elementy wszystkie jednoelementowe podzbiory zbioru A i względem którego wszystkie funkcje L(θ, ·) są mierzalne dla każdego θ ∈ Θ. Niech A∗ będzie zbiorem wszystkich miar probabilistycznych α na A dla których istnieje i skończona jest całka Z L∗ (θ, α) = L(θ, a) α(da) A Definicja 1.4 Funkcję δ̃ : X → A∗ dla której istnieje i jest skończona całka Z R̃(θ, δ̃) = Eθ [L∗ (θ, δ̃(X)] = L∗ (θ, δ̃(x)) Pθ (dx) X nazywamy behawiorystyczną regułą decyzyjną. Całkę R̃(θ, δ̃) nazywamy funkcją ryzyka behawiorystycznej reguły decyzyjnej δ̃. Niech D̃ oznacza zbiór behawiorystycznych reguł decyzyjnych. Mamy kolejną grę: hΘ, D̃, R̃i behawiorystyczną grę decyzyjną. 1 1.2 Metody uporządkowania klas reguł decyzyjnych 1 TEORIA GIER Lemat 1.5 Zbiór D̃ jest wypukły. Twierdzenie 1.6 (Wald, Wolfowitz) Niech A będzie podzbiorem ośrodkowej przestrzeni metrycznej. Wówczas gry statystyczne hΘ, D, R∗ i i hΘ, D̃, R̃i są równoważne, czyli dla każdego δ ∗ ∈ D∗ istnieje δ̃ ∈ D̃ taka, że ∀θ ∈ Θ R∗ (θ, δ ∗ ) = R̃(θ, δ̃) i na odwrót, dla każdej δ̃ ∈ D̃ istnieje δ ∗ ∈ D∗ taka, że spełniona jest powyższa równość. Definicja 1.7 Regułę decyzyjną d ∈ D nazywamy nieobciążoną ze względu na funkcję straty L, gdy Eθ [L(θ0 , d(X))] ≥ Eθ [L(θ, d(X))] θ, θ0 ∈ Θ 1.2 Metody uporządkowania klas reguł decyzyjnych Niech Ξ będzie najmniejszym σ-ciałem podzbiorów Θ zawierającym jako swoje elementy wszystkie jednoelementowe podzbiory zbioru Θ i względem którego wszystkie funkcje R∗ (·, δ) są mierzalne dla każdego δ ∈ D∗ . Niech Θ∗ będzie zbiorem wszystkich miar probabilistycznych na Θ Definicja 1.8 Ryzykiem bayesowskim zrandomizowanej reguły δ ∈ D∗ względem rozkładu a priori τ ∈ Θ∗ nazywamy całkę Z r(τ, δ) = R∗ (θ, δ) dτ (θ) Θ Definicja 1.9 Ryzykiem bayesowskim niezrandomizowanej reguły d ∈ D względem rozkładu a priori τ ∈ Θ∗ nazywamy całkę Z r(τ, d) = R(θ, d) dτ (θ) Θ Definicja 1.10 Reguła decyzyjna δ0 ∈ D∗ nazywa się regułą bayesowską względem rozkładu a priori τ ∈ Θ∗ , gdy r(τ, δ0 ) = inf ∗ r(τ, δ) δ∈D Definicja 1.11 Niech ε > 0. Reguła δ0 ∈ D∗ nazywa się regułą ε-bayesowską względem τ ∈ Θ, gdy r(τ, δ0 ) ≤ inf ∗ r(τ, δ) + ε δ∈D Definicja 1.12 Reguła decyzyjna d0 ∈ D nazywa się regułą bayesowską względem rozkładu a priori τ ∈ Θ∗ , gdy r(τ, d0 ) = inf r(τ, d) d∈D Definicja 1.13 Niech ε > 0. Reguła d0 ∈ D nazywa się regułą ε-bayesowską względem τ ∈ Θ, gdy r(τ, d0 ) ≤ inf r(τ, d) + ε d∈D 2 1.3 Zasada minimaksu 1 TEORIA GIER Twierdzenie 1.14 Jeżeli istnieje zrandomizowana reguła bayesowska δ0 ∈ D∗ ze względu na rozkład a priori τ ∈ Θ∗ , to istnieje niezrandomizowana reguła decyzyjna d0 ∈ D, która jest bayesowska ze względu na τ 1.3 Zasada minimaksu Definicja 1.15 Reguła decyzyjna δ0 ∈ D∗ nazywa się minimaksowa, gdy sup R∗ (θ, δ0 ) = inf ∗ sup R∗ (θ, δ) δ∈D θ∈Θ θ∈Θ Definicja 1.16 Niech ε > 0. Reguła decyzyjna δ0 ∈ D∗ nazywa się ε-minimaksowa, gdy sup R∗ (θ, δ0 ) ≤ inf ∗ sup R∗ (θ, δ) + ε δ∈D θ∈Θ θ∈Θ Lemat 1.17 Dla każdego δ ∈ D∗ sup r(τ, δ) = sup R∗ (θ, δ) τ ∈Θ∗ θ∈Θ Wniosek 1.18 Jeśli δ0 jest minimaksowa w grze hΘ, D∗ , R∗ i, to jest również minimaksowa w grze hΘ∗ , D∗ , ri, czyli sup r(τ, δ0 ) = inf ∗ sup r(τ, δ) τ ∈Θ∗ δ∈D τ ∈Θ∗ Definicja 1.19 Rozkład a priori τ0 ∈ Θ∗ nazywa się rozkładem najmniej korzystnym, gdy inf r(τ0 , δ) = sup inf ∗ r(τ, δ) δ∈D ∗ τ ∈Θ∗ δ∈D Lemat 1.20 Mamy sup inf r(τ, δ) = v ≤ v = inf ∗ sup r(τ, δ) ∗ τ ∈Θ∗ δ∈D δ∈D τ ∈Θ∗ W przypadku, gdy v = v = v, mówimy, że gra hΘ∗ , D∗ , ri ma wartość v. Jeżeli ponadto istnieją τ0 ∈ Θ∗ oraz δ0 ∈ D∗ dla których r(τ0 , δ0 ) = v, to minimaksowa reguła δ0 jest bayesowska względem rozkładu najmniej korzystnego. Definicja 1.21 Funkcja f : (X, T ) → R jest półciągła z dołu, gdy dla dowolnego c ∈ R zbiór {x | f (x) > c} jest otwarty w X. Twierdzenie 1.22 (minimaksowe) Niech będzie dana gra hΘ, D∗ , R∗ i. Jeżeli D jest przestrzenią zwartą, a funkcja R∗ (θ, ·) : D∗ → R jest półciągła z dołu dla dowolnego θ ∈ Θ, to istnieje wartość gry hΘ, D∗ , R∗ i oraz istnieje minimaksowa reguła decyzyjna. 3 1.4 1.4 Klasy reguł decyzyjnych 1 TEORIA GIER Klasy reguł decyzyjnych Definicja 1.23 Reguła δ1 nazywa jest nie gorszą niż reguła δ2 , gdy R∗ (θ, δ1 ) ≤ R∗ (θ, δ2 ) dla θ ∈ Θ Definicja 1.24 Reguła δ1 jest równoważna regule δ2 , gdy dla dowolnego θ ∈ Θ mamy R∗ (θ, δ1 ) = R∗ (θ, δ2 ). Definicja 1.25 Reguła decyzyjna δ ∈ D∗ nazywa się dopuszczalna, gdy nie istnieje reguła decyzyjna lepsza od niej. W przeciwnym wypadku δ nazywamy regułą niedopuszczalną. Definicja 1.26 Klasa C ⊆ D∗ reguł decyzyjnych jest zupełna, gdy dla każdej reguły δ ∈ D∗ \ C istnieje reguła δ0 ∈ C lepsza niż δ. Definicja 1.27 Klasa C ⊆ D∗ reguł decyzyjnych jest istotnie zupełna, gdy dla każdej reguły δ ∈ D∗ \ C istnieje reguła δ0 ∈ C nie gorsza niż δ. Lemat 1.28 Jeżeli klasa C jest zupełna, to C zawiera wszystkie reguły dopuszczalne. Lemat 1.29 Jeżeli klasa C jest klasą istotnie zupełną i istnieje reguła dopuszczalna δ ∈ / C, to istnieje reguła δ0 ∈ C równoważna regule δ. Definicja 1.30 Klasa C ⊆ D∗ reguł reguł decyzyjnych nazywa się minimalną klasą (istotnie) zupełną, gdy jest klasą (istotnie) zupełną i nie istnieje właściwa (istotnie) zupełna podklasa C. Twierdzenie 1.31 Jeśli dla gry hΘ, D∗ , R∗ i istnieje minimalna klasa zupełna, to jest ona równa klasie wszystkich reguł dopuszczalnych. 1.5 Istotna zupełność klas niezrandomizowanych reguł decyzyjnych przy wypukłej funkcji straty Lemat 1.32 Niech S będzie wypukłym podzbiorem Rk , a Z-k-wymiarowym wektorem losowym o wartościach w S. Jeżeli wektor E[Z] istnieje, to E[Z] ∈ S. Twierdzenie 1.33 (Nierówność Jensena) Niech S będzie wypukłym podzbiorem Rk , a Z-k-wymiarowym wektorem losowym o wartościach w S takim, że wektor E[Z] istnieje. Wówczas jeśli f : S → R jest wypukła i jeśli f (Z) jest P -całkowalną zmienną losową, to f (E[Z]) ≤ E[f (Z)] Twierdzenie 1.34 (Warunkowa nierówność Jensena) Niech S będzie wypukłym podzbiorem Rk , a Z-k-wymiarowym P -całkowalnym wektorem losowym o 4 1.6 Istotna klasy reguł opartych na statystyce dostatecznej 1 TEORIA GIER wartościach w S. Wówczas jeśli f : S → R jest wypukła i jeśli f (Z) jest P -całkowalną zmienną losową, to f (E[Z|E]) ≤ E[f (Z)|E] p.w. dla dowolnego σ-ciała E ⊆ F. Twierdzenie 1.35 Rozpatrzmy grę hΘ, A, Li, gdzie A ⊆ Rk jest wypukły i dla dowolnego θ ∈ Θ funkcja L(θ, ·) : A → R jest wypukła. Wówczas jeśli dla pewnego θ0 ∈ Θ istnieją liczby ε > 0 oraz c ∈ R takie, że ∀a ∈ A L(θ0 , a) ≥ ε||a|| + c to dla dowolnej α ∈ A∗ istnieje a ∈ A dla którego ∀θ ∈ Θ L(θ, a) ≤ L∗ (θ, α) Wniosek 1.36 Jeśli A jest wypukłym podzbiorem Rk i dla każdego θ ∈ Θ funkcja straty L(θ, ·) : A → R jest wypukła oraz taka, że dla dowolnego θ0 ∈ Θ εE[||Z||] + c ≤ E[L(θ0 , Z)] dla pewnych ε > 0 i c, gdzie Z przyjmuje wartości z A, to klasa niezrandomizowanych reguł decyzyjnych D jest iststnie zupełna dla gry hΘ, D̃, R̃i. 1.6 Istotna zupełność klasy reguł decyzyjnych opartych na statystyce dostatecznej Rozważmy (X , A, P) gdzie P = {Pθ | θ ∈ Θ}. Załóżmy, że istnieje statystyka dostateczna dla P: T = T (X) : (X , A) → (T , C). Rozpatrzmy grę hΘ, D̃, R̃i, δ̃ : X → A∗ i niech δ̃x = δ̃(x). Definicja 1.37 Reguła decyzyjna δ̃ : (X , A) → (A∗ , J ∗ ) nazywa się regułą opartą na statystyce T , gdy istnieje Cmierzalna funkcja ψ : T → A∗ taka, że δ̃x = ψ(T (x)) x ∈ X Załóżmy, że X jest borelowskim podzbiorem Rk oraz że dla dowolnych θ ∈ Θ oraz A ∈ A istnieje wersja prawdopodobieństwa warunkowego Pθ [A | T = t] taka, że P [· | T = t] jest miarą probabilistyczną na (X , A) dla dowolnego t ∈ T . Ponieważ T jest statystyką dostateczną dla P, to rozkład warunkowy nie zależy od θ. Niech δ̃ ∈ D̃ i niech Z δ̃t0 (B) = δ̃x (B) dP (x|T = t) Wtedy δ̃t0 X ∗ nie zależy od θ i jest rozkładem z A i jest funkcją statystyki T (jest na niej oparta). Lemat 1.38 Niech f będzie J mierzalną i δ̃x całkowalną dla każdego x ∈ X funkcją rzeczywistą określoną na A. Jeśli całka Z Z f (a) dδ̃x (a) dP (x|T = t) X A istnieje i jest skończona dla każdego t ∈ T , to funkcja f jest δ̃t0 -całkowalna dla każdego t ∈ T i zachodzi równość Z Z Z f (a) dδ̃t0 (a) = f (a) dδ̃x (a) dP (x|T = t) A X A 5 1.6 Istotna klasy reguł opartych na statystyce dostatecznej 1 TEORIA GIER Twierdzenie 1.39 Jeżeli T jest statystyką dostateczną dla P = {Pθ | θ ∈ Θ} na (X , A), to zbiór D̃0 ⊆ D̃ reguł opartych na statystyce T jest klasą istotnie zupełną dla gry hΘ, D̃, R̃i. Twierdzenie 1.40 Niech A będzie wypukłym podzbiorem Rk , a funkcja L(θ, a) wypukłą funkcją zmiennej a ∈ A dla każdego θ ∈ Θ. Niech T będzie statystyką dostateczną dla Θ. Wówczas jeżeli dla pewnego θ0 ∈ Θ istnieją stałe ε > 0 oraz c ∈ R takie, że L(θ0 , a) ≥ ε||a|| + c, to klasa D̃0 niezrandomizowanych reguł decyzyjnych opartych na T jest klasą istotnie zupełną dla gry hΘ, D̃, R̃i Twierdzenie 1.41 (Rao, Blackwell) Niech A będzie wypukłym podzbiorem Rk , a funkcja L(θ, a) wypukłą funkcją zmiennej a ∈ A dla każdego θ ∈ Θ. Niech T będzie statystyką dostateczną dla Θ. Jeżeli d ∈ D jest niezrandomizowaną reguła decyzyjną, to reguła d0 ∈ D dana wzorem d0 (t) = E[d(X) | T = t] jest nie gorsza niż reguła d. 6