1 Teoria Gier

Transkrypt

1 Teoria Gier
1
1
1.1
TEORIA GIER
Teoria Gier
Wstęp
Niech A oznacza zbiór możliwych akcji (natomiast I σ-ciało jego podzbiorów), a Θ zbiór ”stanów
natury”. Niech dana będzie również funkcja L : Θ × A → R, nazywać ją będziemy funkcją straty.
Wówczas trójkę hΘ, A, Li nazywamy grą. Niech X będzie zbiorem wyników obserwacji, a A σ-ciałem
podzbiorów X . Niech wreszcie P = {Pθ | θ ∈ Θ} będzie rodziną miar probabilistycznych na X .
Definicja 1.1
Funkcję mierzalną d : (X , A) → (A, I) dla której istnieje i jest skończona dla każdego θ ∈ Θ wartość
oczekiwana
Z
R(θ, d) := Eθ [L(θ, d(X))] =
L(θ, d(x)) Pθ (dx)
X
nazywamy regułą decyzyjną a całkę R(θ, d) nazywamy funkcją ryzyka reguły decyzyjnej d.
Niech D oznacza zbiór wszystkich reguł decyzyjnych w danej grze hΘ, A, Li. Niech H będzie
najmniejszym σ-ciałem podzbiorów D, względem którego funkcje R(θ, ·) są mierzalne dla każdego
θ ∈ Θ oraz zawierającym wszystkie jednoelementowe podzbiory D.
Definicja 1.2
Miarę probabilistyczną δ na D dla której istnieje i skończona jest całka
Z
R∗ (θ, δ) =
R(θ, z) δ(dz)
D
nazywamy zrandomizowaną regułą decyzyjną. Całkę R∗ (θ, δ) nazywamy funkcją ryzyka zrandomizowanej reguły decyzyjnej.
Niech D∗ będzie zbiorem zrandomizowanych reguł decyzyjnych. Wtedy D wkłada się w D∗ . Mamy
nową grę hΘ, D∗ , R∗ i
Lemat 1.3
Zbiór D∗ jest wypukły.
Niech I będzie najmniejszym σ-ciałem podzbiorów A zawierającym jako swoje elementy wszystkie
jednoelementowe podzbiory zbioru A i względem którego wszystkie funkcje L(θ, ·) są mierzalne dla
każdego θ ∈ Θ. Niech A∗ będzie zbiorem wszystkich miar probabilistycznych α na A dla których
istnieje i skończona jest całka
Z
L∗ (θ, α) =
L(θ, a) α(da)
A
Definicja 1.4
Funkcję δ̃ : X → A∗ dla której istnieje i jest skończona całka
Z
R̃(θ, δ̃) = Eθ [L∗ (θ, δ̃(X)] =
L∗ (θ, δ̃(x)) Pθ (dx)
X
nazywamy behawiorystyczną regułą decyzyjną. Całkę R̃(θ, δ̃) nazywamy funkcją ryzyka behawiorystycznej reguły decyzyjnej δ̃.
Niech D̃ oznacza zbiór behawiorystycznych reguł decyzyjnych. Mamy kolejną grę: hΘ, D̃, R̃i behawiorystyczną grę decyzyjną.
1
1.2
Metody uporządkowania klas reguł decyzyjnych
1
TEORIA GIER
Lemat 1.5
Zbiór D̃ jest wypukły.
Twierdzenie 1.6 (Wald, Wolfowitz)
Niech A będzie podzbiorem ośrodkowej przestrzeni metrycznej. Wówczas gry statystyczne hΘ, D, R∗ i
i hΘ, D̃, R̃i są równoważne, czyli dla każdego δ ∗ ∈ D∗ istnieje δ̃ ∈ D̃ taka, że
∀θ ∈ Θ
R∗ (θ, δ ∗ ) = R̃(θ, δ̃)
i na odwrót, dla każdej δ̃ ∈ D̃ istnieje δ ∗ ∈ D∗ taka, że spełniona jest powyższa równość.
Definicja 1.7
Regułę decyzyjną d ∈ D nazywamy nieobciążoną ze względu na funkcję straty L, gdy
Eθ [L(θ0 , d(X))] ≥ Eθ [L(θ, d(X))] θ, θ0 ∈ Θ
1.2
Metody uporządkowania klas reguł decyzyjnych
Niech Ξ będzie najmniejszym σ-ciałem podzbiorów Θ zawierającym jako swoje elementy wszystkie
jednoelementowe podzbiory zbioru Θ i względem którego wszystkie funkcje R∗ (·, δ) są mierzalne dla
każdego δ ∈ D∗ . Niech Θ∗ będzie zbiorem wszystkich miar probabilistycznych na Θ
Definicja 1.8
Ryzykiem bayesowskim zrandomizowanej reguły δ ∈ D∗ względem rozkładu a priori τ ∈ Θ∗ nazywamy
całkę
Z
r(τ, δ) =
R∗ (θ, δ) dτ (θ)
Θ
Definicja 1.9
Ryzykiem bayesowskim niezrandomizowanej reguły d ∈ D względem rozkładu a priori τ ∈ Θ∗ nazywamy całkę
Z
r(τ, d) =
R(θ, d) dτ (θ)
Θ
Definicja 1.10
Reguła decyzyjna δ0 ∈ D∗ nazywa się regułą bayesowską względem rozkładu a priori τ ∈ Θ∗ , gdy
r(τ, δ0 ) = inf ∗ r(τ, δ)
δ∈D
Definicja 1.11
Niech ε > 0. Reguła δ0 ∈ D∗ nazywa się regułą ε-bayesowską względem τ ∈ Θ, gdy
r(τ, δ0 ) ≤ inf ∗ r(τ, δ) + ε
δ∈D
Definicja 1.12
Reguła decyzyjna d0 ∈ D nazywa się regułą bayesowską względem rozkładu a priori τ ∈ Θ∗ , gdy
r(τ, d0 ) = inf r(τ, d)
d∈D
Definicja 1.13
Niech ε > 0. Reguła d0 ∈ D nazywa się regułą ε-bayesowską względem τ ∈ Θ, gdy
r(τ, d0 ) ≤ inf r(τ, d) + ε
d∈D
2
1.3
Zasada minimaksu
1
TEORIA GIER
Twierdzenie 1.14
Jeżeli istnieje zrandomizowana reguła bayesowska δ0 ∈ D∗ ze względu na rozkład a priori τ ∈ Θ∗ , to
istnieje niezrandomizowana reguła decyzyjna d0 ∈ D, która jest bayesowska ze względu na τ
1.3
Zasada minimaksu
Definicja 1.15
Reguła decyzyjna δ0 ∈ D∗ nazywa się minimaksowa, gdy
sup R∗ (θ, δ0 ) = inf ∗ sup R∗ (θ, δ)
δ∈D θ∈Θ
θ∈Θ
Definicja 1.16
Niech ε > 0. Reguła decyzyjna δ0 ∈ D∗ nazywa się ε-minimaksowa, gdy
sup R∗ (θ, δ0 ) ≤ inf ∗ sup R∗ (θ, δ) + ε
δ∈D θ∈Θ
θ∈Θ
Lemat 1.17
Dla każdego δ ∈ D∗
sup r(τ, δ) = sup R∗ (θ, δ)
τ ∈Θ∗
θ∈Θ
Wniosek 1.18
Jeśli δ0 jest minimaksowa w grze hΘ, D∗ , R∗ i, to jest również minimaksowa w grze hΘ∗ , D∗ , ri, czyli
sup r(τ, δ0 ) = inf ∗ sup r(τ, δ)
τ ∈Θ∗
δ∈D τ ∈Θ∗
Definicja 1.19
Rozkład a priori τ0 ∈ Θ∗ nazywa się rozkładem najmniej korzystnym, gdy
inf r(τ0 , δ) = sup inf ∗ r(τ, δ)
δ∈D ∗
τ ∈Θ∗ δ∈D
Lemat 1.20
Mamy
sup inf r(τ, δ) = v ≤ v = inf ∗ sup r(τ, δ)
∗
τ ∈Θ∗ δ∈D
δ∈D τ ∈Θ∗
W przypadku, gdy v = v = v, mówimy, że gra hΘ∗ , D∗ , ri ma wartość v. Jeżeli ponadto istnieją
τ0 ∈ Θ∗ oraz δ0 ∈ D∗ dla których r(τ0 , δ0 ) = v, to minimaksowa reguła δ0 jest bayesowska względem
rozkładu najmniej korzystnego.
Definicja 1.21
Funkcja f : (X, T ) → R jest półciągła z dołu, gdy dla dowolnego c ∈ R zbiór {x | f (x) > c} jest otwarty
w X.
Twierdzenie 1.22 (minimaksowe)
Niech będzie dana gra hΘ, D∗ , R∗ i. Jeżeli D jest przestrzenią zwartą, a funkcja R∗ (θ, ·) : D∗ → R jest
półciągła z dołu dla dowolnego θ ∈ Θ, to istnieje wartość gry hΘ, D∗ , R∗ i oraz istnieje minimaksowa
reguła decyzyjna.
3
1.4
1.4
Klasy reguł decyzyjnych
1
TEORIA GIER
Klasy reguł decyzyjnych
Definicja 1.23
Reguła δ1 nazywa jest nie gorszą niż reguła δ2 , gdy R∗ (θ, δ1 ) ≤ R∗ (θ, δ2 ) dla θ ∈ Θ
Definicja 1.24
Reguła δ1 jest równoważna regule δ2 , gdy dla dowolnego θ ∈ Θ mamy R∗ (θ, δ1 ) = R∗ (θ, δ2 ).
Definicja 1.25
Reguła decyzyjna δ ∈ D∗ nazywa się dopuszczalna, gdy nie istnieje reguła decyzyjna lepsza od niej.
W przeciwnym wypadku δ nazywamy regułą niedopuszczalną.
Definicja 1.26
Klasa C ⊆ D∗ reguł decyzyjnych jest zupełna, gdy dla każdej reguły δ ∈ D∗ \ C istnieje reguła δ0 ∈ C
lepsza niż δ.
Definicja 1.27
Klasa C ⊆ D∗ reguł decyzyjnych jest istotnie zupełna, gdy dla każdej reguły δ ∈ D∗ \ C istnieje reguła
δ0 ∈ C nie gorsza niż δ.
Lemat 1.28
Jeżeli klasa C jest zupełna, to C zawiera wszystkie reguły dopuszczalne.
Lemat 1.29
Jeżeli klasa C jest klasą istotnie zupełną i istnieje reguła dopuszczalna δ ∈
/ C, to istnieje reguła δ0 ∈ C
równoważna regule δ.
Definicja 1.30
Klasa C ⊆ D∗ reguł reguł decyzyjnych nazywa się minimalną klasą (istotnie) zupełną, gdy jest klasą
(istotnie) zupełną i nie istnieje właściwa (istotnie) zupełna podklasa C.
Twierdzenie 1.31
Jeśli dla gry hΘ, D∗ , R∗ i istnieje minimalna klasa zupełna, to jest ona równa klasie wszystkich reguł
dopuszczalnych.
1.5
Istotna zupełność klas niezrandomizowanych reguł decyzyjnych przy
wypukłej funkcji straty
Lemat 1.32
Niech S będzie wypukłym podzbiorem Rk , a Z-k-wymiarowym wektorem losowym o wartościach w S.
Jeżeli wektor E[Z] istnieje, to E[Z] ∈ S.
Twierdzenie 1.33 (Nierówność Jensena)
Niech S będzie wypukłym podzbiorem Rk , a Z-k-wymiarowym wektorem losowym o wartościach w S
takim, że wektor E[Z] istnieje. Wówczas jeśli f : S → R jest wypukła i jeśli f (Z) jest P -całkowalną
zmienną losową, to
f (E[Z]) ≤ E[f (Z)]
Twierdzenie 1.34 (Warunkowa nierówność Jensena)
Niech S będzie wypukłym podzbiorem Rk , a Z-k-wymiarowym P -całkowalnym wektorem losowym o
4
1.6
Istotna klasy reguł opartych na statystyce dostatecznej
1
TEORIA GIER
wartościach w S. Wówczas jeśli f : S → R jest wypukła i jeśli f (Z) jest P -całkowalną zmienną losową,
to
f (E[Z|E]) ≤ E[f (Z)|E] p.w.
dla dowolnego σ-ciała E ⊆ F.
Twierdzenie 1.35
Rozpatrzmy grę hΘ, A, Li, gdzie A ⊆ Rk jest wypukły i dla dowolnego θ ∈ Θ funkcja L(θ, ·) : A → R
jest wypukła. Wówczas jeśli dla pewnego θ0 ∈ Θ istnieją liczby ε > 0 oraz c ∈ R takie, że
∀a ∈ A
L(θ0 , a) ≥ ε||a|| + c
to dla dowolnej α ∈ A∗ istnieje a ∈ A dla którego
∀θ ∈ Θ
L(θ, a) ≤ L∗ (θ, α)
Wniosek 1.36
Jeśli A jest wypukłym podzbiorem Rk i dla każdego θ ∈ Θ funkcja straty L(θ, ·) : A → R jest wypukła
oraz taka, że dla dowolnego θ0 ∈ Θ
εE[||Z||] + c ≤ E[L(θ0 , Z)]
dla pewnych ε > 0 i c, gdzie Z przyjmuje wartości z A, to klasa niezrandomizowanych reguł decyzyjnych
D jest iststnie zupełna dla gry hΘ, D̃, R̃i.
1.6
Istotna zupełność klasy reguł decyzyjnych opartych na statystyce dostatecznej
Rozważmy (X , A, P) gdzie P = {Pθ | θ ∈ Θ}. Załóżmy, że istnieje statystyka dostateczna dla P:
T = T (X) : (X , A) → (T , C). Rozpatrzmy grę hΘ, D̃, R̃i, δ̃ : X → A∗ i niech δ̃x = δ̃(x).
Definicja 1.37
Reguła decyzyjna δ̃ : (X , A) → (A∗ , J ∗ ) nazywa się regułą opartą na statystyce T , gdy istnieje Cmierzalna funkcja ψ : T → A∗ taka, że
δ̃x = ψ(T (x)) x ∈ X
Załóżmy, że X jest borelowskim podzbiorem Rk oraz że dla dowolnych θ ∈ Θ oraz A ∈ A istnieje
wersja prawdopodobieństwa warunkowego Pθ [A | T = t] taka, że P [· | T = t] jest miarą probabilistyczną
na (X , A) dla dowolnego t ∈ T .
Ponieważ T jest statystyką dostateczną dla P, to rozkład warunkowy nie zależy od θ. Niech δ̃ ∈ D̃ i
niech
Z
δ̃t0 (B) =
δ̃x (B) dP (x|T = t)
Wtedy
δ̃t0
X
∗
nie zależy od θ i jest rozkładem z A i jest funkcją statystyki T (jest na niej oparta).
Lemat 1.38
Niech f będzie J mierzalną i δ̃x całkowalną dla każdego x ∈ X funkcją rzeczywistą określoną na A.
Jeśli całka
Z Z
f (a) dδ̃x (a) dP (x|T = t)
X
A
istnieje i jest skończona dla każdego t ∈ T , to funkcja f jest δ̃t0 -całkowalna dla każdego t ∈ T i zachodzi
równość
Z
Z Z
f (a) dδ̃t0 (a) =
f (a) dδ̃x (a) dP (x|T = t)
A
X
A
5
1.6
Istotna klasy reguł opartych na statystyce dostatecznej
1
TEORIA GIER
Twierdzenie 1.39
Jeżeli T jest statystyką dostateczną dla P = {Pθ | θ ∈ Θ} na (X , A), to zbiór D̃0 ⊆ D̃ reguł opartych
na statystyce T jest klasą istotnie zupełną dla gry hΘ, D̃, R̃i.
Twierdzenie 1.40
Niech A będzie wypukłym podzbiorem Rk , a funkcja L(θ, a) wypukłą funkcją zmiennej a ∈ A dla
każdego θ ∈ Θ. Niech T będzie statystyką dostateczną dla Θ. Wówczas jeżeli dla pewnego θ0 ∈ Θ
istnieją stałe ε > 0 oraz c ∈ R takie, że L(θ0 , a) ≥ ε||a|| + c, to klasa D̃0 niezrandomizowanych reguł
decyzyjnych opartych na T jest klasą istotnie zupełną dla gry hΘ, D̃, R̃i
Twierdzenie 1.41 (Rao, Blackwell)
Niech A będzie wypukłym podzbiorem Rk , a funkcja L(θ, a) wypukłą funkcją zmiennej a ∈ A dla
każdego θ ∈ Θ. Niech T będzie statystyką dostateczną dla Θ. Jeżeli d ∈ D jest niezrandomizowaną
reguła decyzyjną, to reguła d0 ∈ D dana wzorem
d0 (t) = E[d(X) | T = t]
jest nie gorsza niż reguła d.
6