MMT-09 Teoria decyzji

Transkrypt

MMT-09 Teoria decyzji
2012-11-27
W warunkach zupełnej niepewności
TEORIA DECYZJI
Gry z naturą
Podejmowanie decyzji w warunkach
niepewności
Reguła
Walda
Reguła
Hurwicza
na kiełbaskę z grilla
•Nie mamy żadnych podstaw do określenia
częstości występowania stanów natury
W warunkach częściowej niepewności
Reguła
Savage’a
Do obsługi linii może uruchomić:
100% posiadanych autobusów - strategia x1
50% posiadanych autobusów - strategia x2
20% posiadanych autobusów - strategia x3
•Możemy oszacować (obserwacja,
doświadczenie) częstość występowania
stanów natury
Podejście pesymistyczne, asekuracyjne,
wykorzystuje kryterium maxyminowe
a i0 = max min a ij
j
i
Reguła
Laplace’a
– Bayesa
W niedzielę firma „Wesoły Autobusik” może zorganizować linię
wycieczkową do Pcimia Dolnego
SN -1
SNSN -2
R. Walda
D -1
-10
200
-10
D -2
-6
80
-6
D -3
0
-4
0
d
s
x1
-10
200
x2
-6
80
x3
0
-4
Macierz strat alternatywnych
d ij = max aij − aij
i
SN -1
SNSN -2
D -1
10
0
R. Savage’a
10
D -2
6
120
120
D -3
0
204
204
Wybieramy taką strategię, która spełnia
postulat minimalizacji strat relatywnych
(minimalny maksymalny żal).
min max d ij
i
j
1
2012-11-27
Wykorzystuje kryterium ważonego optymizmu
Maksymalizacja wartości oczekiwanej wygranej
1
max α ⋅ max a ij + (1 − α ) ⋅ min a ij 
j
i
j


i
gdzie : α∈〈0,1〉 - współczynnik optymizmu
SN -1
SNSN -2
R. Hurwicza
α=0,2
D -1
-10
200
32
D -2
-6
80
11,2
D -3
0
-4
-3,2
możemy oszacować p-stwo warunkowe (obserwacje, eksperyment itd.) :
(
p o l sn j
)
n
max  n ∑ a

ij
j =1



Losowy wektor obserwacji czynnika
skorelowanego ze stanem natury
SN -1
SNSN -2
R. Laplace’a
- Bayesa
D -1
-10
200
95
D -2
-6
80
37
D -3
0
-4
-2
j=1,2,...,m
sn2
o1
p (o1 sn1 )
p(o1 sn2 )
ok
p(ok sn1 )
suma
1
〈f1,f2,f3, ... fM〉
tworzymy tabelę wartości gry wg schematu:
wg tabeli:
tabela zależności ⇓
sn1
...
snm
...
p(o1 snm )
p(ok sn2 )
...
...
p(ok snm )
1
...
1
O T = o1 , o2 , K ok
każdej obserwacji przyporządkowujemy jedną z n strategii : 〈x1,x2,x3, ... xn〉
otrzymując mk=M możliwych strategii decyzyjnych :
l=1,2,...,k
Możliwość oszacowania częstości
występowania stanów natury
o1
f1
f2
...
f mk
x1
x2
...
x mk
...
x mk
...
...
x mk
o2
x1
x1
...
ok
...
x1
...
x2
...
sn j
...
...
...
fs
...
...
E sn j , f s = ∑ w ij ⋅ p o l sn j
(
)
k
l =1
(
)
...
...
2
2012-11-27
Tworzymy tabelę gry:
cd przykładu:
p( o1 d ) = 0.3
Tworzymy tabelę gry:
 o   wyż 
O =  1 = 

o 2   niż 
dodatkowe obserwacje:
funkcje decyzyjne
f1
f2
f3
f4
f5
f6
f7
f8
f9
o1 = wyż
o2 = niż
x1
x1
x1
x2
x1
x3
x2
x1
x2
x2
x2
x3
x3
x1
x3
x2
x3
x3
d
s
gra:
d
s
*
*
*
f2
f3
f4
f5
f6
f7
f8
f9
-10
200
-7.2
188
-3
179.6
-8.8
92
-6
80
-1.8
71.6
-7
16.4
-4.2
4.4
0
-4
f1
f2
-10
200
-7.2
188
f3
f6
-3
-1.8
179.6 71.6
d
s
-10
200
-7.2
188
f4
f5
f6
f7
f8
f9
x1
x3
x2
x1
x2
x2
x2
x3
x3
x1
x3
x2
x3
x3
Przykładowe
obliczenia:
E (d , f 2 ) = w11 ⋅ p(o1 d ) + w21 ⋅ p( o2 d ) = ( −10) ⋅ 0.3 + ( −6) ⋅ 0.7 = −7.2
f9
0
-4
gra 2×2 - rozwiązanie analityczne :
d
s
200
f3
f6
-3
-1.8
179.6 71.6
f1
-10
200
f9
0
-4
150
r ( f1 ) = 0.981
100
usuwamy strategie
zdominowane :
f2
f3
x1
x2
250
f1
f1
f2
x1
x1
...
E (s, f 2 ) = w12 ⋅ p(o1 s ) + w 22 ⋅ p(o 2 s ) = 200 ⋅ 0.9 + 80 ⋅ 01
. = 188
p( o 2 s ) = 0.1
*
f1
o1 = wyż
o2 = niż
E (d , f 1 ) = w11 ⋅ p(o1 d ) + w11 ⋅ p( o2 d ) = ( −10) ⋅ 0.3 + ( −10 ) ⋅ 0.7 = −10
p( o1 s ) = 0.9
p( o2 d ) = 0.7
funkcje decyzyjne
f9
50
0
-4
0
r ( f 9 ) = 1 − r ( f1 ) = 0.019
0
0,2
0,4
0,6
0,8
1
-50
3

Podobne dokumenty