MMT-09 Teoria decyzji
Transkrypt
MMT-09 Teoria decyzji
2012-11-27 W warunkach zupełnej niepewności TEORIA DECYZJI Gry z naturą Podejmowanie decyzji w warunkach niepewności Reguła Walda Reguła Hurwicza na kiełbaskę z grilla •Nie mamy żadnych podstaw do określenia częstości występowania stanów natury W warunkach częściowej niepewności Reguła Savage’a Do obsługi linii może uruchomić: 100% posiadanych autobusów - strategia x1 50% posiadanych autobusów - strategia x2 20% posiadanych autobusów - strategia x3 •Możemy oszacować (obserwacja, doświadczenie) częstość występowania stanów natury Podejście pesymistyczne, asekuracyjne, wykorzystuje kryterium maxyminowe a i0 = max min a ij j i Reguła Laplace’a – Bayesa W niedzielę firma „Wesoły Autobusik” może zorganizować linię wycieczkową do Pcimia Dolnego SN -1 SNSN -2 R. Walda D -1 -10 200 -10 D -2 -6 80 -6 D -3 0 -4 0 d s x1 -10 200 x2 -6 80 x3 0 -4 Macierz strat alternatywnych d ij = max aij − aij i SN -1 SNSN -2 D -1 10 0 R. Savage’a 10 D -2 6 120 120 D -3 0 204 204 Wybieramy taką strategię, która spełnia postulat minimalizacji strat relatywnych (minimalny maksymalny żal). min max d ij i j 1 2012-11-27 Wykorzystuje kryterium ważonego optymizmu Maksymalizacja wartości oczekiwanej wygranej 1 max α ⋅ max a ij + (1 − α ) ⋅ min a ij j i j i gdzie : α∈〈0,1〉 - współczynnik optymizmu SN -1 SNSN -2 R. Hurwicza α=0,2 D -1 -10 200 32 D -2 -6 80 11,2 D -3 0 -4 -3,2 możemy oszacować p-stwo warunkowe (obserwacje, eksperyment itd.) : ( p o l sn j ) n max n ∑ a ij j =1 Losowy wektor obserwacji czynnika skorelowanego ze stanem natury SN -1 SNSN -2 R. Laplace’a - Bayesa D -1 -10 200 95 D -2 -6 80 37 D -3 0 -4 -2 j=1,2,...,m sn2 o1 p (o1 sn1 ) p(o1 sn2 ) ok p(ok sn1 ) suma 1 〈f1,f2,f3, ... fM〉 tworzymy tabelę wartości gry wg schematu: wg tabeli: tabela zależności ⇓ sn1 ... snm ... p(o1 snm ) p(ok sn2 ) ... ... p(ok snm ) 1 ... 1 O T = o1 , o2 , K ok każdej obserwacji przyporządkowujemy jedną z n strategii : 〈x1,x2,x3, ... xn〉 otrzymując mk=M możliwych strategii decyzyjnych : l=1,2,...,k Możliwość oszacowania częstości występowania stanów natury o1 f1 f2 ... f mk x1 x2 ... x mk ... x mk ... ... x mk o2 x1 x1 ... ok ... x1 ... x2 ... sn j ... ... ... fs ... ... E sn j , f s = ∑ w ij ⋅ p o l sn j ( ) k l =1 ( ) ... ... 2 2012-11-27 Tworzymy tabelę gry: cd przykładu: p( o1 d ) = 0.3 Tworzymy tabelę gry: o wyż O = 1 = o 2 niż dodatkowe obserwacje: funkcje decyzyjne f1 f2 f3 f4 f5 f6 f7 f8 f9 o1 = wyż o2 = niż x1 x1 x1 x2 x1 x3 x2 x1 x2 x2 x2 x3 x3 x1 x3 x2 x3 x3 d s gra: d s * * * f2 f3 f4 f5 f6 f7 f8 f9 -10 200 -7.2 188 -3 179.6 -8.8 92 -6 80 -1.8 71.6 -7 16.4 -4.2 4.4 0 -4 f1 f2 -10 200 -7.2 188 f3 f6 -3 -1.8 179.6 71.6 d s -10 200 -7.2 188 f4 f5 f6 f7 f8 f9 x1 x3 x2 x1 x2 x2 x2 x3 x3 x1 x3 x2 x3 x3 Przykładowe obliczenia: E (d , f 2 ) = w11 ⋅ p(o1 d ) + w21 ⋅ p( o2 d ) = ( −10) ⋅ 0.3 + ( −6) ⋅ 0.7 = −7.2 f9 0 -4 gra 2×2 - rozwiązanie analityczne : d s 200 f3 f6 -3 -1.8 179.6 71.6 f1 -10 200 f9 0 -4 150 r ( f1 ) = 0.981 100 usuwamy strategie zdominowane : f2 f3 x1 x2 250 f1 f1 f2 x1 x1 ... E (s, f 2 ) = w12 ⋅ p(o1 s ) + w 22 ⋅ p(o 2 s ) = 200 ⋅ 0.9 + 80 ⋅ 01 . = 188 p( o 2 s ) = 0.1 * f1 o1 = wyż o2 = niż E (d , f 1 ) = w11 ⋅ p(o1 d ) + w11 ⋅ p( o2 d ) = ( −10) ⋅ 0.3 + ( −10 ) ⋅ 0.7 = −10 p( o1 s ) = 0.9 p( o2 d ) = 0.7 funkcje decyzyjne f9 50 0 -4 0 r ( f 9 ) = 1 − r ( f1 ) = 0.019 0 0,2 0,4 0,6 0,8 1 -50 3