引き続き、統計的な意思決定について学習しました。
前回の傘よりも少し複雑な意思決定について、効用を最大化する方法を考えます。
多段階決定問題
・資源の採掘に成功したら1000億円の収入。
・資源の採掘を断念したら200億円のペナルティ。
・採掘法Aは400億円のコストがかかり成功率0.7
・採掘法Bは500億円のコストがかかり成功率0.9
・採掘法Aに失敗してから採掘法Bで再挑戦可能。
決定木(decision tree)
収入を青字、ペナルティを赤字、コストを緑字で表しています。
決定ノードDが2個あるのがポイント。
多段階の決定を含む問題の解き方
↓
末尾から逆向きに解いていく
この問題ではD2から考える。
D2
・採掘断念(a3)・・・-200
・採掘法B(a4)
→ 採掘成功(Θ3)・・・-500+1000=500
→ 採掘失敗(Θ4)・・・-500-200=-700
・成功確率0.9
期待効用は
0.9×500+0.1×(-700)=380
すでに採掘法Aで200億円のコストがかかっているが、Bで再挑戦したら380億円の効用が期待できる。
∴ 採掘法Aに失敗したら採掘法Bで再挑戦すべき
今度はD1について考える
:採掘法Aで採掘する場合 A(a1):
・失敗してもD2で380億円の効用が見込めることに留意する。
→ 採掘成功(Θ1)・・・-400+1000=600
→ 採掘失敗(Θ2)・・・-400+380=-20
・成功確率0.7
期待効用は
0.7×600+0.3×(-20)=414
:採掘法Bで採掘する場合 B(a2):
→ 採掘成功(Θ5)・・・-500+1000=500
→ 採掘失敗(Θ6)・・・-500-200=-700
・成功確率0.9
期待効用は
0.9×500+0.1×(-700)=380
*採掘法A、失敗したら採掘法Bで再挑戦→ 414億円
*最初から採掘法B→ 380億円
:結論:
最初に採掘法Aを選択し、失敗したら採掘法Bで再挑戦するのが最も期待効用が高い意思決定
このようにして期待効用を最大化する意思決定を計算によって導き出すことが可能であるが・・・
人間は必ず期待効用が最大になる意思決定を行うかというとそうではなく、期待効用最大化に従わない意思決定の例が数多く報告されている。よって、期待効用最大化による意思決定支援の重要性について各方面で研究が進んでいる。
期待効用最大化をめぐる問題は心理学や行動経済学でさかんに研究がおこなわれている。