統計的決定　その２

2017年7月24日

引き続き、統計的な意思決定について学習しました。

前回の傘よりも少し複雑な意思決定について、効用を最大化する方法を考えます。

多段階決定問題

・資源の採掘に成功したら１０００億円の収入。
・資源の採掘を断念したら２００億円のペナルティ。
・採掘法Aは４００億円のコストがかかり成功率0.7
・採掘法Bは５００億円のコストがかかり成功率0.9
・採掘法Aに失敗してから採掘法Bで再挑戦可能。

決定木（decision tree)

収入を青字、ペナルティを赤字、コストを緑字で表しています。

決定ノードDが２個あるのがポイント。
多段階の決定を含む問題の解き方
↓
末尾から逆向きに解いていく
この問題ではD2から考える。

・採掘断念（a3）・・・－２００
・採掘法B（a4）
→　採掘成功(Θ3)・・・－５００＋１０００＝５００
→　採掘失敗(Θ4)・・・－５００－２００＝－７００

・成功確率0.9

期待効用は
0.9×500+0.1×(-700)=380

すでに採掘法Aで２００億円のコストがかかっているが、Bで再挑戦したら３８０億円の効用が期待できる。

∴　採掘法Aに失敗したら採掘法Bで再挑戦すべき

今度はD1について考える

：採掘法Aで採掘する場合 A(a1)：

・失敗してもD2で３８０億円の効用が見込めることに留意する。
→　採掘成功(Θ1)・・・－４００＋１０００＝６００
→　採掘失敗(Θ2)・・・－４００＋３８０＝－２０

・成功確率0.7

期待効用は
0.7×600+0.3×(-20)=414

：採掘法Bで採掘する場合 B(a2)：

→　採掘成功(Θ5)・・・－５００＋１０００＝５００
→　採掘失敗(Θ6)・・・－５００－２００＝－７００

・成功確率0.9

期待効用は
0.9×500+0.1×(-700)=380

＊採掘法A、失敗したら採掘法Bで再挑戦→　４１４億円
＊最初から採掘法B→　３８０億円

：結論：
最初に採掘法Aを選択し、失敗したら採掘法Bで再挑戦するのが最も期待効用が高い意思決定

このようにして期待効用を最大化する意思決定を計算によって導き出すことが可能であるが・・・

人間は必ず期待効用が最大になる意思決定を行うかというとそうではなく、期待効用最大化に従わない意思決定の例が数多く報告されている。よって、期待効用最大化による意思決定支援の重要性について各方面で研究が進んでいる。

期待効用最大化をめぐる問題は心理学や行動経済学でさかんに研究がおこなわれている。