学習

統計的決定 その1

統計的な意思決定について学習しました。
この知識は日常生活で役に立つような気がします。^0^

健康や株価など不確実性が伴う状況において、合理的な決定を行うには統計的アプローチが有効であると考えられる。

~ 期待効用の最大化に基づく意思決定 ~

期待効用の最大化に基づく決定とは

結果の評価値である効用の期待値が最大になるような行動や代替案の選択をすること。

例:外出時に傘を持っていくか?という意思決定

・雨が降る確率は0.5
・傘を持って外出、雨が降った・・・効用(うれしさ)は40
・傘を持って外出、雨が降らなかった・・・効用は20
・傘を持たずに外出、雨が降った・・・効用は0
・傘を持たずに外出、雨が降らなかった・・・効用は100
・傘を持って外出するべきか?


決定木(decision tree)

D1・・・決定ノード。ゲームの意思決定点。
a1,a2・・・行動。プレイヤーがどの戦略を選択するか。
C1,C2・・・チャンスノード。どの事象が生じるか。意思決定者の決定や努力とは無関係の事象。
Θ1,Θ2・・・結果として生じる事象。自然の状態。
p1,p2・・・生起確率。特定の自然の状態が生じる確率。
一番右の数値・・・効用。結果に対する評価。

*期待効用に基づく決定

・効用の期待値・・・期待効用
・特定の行動に対し、生ずる結果の確率で結果の効用を重み付けした和
・期待効用が最大になる行動をとる


傘を持っていくと決定した場合 a1

・確率p1=P(Θ1)=0.5 で雨が降る(Θ1)
・雨が降る(Θ1)時の効用u(a1,Θ1)は40
・確率p2=P(Θ2)=0.5 で雨は降らない(Θ2)
・雨が降らない(Θ2)時の効用u(a1,Θ2)は20

よって傘を持って外出した場合の期待効用は

P(Θ1)u(a1,Θ1)+P(Θ2)u(a1,Θ2)=0.5×40+0.5×20=30

傘を持って行かない決定した場合 a2

・確率p1=P(Θ1)=0.5 で雨が降る(Θ1)
・雨が降る(Θ1)時の効用u(a1,Θ1)は0
・確率p2=P(Θ2)=0.5 で雨は降らない(Θ2)
・雨が降らない(Θ2)時の効用u(a1,Θ2)は100

よって傘を持たずに外出した場合の期待効用は

P(Θ1)u(a1,Θ1)+P(Θ2)u(a1,Θ2)=0.5×0+0.5×100=50

傘を持って外出した場合の期待効用=30
傘を持たずに外出した場合の期待効用=50
∴ 降水確率50%なら、傘を持たずに外出すべし!

-学習

© 2024 Bou.O The World Powered by AFFINGER5