学習

統計的決定 その3

~ 期待効用最大化原理 ~

期待効用が最大となる決定が、最適な決定であると言えるためにはいくつかの満たすべき前提条件がある。

*結果
・行動aを選択し、状態Θが生じた結果y=(a,Θ)

[前提1]:多様性公理
・行動と状態は各々2種類以上存在
・結果の集合は4つ以上の異なる結果を生む

*くじ
・確率pで結果y1、確率1-pで結果y2が起こるくじ
→ (y1:p1,p2:1-p)

・くじL1=(y1:p1,y2:1-p1)が確率qで起こり、
L2=(y3:p2,y4:1-p2)が確率1-qで起こる
複合的くじ
→ (L1:q,L2:1-q)

この場合4種類の結果が含まれるので4種類の結果とその生起確率を並べて書くことができるものとする。

(y1:p1q,y2:(1-p1)q,y3:p2(1-q),y4:(1-p2)(1-q))

∴ n種類の結果が起こるくじ
→ (y1:p1,y2:p2,・・・,yn:pn)

*選好 (好ましさの記号)

x ≧ y ・・・ yがxより好ましくはない
x ~ y ・・・ x≧y かつ y≧x ・・・無差別
x > y ・・・ x≧y であって y≧x でない
x≧y であって x ~ y でない

[前提2]: 弱順序公理
すべての結果やくじx,y,zに対して次の式が成り立つ。

・反射律  x ~ x (xとxは無差別である)
・推移律  x≧y かつ y≧z ならば x≧z
・完備性  x≧y または y≧x の少なくとも一方が成立

[前提3]: 連続性公理

x,y,zの間にx>y>zが成り立つならば

(x:p,z:1-p) ~ y

を満たす0<p<1が存在する

例)
・xは100円もらえる
・yは50円もらえる
・zは何ももらえない

確率0.01でxの結果、すなわち100円もらえる。
確率0.99でzの結果、すなわち何ももらえない。
というくじと

100%の確率でyの結果、すなわち50円もらえる権利

どちらがより好ましいか?

もちろん100%の確率で50円もらえるほう

では
確率0.99で100円
確率0.01で0円
のくじと
100%50円もらえる権利
では
もちろんくじのほうを引く

つまり100円をもらえる確率を調整すれば確実に50円もらえる権利と無差別にできる、ということを要請するのがこの連続性公理という前提

[前提4]: 独立性公理

x~yならば、任意のzと任意の0≦p≦1に対して

(x:p,z:1-p)~(y:p,z:1-p)

が成り立つ。

つまりxとyの選好関係はzやpとは無関係に決まる、という前提

[ 以上の前提1~4を満たす時 ]

・任意の結果x、yに対し

x≧y ⇔ u(x)≧u(y)

を満たす効用関数uが一意に決まる

・くじL=(y1:p1,y2:p2,・・・,yn:pn) の効用は

p1u(y1)+p2u(y2)+・・・+pnu(yn)

という式が成り立つ。

 

-学習

© 2024 Bou.O The World Powered by AFFINGER5