なぜ期待される効用をそんなに気にするのですか?


8

意思決定理論について素朴な質問があります。特定の決定を前提としてさまざまな結果の確率を計算し、各結果にユーティリティまたはコストを割り当てます。期待される最大の有用性を持つものを見つけることにより、最適な決定を見つけます。

しかし、なぜこのように推論する必要があるのでしょうか。実際、各決定には、それに関連する効用の分布があります。なぜ単一の要約統計量だけで異なる選択肢のユーティリティの分布を比較するのですか?そして、なぜモードや中央値などではなく平均値を選ぶのでしょうか?

2つの選択肢で期待される効用は同じであるが、効用の分布が大きく異なる場合を想像できます。確かに意思決定は、期待のみではなく、配布全体に基づいて行われるべきですか?

分布全体を使用して決定を行うためのスキームでは、期待される最大の効用で同じ結果が得られる効用関数が存在する必要があると言っていますか?もしそうなら、私たちはとにかくユーティリティを忠実に構築し、私たちが望むように決定ルールを選択するべきではないでしょうか?後で、忠実なユーティリティを、最大の期待で同じ結果が得られるユーティリティに変換できます。


3
たとえば、chを参照してください。ユーティリティ関数の存在の根底にある公理のレビューのためのC.ロバート(2007)の「ベイズの選択」の2.2。
Jarle Tufto 2017年

1
@JarleTuftoの+1。また、ベイジアン推論を実行するときは、ユーティリティインデックスパラメータに特異値を選択する必要がないことにも注意してください。θ。むしろ、あなたはあなたがディストリビューションを構築することをあなた自身に課しますπ 以上 θこれは、あなたの以前の信念によって正則化された期待される[対数尤度]損失を最小化します(期待される有用性を最大化します)。
エレミアスK

回答:


8

定理は、フォン・ノイマン・モルゲンシュテルンユーティリティ(各シナリオが確率的にいくつかの成果に解決、そのようなあなたが最良から最悪のシナリオのセットを注文することができないという事実など、)いくつかの合理的な仮定の下で、各をマッピングする機能が存在することを意味実際の値(「ユーティリティ」)への可能な結果。期待されるユーティリティがより高いシナリオを常に好むようになります。したがって、期待される実用性を最大化する選択を常に選択することは理にかなっています。

2つの選択肢で期待される効用は同じであるが、効用の分布が大きく異なる場合を想像できます。

VNMユーティリティはこれを考慮に入れているため、リスクを嫌う場合でも、予想される最も高いユーティリティシナリオが最も望ましいでしょう。

分布全体を使用して決定を行うためのスキームでは、期待される最大の効用で同じ結果が得られる効用関数が存在する必要があると言っていますか?もしそうなら、私たちはとにかくユーティリティを忠実に構築し、私たちが望むように決定ルールを選択するべきではないでしょうか?後で、忠実なユーティリティを、最大の期待で同じ結果が得られるユーティリティに変換できます。

結果として得られる効用関数は理想的なVNM効用とは異なるため、推測や一部のヒューリスティックスを介して特定の結果の効用を概算する戦略は不完全な意思決定につながると言いたいのです。ユーティリティを「忠実に」構築すると、問題が解決し、ユーティリティを最大化することで正しい答えが得られるようになります。


1

私の答えはあなたを驚かせるかもしれません。期待される効用理論の範囲内でそれを超えて答えます。

期待される効用を超えて

期待される効用理論itlefが意思決定の唯一の方法ではありません。ユーティリティ理論を使用するかどうかは、アプリケーションによって異なります。たとえば、ウェルスマネジメントでは、期待される効用ではなくプロスペクト理論を使用するアドバイザーもいます。カーネマン、この理論に関する彼の研究に対してノーベル経済学賞を受賞しました。それは、期待される効用理論を超えて、経済学における意思決定の行動的側面をもたらしました。

実際には、従来のポートフォリオ選択アプローチでは、ウェルスアドバイザーがクライアントのユーティリティ関数を構築し、それを使用して効率的なフロンティアで最適なポートフォリオを選択します。見通し理論アプローチでは、アドバイザーは効用関数の代わりに価値関数を構築しようとし、前者を使用して最適なポートフォリオを選択します。

期待される効用理論の範囲内

2つの選択肢で期待される効用は同じであるが、効用の分布が大きく異なる場合を想像できます。確かに意思決定は、期待のみではなく、配布全体に基づいて行われるべきですか?

これで、従来の効用理論でさえ、これが処理されます。たとえば、彼らはリスク回避と確率的支配の概念を持っています。リスクを嫌う人は、期待される有用性だけに基づいて決定を下すことはありません。それはリスクに中立な人です。たとえば、リスクを嫌う人々は、期待される有用性が同じである決定が提示されると、エントロピーの低い決定を好むでしょう。これは、確率的優位性と呼ばれます。

アナロジーは、平均は同じだが分散が異なる2つのnromal分布を調べることになります。はい、これらは異なる分布であり、分散は多くのアプリケーションで重要です。ただし、これは平均値を知ることの重要性を減じるものではありません。正規分布を完全に定義するには、平均と分散の両方を知る必要があり、平均自体が分布について多くを知らせます。同様に、期待されるユーティリティは、エージェントのユーティリティ機能について知る必要がある唯一のものではありませんが、それでもなお多くの情報です。


0

これは、実際には期待値に関する問題であり、すでに別の場所で説明されています。あなたは私たちがいることを、正しいあるすべきである全体のディストリビューションに興味があるが、あるハード全体の分布を比較すると、シングルポイントの要約を比較すると、はるかに簡単です。はい、他の単一点集計を比較することもできますが、多くの場合、それらを比較しますが、期待値には、ランダム変数の非常に優れた単一点集計になるいくつかの優れたプロパティがあります。期待値は、確率によって可能な結果に重みを付けますそして、長期的に何を「期待」できるかを教えてくれます。カジノと対戦する場合、予想される勝ち負けの価値はマイナスになるので、長期的に見れば金持ちになるとは期待できません。

ゲーム理論上非常に厳密ではない例を挙げましょう。あなたがロシアンルーレットをプレイすることを検討していると想像してみてください。チャンバー内に弾丸が1つしかない6ショットリボルバーを使用して、自分に向かって1ショットを撮ります。何も起こらなければ、あなたは$ 1000 を勝ち取り、そうでなければあなたは死にます。モードの結果は、中央値と同じように、$ 1000 を獲得することです。このゲームの期待値は5/6です× 1000 ドル+ 1/6 ×死、あなたは遊んでみませんか?もちろんゲームの理論的なアプローチでは、獲得したお金の実際の効用は何であり、死ぬことの代償は何であるかを検討しますが、深く掘り下げることなく、ここで期待値を1つのポイントの要約として使用するポイントを確認する必要があります。 。

期待値(およびその推定値)は外れ値の影響を受けやすく、これがそのように使用する理由の1つです。価格が1 ドルの場合、競争についても検討しますか?どの程度$ 1 000 000 000?「可能性のある」結果の基準としてモードまたは中央値を使用していた場合は、どちらの場合も「平均して」勝ったと表示されるため、気にする必要はありません。空の弾丸で撃っていたら、気が変わりますか?モード、また中央値のいずれもないことに注意してくださいませんあなたは空白を使用している場合、彼らは以来、変化し気にしない極端な成果については、まだ期待値が劇的に変化します*。期待値(および平均)すべてを考慮 可能な結果と確率によってそれらに重みを付けることが、決定シナリオでそれを使用する理由です。

より現実的な例は、1000クーポンと1つだけの当選クーポンを含む宝くじです。価格が1000 ドルであるとすると、期待値は999/1000になります。× $ 0+ 1/1000 × $ = 1000 $ 1の価格ではありません未満の場合クーポンは購入する価値がないので、$ 1あなたは多く、何回もゲームをプレイした場合、あなたは数回を獲得し、多くの時間と全体のバランスを失うであろうと、この手段に投資されて獲得した金額の約$ 1になります。クーポン価格を変更せずに賞金が$ 10,000に変更された場合、期待値が$ 10に変更されるため、ストーリーは異なります。ここでも、モードまたは中央値はどちらの場合も0 ドルなので、ペイオフの影響を受けません。これは役に立たないと言っているわけではありませんが、期待値がここで通常必要なものであることを示しています。

*-正直に言うと、空白自分を殺すことができるので、この例は誤解を招く可能性があります、議論のために、ある種の架空の「安全な」空白があるとしましょう。


うーんありがとうございます。もっと一般的な説明を探しています。私はロシアのルーレットの例にかなり満足しています
innisfree '13年

@innisfreeより一般的な説明はどういう意味ですか?
Tim

1
予想される最大の有用性と選択を行うための代替スキームについての一般的な結果と備考。
innisfree 2017年

@innisfreeこれは私が見せようとしたものです、私の編集を見てください、多分それは役に立ちます。
Tim

興味深いが、ほとんど説得力がない。平均が以下に敏感であることは事実ですp(x) すべてのために xですが、ディストリビューションの他の機能も同様です。そして、それらすべてを考慮すると、基本的にはディストリビューションそのものであるディストリビューションのすべての瞬間を考慮していることになります。
innisfree 2017年

0

その回答の中で、@ shimaoはフォンノイマンモルゲンシュテルン効用定理に焦点を当てました。この定理は、実際には、効用のその他の要約統計量ではなく、実際に効用の分布全体ではなく、予想される効用を考慮する理由の中心にあります。

定理は、いくつかの公理から、不確実性に直面した場合、意思決定者は期待される有用性を最大化する一連の行動を選択する必要があることを示しています。私の質問に関連する公理は連続性の公理だと思います。

3つの可能な選択肢を順番にランク付けします。 LMN、 どこ AB 結果を示します A 転帰よりも悪いまたは良くない B。連続性の公理は確率が存在しなければならない、p、そのオプションを取ること L 確率で p とオプション N 確率で 1p オプションを取るだけで良い M、つまり、 p そのような

pL+(1p)NM
完全な証明を繰り返さずに、これがユーティリティの分散(またはその他の瞬間)が重要ではない理由を示唆していることは明らかです。極端な結果は関係ありませんL そして N ですが、私たちの公理は、取る選択肢が L 確率で p そして N そうでなければ、こだわりと同じくらい良い選択です M。これは、前者が実用性に大きな変動をもたらす可能性があるという事実にもかかわらずです。


0

あなたの質問に関して少し混乱を引き起こしているいくつかのわずかな言語の間違いがあります。

しかし、なぜこのように推論する必要があるのでしょうか。実際、各決定には、それに関連する効用の分布があります。なぜ単一の要約統計量だけで異なる選択肢のユーティリティの分布を比較するのですか?そして、なぜモードや中央値などではなく平均値を選ぶのでしょうか?

ユーティリティにはディストリビューションがありません。結果には分布があり、結果を介して、アクションには、場合によっては分布があります。ユーティリティは確定的です。それがランダムである場合、結果に関するあなたの感情は常にあなたを驚かせます。たとえば、「すごい、自動車事故で足がつぶれたのは意外といい経験でした」という体験ができます。不確かなのは、行動の結果です。

積分が発散する縮退したケースを除外し、解が存在しない場合、中央値が期待される有用性を最大化するケースも示すことができると思います。

ご了承ください U(δ(x),μ)=L(δ(x),μ)。ユーティリティで評価するルールを作成することが重要であることがわかります。μ ある程度一貫しています。

私たちは解決したいです:

minδL(δ,μ)=|δ(x)μ|
対象
f(x|μ)=1π11+(xμ)2.

私たちがいることを前提とした場合その後のリスクがあるPr(μ)1,

|δ(x)μ|i=1n1π11+(xiμ)2dx

統合されたリスクは、ときに最小になりは最小です。が中央値のときに最小化します。

|δ(x)μ|i=1n1π11+(xiμ)2dxdμ
δ(x)

データの中央値を見つけたときに、期待される効用を最大化します。の平均を見つけることができません

f(x|μ)=1π11+(xμ)2,
存在しないので。平均がないため、分散もありません。分散がないため、2次損失を最小化できません。その結果、2次効用は、それが真の場合である場合、実数の任意の値によって最小化されます。

上記のような退化したケースを無視すると、期待されるユーティリティは他の方法に比べて予期しない利点があります。考えられるすべての決定ルールと実行可能なアクションを考慮して、予想されるユーティリティを使用すると、完全な順序になります。あなたは正しいです、タイが存在する可能性がありますが、すべてのパラメーターの影響が考慮されているため、タイドユーティリティの選択肢は無関心です。

代替案は、頻度決定理論で使用されており、確率的支配を介してリスク関数を順序付けることです。頻度論的決定は、それが確率論的に支配され得ない場合、許容可能であると言われています。これは、完全な順序付けを許可しません。それにもかかわらず、δ(x) 一次確率的に支配します δ(x)、それから選択することの期待される有用性は δ>δ。したがって、代替案では同じ結果が得られます。

用いることができる他のいくつかのソリューションがありますが、それらはいずれかの期待効用を最大にマッピング、または彼らはあなたが彼らがいない場合にそれらを使用する理由の論点先取。別の統計例を示すために、最尤法またはベイズ法を使用して100万観測のサンプルサイズを持つ調査研究を読んだとします。100のサンプルサイズでスタディを複製し、不偏推定量を使用して平均と分散を推定します。ベイジアン推定値も最尤推定量も、一般的なケースでは不偏ではありません。

あなたは他の見積もりが偏っているのであなたは自分の見積もりを結合しないと主張しますが、あなたの見積もりは偏っていません。ベイジアン法は、サンプルを単一点推定器に結合してユーティリティを最大化するための統制のとれた方法を提供します。あなたは、100万人のサンプルの情報を失うことを主張し、公平さを支持します。

さて、もしあなたのユーティリティが不偏推定量に対して非常に強いバイアスを持っているなら、あなたはあなたの推定量のユーティリティを最大化しないことによってあなたのユーティリティを最大化するでしょう。しかし、それがない場合、バイアスされた推定量は、小さなサンプルのみの場合よりもはるかに正確になります。精度がユーティリティを最大化する場合、ユーティリティを最大化する推定量を選択することになります。

ユーティリティの期待とアクションの期待値を混同しないでください。それらは異なるものです。

また、期待される効用と中央値の効用を最大化することも検討してください。すべての結果の効用にその確率を掛けて合計します。

E[U(x~)]=x~χU(x~)Pr(x~)dx~

次に、中央値ユーティリティについて考えてみましょう。

M[U(x~)]=c
もし
acU(x~)Pr(x~)dx~=cbU(x~)Pr(x~)dx~.

それはどういう意味ですか?あなたが右に着陸したのと同じくらい左に着陸したなら、あなたは幸せですc?なぜあなたはそれを気にしますか?

期待される実用性を最大化するアクションを選択した場合、あなたがあなたを幸せにするだろうと信じるあなたが取ることができるアクションはありません。中央にいるという力によってアクションが選択されるため、中央値ユーティリティは最大化を許可しません。あなたはいつもあなたにいつもより幸せかいつもより悲しいという50パーセントの確率を与える行動をとるでしょう。なんて奇妙なことでしょう!

編集 コルモゴロフの公理から、分布の合計は1に等しくなければなりません。2つのアクションセットがあるケースを考えます。a そして a、 どこ a ないアクションのセットです a

に集中する a、効用関数が x2。と仮定しましょうx、アクションが a、から引き出されます f(x)=exp(x),x>0

それに注意

0exp(x)dx=1,
それが確率密度関数であることを簡単に確認できます。ユーティリティ結果を含める
0x2exp(x)dx=2,
これは分布ではないことを確認します。
E(U(a))=2.

ユーティリティでディストリビューションを構築することは可能ですが、 g(x)=U(x)Pr(x)、その後 g1(x) 関数であるとは限りません。


もちろんユーティリティにはディストリビューションがあります!?私はあなたが何について話しているのかわからない
イニスフリー

あ、そう。特定の確実な結果の有用性AU(A)、確かに「確定的」です。ただし、結果はアプリオリに不明であるため、結果Osome distribution、先験的に未知の分布もある U(O)
innisfree
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.