あなたの質問に関して少し混乱を引き起こしているいくつかのわずかな言語の間違いがあります。
しかし、なぜこのように推論する必要があるのでしょうか。実際、各決定には、それに関連する効用の分布があります。なぜ単一の要約統計量だけで異なる選択肢のユーティリティの分布を比較するのですか?そして、なぜモードや中央値などではなく平均値を選ぶのでしょうか?
ユーティリティにはディストリビューションがありません。結果には分布があり、結果を介して、アクションには、場合によっては分布があります。ユーティリティは確定的です。それがランダムである場合、結果に関するあなたの感情は常にあなたを驚かせます。たとえば、「すごい、自動車事故で足がつぶれたのは意外といい経験でした」という体験ができます。不確かなのは、行動の結果です。
積分が発散する縮退したケースを除外し、解が存在しない場合、中央値が期待される有用性を最大化するケースも示すことができると思います。
ご了承ください U(δ(x),μ)=−L(δ(x),μ)。ユーティリティで評価するルールを作成することが重要であることがわかります。μ ある程度一貫しています。
私たちは解決したいです: minδL(δ,μ)=|δ(x)−μ|
対象f(x|μ)=1π11+(x−μ)2.
私たちがいることを前提とした場合その後のリスクがあるPr(μ)∝1,∫∞−∞|δ(x)−μ|∏i=1n1π11+(xi−μ)2dx
統合されたリスクは、ときに最小になりは最小です。が中央値のときに最小化します。∫∞−∞∫∞−∞|δ(x)−μ|∏i=1n1π11+(xi−μ)2dxdμ
δ(x)
データの中央値を見つけたときに、期待される効用を最大化します。の平均を見つけることができませんf(x|μ)=1π11+(x−μ)2,
存在しないので。平均がないため、分散もありません。分散がないため、2次損失を最小化できません。その結果、2次効用は、それが真の場合である場合、実数の任意の値によって最小化されます。
上記のような退化したケースを無視すると、期待されるユーティリティは他の方法に比べて予期しない利点があります。考えられるすべての決定ルールと実行可能なアクションを考慮して、予想されるユーティリティを使用すると、完全な順序になります。あなたは正しいです、タイが存在する可能性がありますが、すべてのパラメーターの影響が考慮されているため、タイドユーティリティの選択肢は無関心です。
代替案は、頻度決定理論で使用されており、確率的支配を介してリスク関数を順序付けることです。頻度論的決定は、それが確率論的に支配され得ない場合、許容可能であると言われています。これは、完全な順序付けを許可しません。それにもかかわらず、δ(x) 一次確率的に支配します δ′(x)、それから選択することの期待される有用性は δ>δ′。したがって、代替案では同じ結果が得られます。
用いることができる他のいくつかのソリューションがありますが、それらはいずれかの期待効用を最大にマッピング、または彼らはあなたが彼らがいない場合にそれらを使用する理由の論点先取。別の統計例を示すために、最尤法またはベイズ法を使用して100万観測のサンプルサイズを持つ調査研究を読んだとします。100のサンプルサイズでスタディを複製し、不偏推定量を使用して平均と分散を推定します。ベイジアン推定値も最尤推定量も、一般的なケースでは不偏ではありません。
あなたは他の見積もりが偏っているのであなたは自分の見積もりを結合しないと主張しますが、あなたの見積もりは偏っていません。ベイジアン法は、サンプルを単一点推定器に結合してユーティリティを最大化するための統制のとれた方法を提供します。あなたは、100万人のサンプルの情報を失うことを主張し、公平さを支持します。
さて、もしあなたのユーティリティが不偏推定量に対して非常に強いバイアスを持っているなら、あなたはあなたの推定量のユーティリティを最大化しないことによってあなたのユーティリティを最大化するでしょう。しかし、それがない場合、バイアスされた推定量は、小さなサンプルのみの場合よりもはるかに正確になります。精度がユーティリティを最大化する場合、ユーティリティを最大化する推定量を選択することになります。
ユーティリティの期待とアクションの期待値を混同しないでください。それらは異なるものです。
また、期待される効用と中央値の効用を最大化することも検討してください。すべての結果の効用にその確率を掛けて合計します。E[U(x~)]=∫x~∈χU(x~)Pr(x~)dx~
次に、中央値ユーティリティについて考えてみましょう。M[U(x~)]=c
もし ∫caU(x~)Pr(x~)dx~=∫bcU(x~)Pr(x~)dx~.
それはどういう意味ですか?あなたが右に着陸したのと同じくらい左に着陸したなら、あなたは幸せですc?なぜあなたはそれを気にしますか?
期待される実用性を最大化するアクションを選択した場合、あなたがあなたを幸せにするだろうと信じるあなたが取ることができるアクションはありません。中央にいるという力によってアクションが選択されるため、中央値ユーティリティは最大化を許可しません。あなたはいつもあなたにいつもより幸せかいつもより悲しいという50パーセントの確率を与える行動をとるでしょう。なんて奇妙なことでしょう!
編集
コルモゴロフの公理から、分布の合計は1に等しくなければなりません。2つのアクションセットがあるケースを考えます。a そして a′、 どこ a′ ないアクションのセットです a。
に集中する a、効用関数が −x2。と仮定しましょうx、アクションが a、から引き出されます f(x)=exp(−x),x>0。
それに注意 ∫∞0exp(−x)dx=1,
それが確率密度関数であることを簡単に確認できます。ユーティリティ結果を含める∫∞0x2exp(−x)dx=−2,
これは分布ではないことを確認します。 E(U(a))=−2.
ユーティリティでディストリビューションを構築することは可能ですが、 g(x)=U(x)Pr(x)、その後 g−1(x) 関数であるとは限りません。