これは、問題に対する「期待効用最大化/ゲーム理論」アプローチです(セット理論確率のダッシュが少しあります)。そのようなフレームワークでは、答えは明確に見えます。
プレミア
絶対に正直に言うと、は厳密に正の金額で、次の2つのチケットがボックスに入れられました: 割り当てられた識別番号と割り当てられた識別番号。次に、ベルヌーイ確率変数からの描画 が実行され、結果と発生したイベントに基づいて、金額とがエンベロープと入れられました。の値が何であるか、どのエンベロープにどれだけの量が送られたかはわかりません。{ A = x 、B = 2 x } 1 { A = 2 x 、B = x } 0 (p = 0.5 )x 2 x A B xx{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x2xABx
最初のケース:封筒を開かずに切り替えるオプションを選択します
最初の問題は、エンベロープをどのように選択するかです。これは設定と関係があります。したがって、ユーティリティ関数を使用して、ユーティリティの最大化が期待されていると仮定します。u()
ここでは、エンベロープを表す2つの二分確率変数ととそれらの量を考慮することにより、確率構造をモデル化できます。それぞれのサポートはです。しかし、それらは独立していません。したがって、共同配布から始める必要があります。表形式では、共同分布と対応する周辺分布はB { x 、2 x }AB{x,2x}
A/B→x2xMarg Bx00.50.52x0.500.5Marg A0.50.51.00
これは、とが同じ周辺分布であることを示しています。BAB
しかし、これは、エンベロープがどのように選択されるかは問題ではないことを意味します。これは、常に期待されるユーティリティと同じになるためです。
0.5⋅u(x)+0.5⋅u(2x)
ここで直面しているのは、2つの同一のギャンブル(各エンベロープ)に対する複合ギャンブル(エンベロープの選択方法)です。私たちは選択することができます確率で、、または何かで-間(および相補のための)。それは問題ではありません。私たちは常に同じ期待されるユーティリティを得ます。リスクに対する私たちの態度はここでは役割を果たしていないことに注意してください。1 0 BA10B
したがって、エンベロープを選択します(例)。それを調べています。現在、期待されるユーティリティは何ですか?選択する前とまったく同じです。エンベロープをどのような方法で選択しても、内部にあるものの確率には影響しません。A
切り替えさせていただきます。たとえば、エンベロープを保持しているとします。現在期待されているユーティリティは何ですか?以前とまったく同じです。B
これらは、私たちにとって世界の2つの可能な状態です選択か、選択します。いかなる選択の下でも、世界の両方の州は、私たちの選択された/想定された推進力に対して同じ値を意味します(つまり、期待される実用性を最大化します)。BAB
したがって、ここでは切り替えに無関心です。、そして実際にはランダム化することもできます。
2番目のケース:切り替え後のオプションでエンベロープを開く
を選択して開き、の量の中にあると仮定します。これは状況を変えますか? Y ∈ { X 、2 X }Ay∈{x,2x}
どれどれ。なんだろう
P(A=x∣A∈{x,2x})=?
さて、は確率変数が定義されているサンプル空間です。サンプル空間全体、つまり自明なシグマ代数の条件付けは、確率にも期待値にも影響しません。「すべての可能な値が実現されたかもしれないと知っているなら、の値は何ですか?」効果的な知識は得られていないため、まだ元の確率構造にあります。 A A{x,2x}AA
しかし、私はまた、何ですか
P(B=x∣A∈{x,2x})=?
イベントによって生成されたシグマ代数として適切に表示される条件付けステートメントは、ランダムベクトルされる製品サンプル空間全体です定義されました。上記のジョイント分布の表から、ジョイントの確率割り当てはマージナルの確率割り当て(メジャーゼロの2つのイベントの存在による「ほぼ確実」な資格)と同等であることがわかります。したがって、ここでもサンプル空間全体での確率を本質的に条件付けます。したがって、エンベロープを開くためのアクションは、確率構造にも影響しませんでした。{A∈{x,2x}}(A,B)BB
意思決定とともにゲーム理論を入力してください。封筒を開いたので、切り替えるかどうかを決める必要があります。切り替えない場合は、ユーティリティを取得します。切り替えると、次の2つの可能な状態になります。u(y)
y=x,u(A)=u(x)⟹u(B)=u(2x)
y=2x,u(A)=u(2x)⟹u(B)=u(x)
実際にどの状態が保持されているかはわかりませんが、上記の説明から、それぞれにの存在確率があることがわかります。 p=0.5
これは、対戦相手が「自然」であり、自然がランダム化された戦略で確実に機能することを知っているゲームとしてモデル化できます:および、。しかし、切り替えをしなければ、確実に見返りが得られるようになりました。これが通常の形のゲームであり、ペイオフが付いています。p=0.5 y=xp=0.5y=2x
We/nature→SwitchDon't Switchy=xu(2x)u(y)y=2xu(x)u(y)
我々は、置換する誘惑に抵抗するべきである及びするための。は既知の特定の見返りです。「スイッチ」戦略の見返りは実際にはわかりません(の値がわからないため)。したがって、置換を逆にする必要があります。場合は、場合はです。だからここに再び私たちのゲームがあります:u (2 x )u (y )u (y )u(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y)y=2xu(x)=u(y/2)
We/nature→SwitchDon't Switchy=xu(2y)u(y)y=2xu(y/2)u(y)
これで、マトリックスのすべての見返りがわかりました。純粋に支配的な戦略はありますか?
戦略「スイッチ」の期待される見返りは
E(VS)=0.5⋅u(2y)+0.5⋅u(y/2)
戦略「Do n't Switch」の期待される見返りは
E(VDS)=u(y)
次の場合に切り替える必要があります
E(VS)>E(VDS)⟹0.5⋅u(2y)+0.5⋅u(y/2)>u(y)
そして今、リスクに対する態度が重要になります。リスクを冒し、リスクを中立にする行動の下で、私たちは切り替えるべきだと推測することは難しくありません。
リスク回避行動に関して、私はエレガントな結果を見つけました:
対数(たとえば、平方根)よりも「少ない凹」の(厳密には上記の)ユーティリティ関数の場合、スイッチを切り替える必要があります。
対数ユーティリティ場合、切り替えの有無は区別されません。u(y)=lny
対数ユーティリティ関数(厳密には以下)よりも「凹型」の場合、切り替えるべきではありません。
対数ケースの図で終わります
と仮定します。次に、です。ライン The は、「スイッチ」からの期待されるユーティリティが存在するラインです。自然は戦略を実行するため、実際には中間点であるにあります。その時点で対数ユーティリティを使用すると、「切り替えなし」からまったく同じユーティリティ、つまりこの数値例ではられます。、Y / 2 = 2 、2 、Y = 8y=4y/2=2,2y=8Γ−Δ−E50−50ΔΓ−Δ−Eln(4)