封筒パラドックス


8

封筒は2つあります。1つはお金を含み、もう1つは金額を含みます。正確な量「」は私にはわかりませんが、私は上記を知っています。封筒を1つ選んで開きます。そこにお金が表示されています。明らかに、です。2 、X 、X 、Y 、Y { X 2 X }x2xxyy{x,2x}

今私は封筒を保つか、または切り替えるために提供されます。

切り替えの期待値はです。私のエンベロープを保持する期待値はです。Y(122y+1212y)=54yy

いつも封筒を入れ替えるようです。私の2つの質問:

この推論は正しいですか?

封筒を開けて金額を確認することを許可されていない場合、それは何か違いますか?その後、無期限に切り替えるオプションが与えられますか?y



1
あなたは単に期待を受け入れることはできません。xに関する信念から始めて、ベイズのルールに従って信念を更新する必要があります。yが表示されると、開いた封筒についての信念が変わります。
HRSE

xが0と間で均一に分布するとします。じゃあ何?
キツネ騎兵

@KitsuneCavalryそのような分散はありません。(そのような分布を生成するプログラムを私に送ってください。)実際、すべての値について、質問で与えられた悪い信念を生成する解決策はありません。Herr K.のリンクで、これはen.wikipedia.org/wiki/…で説明されていますy
Giskard

3
@Kitsune Cavalry半直線(または直線全体)での均一な分布は、ベイジアン統計でよく知られている不適切な事前分布です。テイストstats.stackexchange.com/a/97790/28746または stats.stackexchange.com/a/を
Alecos Papadopoulos

回答:


5

これは、問題に対する「期待効用最大化/ゲーム理論」アプローチです(セット理論確率のダッシュが少しあります)。そのようなフレームワークでは、答えは明確に見えます。

プレミア

絶対に正直に言うと、は厳密に正の金額で、次の2つのチケットがボックスに入れられました: 割り当てられた識別番号と割り当てられた識別番号。次に、ベルヌーイ確率変数からの描画 が実行され、結果と発生したイベントに基づいて、金額とがエンベロープと入れられました。の値が何であるか、どのエンベロープにどれだけの量が送られたかはわかりません。{ A = x B = 2 x } 1 { A = 2 x B = x } 0 p = 0.5 x 2 x A B xx{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x2xABx

最初のケース:封筒を開かずに切り替えるオプションを選択します

最初の問題は、エンベロープをどのように選択するかです。これは設定と関係があります。したがって、ユーティリティ関数を使用して、ユーティリティの最大化が期待されていると仮定します。u()

ここでは、エンベロープを表す2つの二分確率変数ととそれらの量を考慮することにより、確率構造をモデル化できます。それぞれのサポートはです。しかし、それらは独立していません。したがって、共同配布から始める必要があります。表形式では、共同分布と対応する周辺分布はB { x 2 x }AB{x,2x}

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

これは、とが同じ周辺分布であることを示しています。BAB

しかし、これは、エンベロープがどのように選択されるかは問題ではないことを意味します。これは、常に期待されるユーティリティと同じになるためです

0.5u(x)+0.5u(2x)

ここで直面しているのは、2つの同一のギャンブル(各エンベロープ)に対する複合ギャンブル(エンベロープの選択方法)です。私たちは選択することができます確率で、、または何かで-間(および相補のための)。それは問題ではありません。私たちは常に同じ期待されるユーティリティを得ます。リスクに対する私たちの態度はここでは役割を果たしていないことに注意してください。1 0 BA10B

したがって、エンベロープを選択します(例)。それを調べています。現在、期待されるユーティリティは何ですか?選択する前とまったく同じです。エンベロープをどのような方法で選択しても、内部にあるものの確率には影響しません。A

切り替えさせていただきます。たとえば、エンベロープを保持しているとします。現在期待されているユーティリティは何ですか?以前とまったく同じです。B

これらは、私たちにとって世界の2つの可能な状態です選択か、選択します。いかなる選択の下でも、世界の両方の州は、私たちの選択された/想定された推進力に対して同じ値を意味します(つまり、期待される実用性を最大化します)。BAB

したがって、ここでは切り替えに無関心です。、そして実際にはランダム化することもできます。

2番目のケース:切り替え後のオプションでエンベロープを開く

を選択して開き、の量の中にあると仮定します。これは状況を変えますか? Y { X 2 X }Ay{x,2x}

どれどれ。なんだろう

P(A=xA{x,2x})=?

さて、は確率変数が定義されているサンプル空間です。サンプル空間全体、つまり自明なシグマ代数の条件付けは、確率にも期待値にも影響しません。「すべての可能な値が実現されたかもしれないと知っているなら、の値は何ですか?」効果的な知識は得られていないため、まだ元の確率構造にあります。 A A{x,2x}AA

しかし、私はまた、何ですか

P(B=xA{x,2x})=?

イベントによって生成されたシグマ代数として適切に表示される条件付けステートメントは、ランダムベクトルされる製品サンプル空間全体です定義されました。上記のジョイント分布の表から、ジョイントの確率割り当てはマージナルの確率割り当て(メジャーゼロの2つのイベントの存在による「ほぼ確実」な資格)と同等であることがわかります。したがって、ここでもサンプル空間全体での確率を本質的に条件付けます。したがって、エンベロープを開くためのアクションは、確率構造にも影響しませんでした。{A{x,2x}}(A,B)BB

意思決定とともにゲーム理論を入力してください。封筒を開いたので、切り替えるかどうかを決める必要があります。切り替えない場合は、ユーティリティを取得します。切り替えると、次の2つの可能な状態になります。u(y)

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

実際にどの状態が保持されているかはわかりませんが、上記の説明から、それぞれにの存在確率があることがわかります。 p=0.5

これは、対戦相手が「自然」であり、自然がランダム化された戦略で確実に機能することを知っているゲームとしてモデル化できます:および、。しかし、切り替えをしなければ、確実に見返りが得られるようになりました。これが通常の形のゲームであり、ペイオフが付いています。p=0.5 y=xp=0.5y=2x

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

我々は、置換する誘惑に抵抗するべきである及びするための。は既知の特定の見返りです。「スイッチ」戦略の見返りは実際にはわかりません(の値がわからないため)。したがって、置換を逆にする必要があります。場合は、場合はです。だからここに再び私たちのゲームがあります:u 2 x u y u y u(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y)y=2xu(x)=u(y/2)

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

これで、マトリックスのすべての見返りがわかりました。純粋に支配的な戦略はありますか?

戦略「スイッチ」の期待される見返りは

E(VS)=0.5u(2y)+0.5u(y/2)

戦略「Do n't Switch」の期待される見返りは

E(VDS)=u(y)

次の場合に切り替える必要があります

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

そして、リスクに対する態度が重要になります。リスクを冒し、リスクを中立にする行動の下で、私たちは切り替えるべきだと推測することは難しくありません

リスク回避行動に関して、私はエレガントな結果を見つけました:

対数(たとえば、平方根)よりも「少ない凹」の(厳密には上記の)ユーティリティ関数の場合、スイッチを切り替える必要があります。

対数ユーティリティ場合、切り替えの有無は区別されません。u(y)=lny

対数ユーティリティ関数(厳密には以下)よりも「凹型」の場合、切り替えるべきではありません

対数ケースの図で終わります

ここに画像の説明を入力してください

と仮定します。次に、です。ライン The は、「スイッチ」からの期待されるユーティリティが存在するラインです。自然は戦略を実行するため、実際には中間点であるにあります。その時点で対数ユーティリティを使用すると、「切り替えなし」からまったく同じユーティリティ、つまりこの数値例ではられます。、Y / 2 = 2 2 、Y = 8y=4y/2=2,2y=8ΓΔΕ5050ΔΓΔΕln(4)


対数ユーティリティ関数を使用して「リスク回避」を呼び出しても、パラドックスは解決されません。@HRSEで指摘されているように、ベイズの定理を使用すると、最初のエンベロープで金額を確認した後、ペイオフがとになる確率 0.5ではありません。(のための)に適切な前を使用する場合(約人の信念の反射)、溶液は場合切り替えることになるあれば第一エンベロープを維持するのに十分に小さく、十分に大きい。参照jstor.org/安定/ 2685310u(2y)u(y/2xx>0xxyy
Jarle Tufto

@JarleTufto私が見ると、均一な事前は正しい事前です。ゲームの主催者を信じる場合、ベルヌーイドローに従ってエンベロープに金額が入れられたと彼らが言ったときです。疑わしいことをしたい場合、主催者を信じず、他の何らかの事前の信念を形成しない場合、それはもちろん彼の権利ですが、a)主催者が嘘をついている理由とb)彼が選択する前に別のを選択しますか?私の回答は、この問題の主催者を信じていることを前提としています。p=0.5
Alecos Papadopoulos 2018

もちろん、それぞれのエンベロープにと量が含まれ、確率がそれぞれ1/2であることに同意します。私が言っていることは前に暗黙的に不適切均一ということであるで使用することは、すべてのために、のリードベイズので、定理、その後にリードパラドックスにここで、は最初のエンベロープで観測された量です。代わりに適切な以前の使用すると、これらの条件付き確率は異なり、最適な決定は依存します(もちろん、ユーティリティ関数)。X2XXπ(x)=1x>0P(X=y|Y=y)=P(X=y/2|Y=y)=1/2yπ(x)y
Jarle Tufto

@JarleTuftoこの不適切な前にあなたが言及した、それは何に関連する確率を反映していますか?
Alecos Papadopoulos

2つの封筒の金額はとです。事前確率分布は、エンベロープを開く前のについての信念を表しています。あなたは暗黙的にこの特定の以前のものを使用しているか、逆条件付き確率を同等とみなすことの誤りを犯しています。X2XX
Jarle Tufto

0

エンベロープE1を開き、その値がE1 = Yであることがわかる場合、他のエンベロープE2の値が{E2 = Y / 2、E2 = 2Y}にあることは事実です。

そのエンベロープの期待値が(Y / 2)* Pr(E2 = Y / 2)+(2Y)* Pr(E2 = 2Y)であることも事実です。

エラーは、Yが何であるかに関係なく、Pr(E2 = Y / 2)= Pr(E2 = 2Y)= 1/2と仮定しています。これを示す簡単な方法は、各封筒にさまざまな種類の米国の紙幣が含まれていると仮定することです。Y = $ 1の場合、E2Y / 2にすることはできません。

より厳密な証明はここで提供するには詳細すぎますが、その要約は、最初に、任意の値Zについて、Pr(Z / 2 <= E2 <Z)= Pr(Z <= E2 <2Z)であると仮定することです。これは基本的に前の段落と同じ仮定であり、値の範囲に拡張されています。しかし、これがZのいずれかの値に当てはまる場合、それはPr(Z * 2 ^(N-1)<= E2 <Z * 2 ^(N-1))が-infからNのすべての値に対して定数であることを意味しますINF。それは不可能なので、仮定は正しくありません。

+++++

少しわかりにくいかもしれませんので、例を挙げてみましょう。2つの封筒のセットが2つ与えられます。1セットには、10ドルと20ドルが含まれています。もう1つには、20と40が含まれています。セットを選択し、そのセットの1つの封筒を開いて20を見つけます。次に、そのセットの別の封筒に切り替える機会が提供されます。しますか?

はい、切り替える必要があります。他のエンベロープに切り替えることによる予想ゲインは、[(20-10)+(20-40)] / 2 = +5です。

このインスタンスは、10または40ではなく20を見つけたことがわかっているため、質問で説明した条件に適合していることに注意してください。したがって、ソリューションは機能します。しかし、実験自体はその説明に適合しません。10を見つけた場合、または40を見つけた場合、他のエンベロープが20である確率は100%です。期待されるゲインはそれぞれ+10と-20です。また、確率に対する3つの可能なゲインを平均すると、3つの値が得られ、10/4 + 5/2-20/4 = 0になります。


封筒に50セントを入れられないと想定するのはなぜですか?また、質問には、その中に含まれる可能性のある可能性のある量がわからない場合、具体的には可能性のある相対量だけが含まれる場合があるため、実際にはこれについては説明しません。
キツネ騎兵

単純化したアプローチだと言った。それは「各封筒に米国の紙幣が入っていると仮定する」から始まりました。米国の紙幣では50セントは持てないため、Pr(E2 = 1)= 1です。重要なのは、Y / 2と2Yを同じように仮定することは、Yがわからない場合に、Yの事実上の分布を達成することが不可能であると仮定することです。2|E1=
JeffJo 2016

0

実験全体のランダム化手順を指定していないため、一般に問題は解決できません。

しかし、Yを選択したエンベロープの値とし、Xを他のエンベロープの値とします。答えは -これは条件付き期待値です。ただし、Yの最も一般的な分布を想定すると、Yはすべてのから均一に描画されます。しかし、であり、Borel–Kolmogorovのパラドックスにより、期待は解決できません。E[X|Y=y]RPr(Y=y)=0


@JeffJo、十分な評判がなかったため、投稿の下でコメントできませんでした。あなたの投稿に関連していると思うので、この回答を追加しました。
John Rambo
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.