2つのエンベロープの問題の再検討


16

私はこの問題を考えていました。

http://en.wikipedia.org/wiki/Two_envelopes_problem

私は解決策を信じており、それを理解していると思いますが、次のアプローチをとると完全に混乱します。

問題1:

次のゲームを提供します。あなたは私に10 ドルを支払い、私は公正なコインを投げます。私はあなたに5 ドルを与えて、私はあなたに20 ドルを与えます。

予想は12.5 ドルなので、常にゲームをプレイします。

問題2:

私はあなたに10 ドルの封筒を渡します。封筒は開いていて、確認できます。私はその後、あなたに別の封筒を示し、この時間を閉じて、あなたを教えて:このエンベロープはありどちらか$等しい確率でそれで5か$ 20。交換しますか?

これは問題1とまったく同じだと思うので、$ 10を$ 5または$ 20で忘れてしまうので、常に切り替えます。

問題3:

上記と同じですが、封筒を閉じます。したがって、$ 10が存在することはわかりませんが、Xの量があります。他の封筒には2倍または半分があることを伝えます。これで、切り替えたい同じロジックに従う場合。これは封筒のパラドックスです。

封筒を閉じると何が変わりましたか?

編集:

問題3はエンベロープの問題ではないと主張する人もいますが、それぞれがゲームをどのように見ているかを分析することで、なぜだと思うのかを以下に説明します。また、ゲームのセットアップも改善されます。

問題3の明確化を提供します。

ゲームを整理する人の観点から:

私は2つの封筒を持っています。1つに10 ドルを入れてプレーヤーに渡します。それから私は彼に言った、私はあなたに与えた封筒の量の2倍または半分の封筒をもう1つ持っている。切り替えますか?その後、公正なコインと5 ドルを入れたヘッズと20 ドルを入れたテールを裏返します。そして彼に封筒を渡します。それから私は彼に尋ねます。あなたが私にくれた封筒は、あなたが持っている封筒の量の2倍または半分です。切り替えますか?

プレーヤーの観点から:

封筒が渡され、同じ確率で2倍または半分の量の封筒がもう1つあると言われます。切り替えますか?私はを持っていると思うので、なので、切り替えたいと思います。私は封筒を手に入れ、突然同じ状況に直面しています。もう1つのエンベロープの量が2倍または半分になったので、もう一度切り替えたいと思います。X12(12X+2X)>X


2
少なくとも私にとって重要な理解は、「私はXを持っているので、(1/2 * X + 2X)/ 2> X」と言うことはできないということです- 合計平均チャンスは50/50ですが、特定のX 、予想されるチャンスはもう50/50ではありません。Xが大きいほど、他のエンベロープに2 * Xが含まれる可能性が低くなります(正の有限分布の場合)。そのため、可能なX'es sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = Xで積分します。f (X)は、特定のXが与えられると、最初のエンベロープが大きくなる可能性です。
Peteris 14

1
パラドックスの声明では、実験者が量Xを選択し、実験者がもう一方のエンベロープにまたはX / 2をランダムに配置することを決定するという記述はありません。作成した状況を2つのエンベロープパラドックスと混同し続けるという事実は、他のエンベロープがX / 2または2 Xである可能性が50/50であるとプレーヤーが信じるのが間違っている理由が理解できないことを意味します。実際の2つのエンベロープの問題では、2 Xがもう1 つのエンベロープにある確率は0または1です。XX/2X/22X2X
jsk14年

あなたが正しいです。私は理解していません:(したがって、質問です。私が述べた問題3とエンベロープパラドックスの違いを理解しようとしています。パラドックスにはXと2Xという2つのエンベロープがあることを理解していますが、私はしません」 tはそれが誰かに封筒を与え、その後に他の量を置くことを決定するためにコインをひっくり返すと異なっているかを確認。
evan54

1
これの秘Theは、または2 Xの結果が同様に発生する可能性があるという欠陥のある仮定です。場合2 Xが他のエンベロープである、切から予想される利得は2 X - X = X。場合X / 2が他のエンベロープである、切から予想される利得はX / 2 - X = - X / 2。プレイヤーは、これらの状況のどれにいるかを知りませんが、それは彼が50/50のチャンスがあると信じるべきであることを意味しません。X/22X2X2XX=XX/2X/2X=X/2
jsk 14

1
エンベロープに2 Xが含まれると仮定します。あなたがで終わる場合Xは、確率という2 Xは、他のエンベロープは1である確率であるX / 2は、あなたがで終わる場合は、他のエンベロープであるが0にある2 Xこと、そして確率が2 * 2 X = 4 Xは、他のエンベロープが0である確率という点である2 X / 2 = X他のエンベロープが1であるであるX2XX2XX/22X2(2X)=4X2X/2=X
JSK

回答:


23

1.不必要な確率。

このノートの次の2つのセクションでは、決定理論の標準ツールを使用して、「より大きい推測」問題と「2つのエンベロープ」問題を分析します(2)。このアプローチは、簡単ですが、新しいようです。特に、「常に切り替える」または「切り替えない」手順よりも明らかに優れている、2つのエンベロープの問題に対する一連の決定手順を特定します。

セクション2では、(標準の)用語、概念、表記法を紹介します。「より大きな問題である推測」のすべての可能な決定手順を分析します。この資料に精通している読者は、このセクションをスキップすることを好むかもしれません。セクション3では、2つのエンベロープの問題に同様の分析を適用します。セクション4の結論は、キーポイントをまとめたものです。

これらのパズルの公開されているすべての分析では、考えられる自然の状態を支配する確率分布があると想定しています。ただし、この仮定はパズル文の一部ではありません。これらの分析の重要な考え方は、この(不当な)仮定を捨てることで、これらのパズルの見かけのパラドックスを簡単に解決できるということです。

2.「より大きな推測」問題。

実験者は、異なる実数x 2が2枚の紙片に書かれていると言われます。彼女はランダムに選択されたスリップの番号を見ます。この1つの観察結果のみに基づいて、彼女はそれが2つの数値のうち小さいか大きいかを判断しなければなりません。x1x2

確率についてのこのような単純だがオープンエンドの問題は、混乱を招き、直観に反することで有名です。特に、確率が絵に入る少なくとも3つの異なる方法があります。これを明確にするために、正式な実験的観点を採用しましょう(2)。

損失関数を指定することから始めます。私たちの目標は、以下に定義する意味で、その期待を最小限にすることです。適切な選択は、実験者が正しく推測した場合は損失をに等しくし、それ以外の場合は0にすることです。この損失関数の期待値は、誤った推測の確率です。一般に、間違った推測にさまざまなペナルティを割り当てることにより、損失関数は推測の目的を正しく捕捉します。確かに、損失関数の採用は、x 1 および x 2の事前確率分布を仮定するのと同じくらい任意です。 10x1x2、しかしそれはより自然で基本的です。決定を下すことに直面したとき、私たちは当然、正しいか間違っているかの結果を考慮します。どちらの方法でも結果がない場合、なぜ気にしますか?(合理的な)意思決定を行うときはいつでも潜在的な損失の考慮を暗黙的に行うため、損失の明示的な考慮から利益を得ます。私たちは見なければならない-有用な解決策を得るのを妨げることができる。

決定理論は、観測結果とその分析をモデル化します。サンプル空間、「自然の状態」のセット、および決定手順の3つの追加の数学オブジェクトを使用します。

  • サンプル空間 は、考えられるすべての観測で構成されています。ここでは、R (実数のセット)で識別できます 。 SR

  • 自然の状態 は、実験結果を支配する可能性のある確率分布です。(これは、イベントの「確率」について話す最初の意味です。)「より大きい推測」問題では、これらは、 等しい確率で異なる実数x 1 および x 2で値を取る離散分布です。 の1Ωx1x2各値で 2Ωは、 によりパラメータ化することができる{ω=X1X2R×R| x1>x2}12Ω{ω=(x1,x2)R×R | x1>x2}.

  • 決定空間は、可能な決定のバイナリセット です。Δ={smaller,larger}

これらの用語では、損失関数は定義された実数値関数です。決定が「悪い」こと(2番目の引数)と現実(1番目の引数)を比較します。Ω×Δ

最も一般的な決定手続き 実験に利用可能である無作為化 1:任意の実験結果について、その値は、上の確率分布です Δ。つまり、結果xを観察して決定すること は必ずしも明確ではなく、分布δ x に従ってランダムに選択すること です。(これは、確率が関係する2番目の方法です。)δΔxδ(x)

に2つの要素しかない場合 、ランダム化された手順は、事前に指定された決定に割り当てる確率によって識別できます。 Δ

スピナー

物理スピナーは、このようなバイナリランダム化手順を実装します。自由に回転するポインターは、確率δ 1つの決定に対応する上部領域で停止し、そうでない場合は確率1 - δで左下領域で停止しますx 。完全の値を指定することによって決定されるスピナーδ Xに[ 0 1 ]Δδ1δ(x)δ(x)[0,1]

したがって、決定手順は関数として考えることができます

δ:S[0,1],

どこ

Prδ(x)(larger)=δ(x)  and  Prδ(x)(smaller)=1δ(x).

逆に、そのような関数 は、ランダム化された決定手順を決定します。無作為化の決定の範囲、特別な場合には、決定論的決定含む δ 'にある{ 0 1 }δδ{0,1}

結果 xの決定手順δのコストは、δ x )の 予想損失であるとしましょう。期待値は、決定空間Δの確率分布 δ x に関するもの です。自然の各状態ω(リコール、サンプル空間Sの二項確率分布 )は、任意の手順δの予想コストを決定し ます。これは、リスクδ のための ωリスクδω δxδ(x)δ(x)ΔωSδδωRiskδ(ω)。ここでは、自然の状態についての予測が採用されてい ます。ω

決定手順は、リスク関数の観点から比較されます。 自然の状態が本当に未知の場合、δは2つの手順であり、すべてのωについて リスクεω リスクδω である場合、手順δは決して悪くないため、 手順εを使用しても意味 がありません(場合によってはより良いかもしれません)。このような手順 ε許容されませんεδRiskε(ω)Riskδ(ω)ωεδε; それ以外の場合は許容されます。多くの場合、許容される手順が多数あります。それらはどれも他の手順で一貫してアウトパフォームできないため、それらのいずれかを「良好」と見なします。

は事前分布が導入されていないことに注意してください((1)の用語で「Cの 混合戦略」)。これは、確率が問題設定の一部になる3番目の方法です。これを使用すると、現在の分析が(1)およびその参照よりも一般的でありながら、より単純になります。ΩC

表1は、自然の真の状態が与えられる場合のリスクを評価します x 1 > x 2で あることを思い出してください ω=(x1,x2).x1>x2.

表1。

Decision:LargerLargerSmallerSmallerOutcomeProbabilityProbabilityLossProbabilityLossCostx11/2δ(x1)01δ(x1)11δ(x1)x21/2δ(x2)11δ(x2)01δ(x2)

Risk(x1,x2): (1δ(x1)+δ(x2))/2.

これらの用語では「より大きい推測」問題になります

あなたがについて何も知らない与えられた 及び X 2が、それらが異なっていることを、あなたは決定手続きを見つけることができますを除いて、 δリスクいる [ 1 - δ "最大X 1はxは2+ δ "Xを1x 2] / 2 は確実に1未満ですx1x2δ[1δ(max(x1,x2))+δ(min(x1,x2))]/212

このステートメントは、x > yの場合は常に を要求することと同等 です。 そこには、それはいくつかの厳密な増加関数で指定する実験者決定手続きのために必要かつ十分である δ "S [ 0 1 ] この一連の手順には、1のすべての「混合戦略Q」が含まれていますが、それよりも大きくなっています。たくさんありますδ(x)>δ(y)x>y.δ:S[0,1].Q ランダム化されていない手順よりも優れたランダム化された決定手順

3.「2つの封筒」の問題。

この簡単な分析により、以前は特定されていなかった良い問題を含む、「より大きな推測」問題に対する多数の解決策が明らかになったことは心強いことです 同じアプローチで、他の問題である「2つのエンベロープ」問題(または「ボックス問題」と呼ばれることもある)について明らかにすることができます。これは、2つの封筒のうちの1つをランダムに選択してプレイするゲームに関するもので、その1つは他の封筒の2倍のお金を持っていることが知られています。封筒を開いて量xを観察した後 x その中にお金がある場合、プレーヤーはお金を未開封の封筒に入れるか(「切り替える」)、または開いた封筒に入れるのかを決定します。プレイヤーはどのエンベロープがより大きな量を含んでいるかに関して等しく不確実であるため、切り替えではなく切り替えは等しく受け入れられる戦略であると考えるだろう。それはのペイオフの間で「等しい確率」の選択肢提供していますのでパラドックスは、その切り替えは、優れた選択肢であるように思わあり 及び X / 2をその期待の値が 5 のx / 4 開いた封筒の値を超えています。これらの戦略は両方とも決定論的で一定であることに注意してください。2xx/2,5x/4

この状況では、正式に書くことができます

S={xR | x>0},Ω={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},andΔ={Switch,Do not switch}.

前と同じように、任意の決定手順 から関数と考えることができる S[ 0 1 ] 今回は再び書き込むことができるスイッチングしていない確率とを関連付けることによって、δ 'X 。当然のスイッチング必須の確率は、相補的な値である1 - δ 'X δS[0,1],δ(x)1δ(x).

表2に示す損失は、ゲームのペイオフのマイナスです。それは自然の真の状態の関数であり、、結果のX(いずれかとすることができる ω 又は 2 ω、及び結果に依存して決定)。ωxω2ω

表2。

LossLossOutcome(x)SwitchDo not switchCostω2ωωω[2(1δ(ω))+δ(ω)]2ωω2ωω[1δ(2ω)+2δ(2ω)]

損失関数の表示に加えて、表2は任意の決定手順コストも計算します 。ゲームは1の等しい確率で2つの結果を生成するためδω が自然の真の状態である場合のリスク は12ω

Riskδ(ω)=ω[2(1δ(ω))+δ(ω)]/2+ω[1δ(2ω)+2δ(2ω)]/2=(ω/2)[3+δ(2ω)δ(ω)].

手段は常に(スイッチング定数プロシージャ、)、または常に立っ特許(δ 'X = 1)、リスクを有するであろう - 3 ω / 2。任意の厳密に増加関数、又はより一般的には、任意の関数δ ' に範囲が[ 0 1 ]そのため δ '2 X > δ 'X すべての正の実数のため のxδ(x)=0δ(x)=13ω/2δ[0,1]δ(2x)>δ(x)手順を決定 δ よりも厳密に小さい常にリスク機能を有する - 3 ω / 2を自然の真の状態にかかわらず、したがって、いずれかの一定の手続きに優れています ωしたがって、自然の状態に関係なく、リスクが低く、決して高くない手順が存在するため、一定の手順は受け入れられません。x,δ3ω/2ω

Strategy

これを前述の「より大きい推測」問題の解決策と比較すると、両者の密接な関係が示されています。どちらの場合も、適切に選択されたランダム化手順は、「明白な」一定の戦略よりも明らかに優れています。

これらのランダム化された戦略には、いくつかの注目すべき特性があります。

  • ランダム化された戦略には悪い状況はありません。エンベロープ内の金額がどのように選択されても、長期的にはこれらの戦略は一定の戦略よりも悪くなりません。

  • 制限値をランダム化戦略無し1支配他のいずれかのための期待場合δ ω 2 ωはエンベロープであるがために期待超えるεを、次いでいくつかの他の可能な状態が存在するη 2 η ))エンベロープで、εの期待値がδの期待値を超えてい ます。01δ(ω,2ω)ε(η,2η)εδ

  • 戦略は、特殊な例として、ベイジアン戦略の多くと同等の戦略が含まれています。「スイッチあれば言う任意戦略xが少ない何らかの閾値よりもTステーさもなければ」に相当するδ X = 1 、X T δ X = 0それ以外の場合。δxTδ(x)=1xT,δ(x)=0

それでは、常に切り替えを好む議論の誤りは何ですか? これは、選択肢に確率分布が存在するという暗黙の仮定にあります。具体的に は、開かれたエンベロープでを観察 すると、スイッチングの直感的な引数は条件付き確率Prob(未開封のエンベロープの量| x が観察された)に基づきます。これは、自然の基底状態のセットで定義される確率です。しかし、これらはデータから計算できません。決定論的フレームワークは 、問題を解決するためにΩの確率分布を必要とせず 、問題がそれを特定することもありません。xxΩ

この結果は、微妙ではあるが重要な点で(1)とその参照によって取得された結果とは異なります。 他の解決策はすべて、(無関係であるとしても)事前の確率分布があると仮定し、それが 本質的にS上で均一でなければならないことを示してい ます。 それは、順番に、不可能です。ただし、ここで示した2エンベロープ問題の解決策は、特定の事前分布の最良の決定手順ではないため、このような分析では見落とされます。現在の処理では、事前確率分布が存在できるかどうかは問題ではありません。これを次のように特徴付けることができますΩS.封筒の内容が不確実である(以前の配布で説明されている)ことと、その内容が完全に無知であること(以前の配布が関係ないようにすること)の違い。

4.結論。

「より大きい推測」問題では、観測値が2つのうち大きい方をランダムに決定し、観測値が増加するにつれて確率が増加するという良い手順があります。単一の最良の手順はありません。「2包絡線」問題では、観測値が増加するにつれて増加する確率で、観測された金額を維持する価値がある(つまり、2つのうちの大きい方)ことをランダムに決定するのが良い手順です。繰り返しますが、単一の最良の手順はありません。どちらの場合も、多くのプレーヤーがそのような手順を使用し、特定ので独立してゲームをプレイした場合、(ωの値に関係なく)全体として、負けよりも勝つことになります。ωω

どちらの問題でも、問題の一部ではない追加の仮定(自然状態に関する事前の分布)を作成すると、明らかなパラドックスが生じます。各問題で指定されていることに焦点を当てることで、この仮定は完全に回避され(作成される可能性があるため)、逆説が消え、簡単な解決策が出現します。

参考文献

(1)D.サメット、I。サメット、およびD.シュマイドラー、2つの封筒パズルの背後にある1つの観察。 American Mathematical Monthly 111(2004年4月)347-351。

(2)J.キーファー、統計的推論の紹介。 スプリンガー出版、ニューヨーク、1987年。


8
This is a short article I wrote ten years ago but never published. (The new editor of the AMM saw no mathematical interest in it.) I have given talks in which I played the two-envelope game with the audience, using substantial amounts of real money.
whuber

1
Very nice write up! Joe Blitzstein talked about the two evelope problem in a Harvard Stat 110 lecture which is available free on youtube if anyone is interested btw.
Benjamin Lindqvist

@whuber Consider this variant. Suppose I choose two amounts of money such that one is twice as much as the other. Then I flip a fair coin to decide which amount goes in which envelope. Now you pick an envelope at random, and imagine the amount inside it, calling it x (if this step is questionable, consider the case of opening up the envelope and looking at the actual amount - since the reasoning applies no matter what value you see inside, it should apply with a general x). Then calculate the expected value of the money in the other envelope as E=(1/2)(x/2)+(1/2)(2x)=1.25x>x...
Zubin Mukerjee

I guess I don't understand where in that reasoning I "assumed a prior distribution on the states of nature". Did I? Clearly the reasoning cannot be correct, because I cannot justify switching to the other envelope by merely thinking about the first envelope (since the same logic would apply to the second, once I switch once).
Zubin Mukerjee

2
@Zubin There is a basic (but interesting) mistake in that analysis. Let θ be the smaller amount in the two envelopes. Given an observation of x, you know that either θ=x or θ=x/2 and that the likelihood of this observation in either case is 1/2. In the former case the amount Y in the other envelope is 2x and in the latter case it is x/2, but in order to assign a valid expectation to Y you must assume there is some probability distribution for θ. Equal likelihood is not equivalent to equal probability.
whuber

7

The issue in general with the two envelope problem is that the problem as presented on wikipedia allows the size of the values in the envelopes to change after the first choice has been made. The problem has been formulized incorrectly.

However, a real world formulation of the problem is this: you have two identical envelopes: A and B, where B=2A. You can pick either envelope and then are offered to swap.

Case 1: You've picked A. If you switch you gain A dollars.

Case 2: You've picked B. If you switch you loose A dollars.

This is where the flaw in the two-envelope paradox enters in. While you are looking at loosing half the value or doubling your money, you still don't know the original value of A and the value of A has been fixed. What you are looking at is either +A or A, not 2A or 12A.

If we assume that the probability of selecting A or B at each step is equal,. the after the first offered swap, the results can be either:

Case 1: Picked A, No swap: Reward A

Case 2: Picked A, Swapped for B: Reward 2A

Case 3: Picked B, No swap: Reward 2A

Case 4: Picked B, Swapped for A: Reward A

The end result is that half the time you get A and half the time you get 2A. This will not change no matter how many times you are offered a swap, nor will it change based upon knowing what is in one envelope.


IMO, the problem says that you cannot lose A no matter what. So, your +A vs -A cannot be appropriate. You either win A or 2A.
Little Alien

7

My interpretation of the question

I am assuming that the setting in problem 3 is as follows: the organizer first selects amount X and puts X in the first envelope. Then, the organizer flips a fair coin and based on that puts either 0.5X or 2X to the second envelope. The player knows all this, but not X nor the result of the coin-flip. The organizer gives the player the first envelope (closed) and asks if the player wants to switch. The questioner argues 1. that the player wants to switch because the switching increases expectation (correct) and 2. that after switching, the same reasoning symmetrically holds and the player wants to switch back (incorrect). I also assume the player is a rational risk-neutral Bayesian agent that puts a probability distribution over X and maximizes expected amount of money earned.

Note that if the we player did not know about the coin-flip procedure, there might be no reason in the first place to argue that the probabilities are 0.5 for the second envelope to be higher/lower.

Why there is no paradox

Your problem 3 (as interpreted in my answer) is not the envelope paradox. Let the Z be a Bernoulli random variable with P(Z=1)=0.5. Define the amount Y in the 2nd envelope so that Z=1 implies Y=2X and Z=0 implies Y=0.5X. In the scenario here, X is selected without knowledge of the result of the coin-flip and thus Z and X are independent, which implies E(YX)=1.25X.

E(Y)=E(E(YX))=E(1.25X)=1.25E(X)
Thus, if if X>0 (or at least E(X)>0), the player will prefer to switch to envelope 2. However, there is nothing paradoxical about the fact that if you offer me a good deal (envelope 1) and an opportunity to switch to a better deal (envelope 2), I will want to switch to the better deal.

To invoke the paradox, you would have to make the situation symmetric, so that you could argue that I also want to switch from envelope 2 to envelope 1. Only this would be the paradox: that I would want to keep switching forever. In the question, you argue that the situation indeed is symmetric, however, there is no justification provided. The situation is not symmetric: the second envelope contains the amount that was picked as a function of a coin-flip and the amount in the first envelope, while the amount in the first envelope was not picked as a function of a coin-flip and the amount in the second envelope. Hence, the argument for switching back from the second envelope is not valid.

Example with small number of possibilities

Let us assume that (the player's belief is that) X=10 or X=40 with equal probabilities, and work out the computations case by case. In this case, the possibilities for (X,Y) are {(10,5),(10,20),(40,20),(40,80)}, each of which has probability 1/4. First, we look at the player's reasoning when holding the first envelope.

  1. If my envelope contains 10, the second envelope contains either 5 or 20 with equal probabilities, thus by switching I gain on average 0.5×(5)+0.5×10=2.5.
  2. If my envelope contains 40, the second envelope contains either 20 or 80 with equal probabilities, thus by switching I gain on average 0.5×(20)+0.5×(40)=10.

Taking the average over these, the expected gain of switching is 0.5×2.5+0.5×10=6.25, so the player switches. Now, let us make similar case-by-case analysis of switching back:

  1. If my envelope contains 5, the old envelope with probability 1 contains 10, and I gain 5 by switching.
  2. If my envelope contains 20, the old envelope contains 10 or 40 with equal probabilities, and by switching I gain 0.5×(10)+0.5×20=5.
  3. If my envelope contains 80, the old envelope with probability 1 contains 40 and I lose 40 by switching.

Now, the expected value, i.e. probability-weighted average, of gain by switching back is 0.25×5+0.5×5+0.25×(40)=6.25. So, switching back exactly cancels the expected utility gain.

Another example with a continuum of possibilities

You might object to my previous example by claiming that I maybe cleverly selected the distribution over X so that in the Y=80 case the player knows that he is losing. Let us now consider a case where X has a continuous unbounded distribution: XExp(1), Z independent of X as previously, and Y as a function of X and Z as previously. The expected gain of switching from X to Y is again E(0.25X)=0.25E(X)=0.25. For the back-switch, we first compute the conditional probability P(X=0.5YY=y) using Bayes' theorem:

P(X=0.5YY=y)=P(Z=1Y=y)=p(Y=yZ=1)P(Z=1)p(Y=y)=p(2X=y)P(Z=1)p(Y=y)=0.25e0.5yp(Y=y)
and similarly P(X=2YY=y)=e2yp(Y=y), wherefore the conditional expected gain of switching back to the first envelope is
E(XYY=y)=0.125ye0.5y+ye2yp(Y=y),
and taking the expectation over Y, this becomes
E(XY)=00.125ye0.5y+ye2yp(Y=y)p(Y=y)dy=0.25,
which cancels out the expected gain of the first switch.

General solution

The situation seen in the two examples must always occur: you cannot construct a probability distribution for X,Z,Y with these conditions: X is not a.s. 0, Z is Bernoulli with P(Z=1)=0.5, Z is independent of X, Y=2X when Z=1 and 0.5X otherwise and also Y,Z are independent. This is explained in the Wikipedia article under heading 'Proposed resolutions to the alternative interpretation': such a condition would imply that the probability that the smaller envelope has amount between 2n,2n+1 (P(2n<=min(X,Y)<2n+1) with my notation) would be a constant over all natural numbers n, which is impossible for a proper probability distribution.

Note that there is another version of the paradox where the probabilities need not be 0.5, but the expectation of other envelope conditional on the amount in this envelope is still always higher. Probability distributions satisfying this type of condition exist (e.g., let the amounts in the envelopes be independent half-Cauchy), but as the Wikipedia article explains, they require infinite mean. I think this part is rather unrelated to your question, but for completeness wanted to mention this.


I edited my question trying to explain why I think it is similar to the envelope paradox and you would want to switch forever.
evan54

@evan54 I rewrote my answer to contain my interpretation of the setting problem 3, more explanation about why the situation is not symmetric, examples etc.
Juho Kokkala

I think I'm close to getting it. I think that once there is a coin flip and envelope 2 contains half/double the amount in your hand you are basically in the situation of the envelope paradox BUT the way you got there guarantees you that you are better off switching. Does that make sense?
evan54

also, if it does, is there a way to make it more formal? I may ponder on it more..
evan54

1
@evan54 Not sure. The whole point of the paradox is that it is a situation in which there is no advantage to switching. Thus, anything you change to the setup of the problem that results in it being advantageous to switch, at least initially, must therefore not be equivalent to the setup of the two envelope paradox. Note that in your setup, it only makes sense to switch the very first time. After you switch the first time, you expect to lose by switching back. The flawed logic in the paradox comes into play if you attempt to argue that you should switch back.
jsk

4

Problem 1: Agreed, play the game. The key here is that you know the actual probabilities of winning 5 vs 20 since the outcome is dependent upon the flip of a fair coin.

Problem 2: The problem is the same as problem 1 because you are told that there is an equal probability that either 5 or 20 is in the other envelope.

Problem 3: The difference in problem 3 is that telling me the other envelope has either X/2 or 2X in it does not mean that I should assume that the two possibilities are equally likely for all possible values of X. Doing so implies an improper prior on the possible values of X. See the Bayesian resolution to the paradox.


I see we interpret problem 3 slightly differently. I assumed OP specifically constructs the setting in problem 3 so that the 2nd envelope has probabilities 0.5/0.5. This is clearly possible without improper distributions, but then the possibilities for envelope 1 are not equally likely given the amount in the second envelope.
Juho Kokkala

Agreed, if OP meant that you are told that the other envelope either has X/2 or 2X with equal probabilities, then problem 3 would not be equivalent to the 2 envelope paradox.
jsk

yes that was my thinking, that in problem 3 there is equal probability between X/2 and 2X. So you hold 3 envelopes give him the 10 and then flip a coin to see if you give him the 20 or 5 (they are closed) if he decides to switch
evan54

1
@evan54 - if you make the random flip after you choose which envelope to give me, then it's equivalent to problem 1; if you choose both amounts of money, and then make a random flip on which envelope you give me, then it's the situation described above; they're different situations.
Peteris

1
@evan54 - the optimal player's decision depends on how you made those envelopes. If you don't tell the player how you did that (only that 50/50 sentence), then the optimal strategy depends on player's assumptions on how likely you are to do it one way or another - the first envelope you prepared is less valuable than the second envelope you prepared; if they were fairly shuffled (and unopened) then it doesn't matter what the player chooses; if the player thinks that you likely (>50%) initially gave him the first envelope, then player should switch and stick with that.
Peteris

1

これは私が持っている可能性のある説明です。間違っていると思いますが、よくわかりません。投票してコメントするために投稿します。うまくいけば誰かがより良い説明を提供してくれるでしょう。

したがって、問題2と問題3の間で変わった唯一のことは、保持するエンベロープの量がランダムになったことです。その金額をマイナスにして、お金の代わりに請求書があるかもしれない場合、それは完全に理にかなっています。封筒を開いたときに得られる追加情報は、請求書またはお金であるかどうかであるため、あるケースでは切り替えたが、別のケースでは切り替えたくない場合があります。

しかし、法案が可能性ではないと言われた場合、問題は残ります。(もちろん、それらが嘘をつく確率を割り当てますか?)


Introducing the possibility of negative amounts is an interesting observation, but not needed for resolving the issue in your question. See my answer.
Juho Kokkala

It is not necessary to assume the amount in the envelope is random: it suffices that it is unknown. Assuming randomness adduces information--however little it might be--that was not given in the problem!
whuber

1
The biggest difference between 2 and 3 is that being told the other amount is either X/2 or 2X is not the same as being told that the two possibilities are equally likely. Assuming the two amounts are equally likely is not the same as being told the two amounts are equally likely.
jsk

1

問題2A:100枚のノートカードが不透明な瓶に入っています。「$ 10」は各カードの片面に書かれています。反対側には「$ 5」または「$ 20」と書かれています。あなたはカードを選び、片側だけを見ることができます。次に、一方の側(公開または非表示)を選択し、その側で金額を獲得します。

あなたが表示された場合、「$ 5、」あなたは隠された側面を選択する必要がありますし、勝つことを知っている$あなたは「を参照してください場合は10を$ 20」あなたは明らかにサイドを選択する必要がありますし、勝つことを知っている$ 20しかし、あなたが見た場合、「$ 10、「隠された側への期待を計算するのに十分な情報をあなたに与えていません。{ $ 5、$ 10}のカードが{ $ 10、$ 20}のカードと同数だと言ったら、予想は$ 12.50になります。しかし、あなたはからの期待を見つけることができませんonly事実-これはまだ真実でした-あなたはカード上のより高い、またはより低い価値を明らかにする機会が平等にあったということです。各種類のカードがいくつあったかを知る必要があります。

問題3A:同じjarが使用されていますが、今回はすべてのカードに異なる、未知の値が書き込まれています。唯一同じことは、各カードの片側がもう一方の値の2倍であることです。

カードとサイドを選びますが、見ないでください。高い側または低い側である可能性は50%です。考えられる解決策の1つは、カードが{X / 2、X}または{X、2X}のいずれかであり、50%の確率で、Xがあなたの側であるということです。しかし、上記で見たように、高または低を選択する確率はこれら2つと同じではないdfferent カードが瓶に入っている可能性も同様です。

What changed between your Problem 2 and Problem 3, is that you made these two probabilities the same in Problem 2 by saying "This envelope either has $5 or $20 in it with equal probability." With unknown values, that can't be true in Problem 3.


0

Overview

I believe that they way you have broken out the problem is completely correct. You need to distinguish the "Coin Flip" scenario, from the situation where the money is added to the envelope before the envelope is chosen

Not distinguishing those scenarios lies at the root of many people's confusion.

Problem 1

If you are flipping a coin to decide if either double your money or lose half, always play the game. Instead of double or nothing, it is double or lose some.

Problem 2

This is exactly the same as the coin flip scenario. The only difference is that the person picking the envelope flipped before giving you the first envelope. Note You Did Not Choose an Envelope!!!! You were given one envelope, and then given the choice to switch This is a subtle but important difference over problem 3, which affects the distribution of the priors

Problem 3

This is the classical setup to the two envelope problem. Here you are given the choice between the two envelopes. The most important points to realize are

  • There is a maximum amount of money that can be in the any envelope. Because the person running the game has finite resources, or a finite amount they are willing to invest
  • If you call the maximum money that could be in the envelope M, you are not equally likely to get any number between 0 and M. If you assume a random amount of money between 0 and M was put in the first envelope, and half of that for the second (or double, the math still works) If you open an envelope, you are 3 times as likely to see something less than M/2 than above M/2. (This is because half the time both envelopes will have less than M/2, and the other half the time 1 envelope will)
  • Since there is not an even distribution, the 50% of the time you double, 50% of the time you cut in half doesn't apply
  • When you work out the actual probabilities, you find the expected value of the first envelope is M/2, and the EV of the second envelope, switching or not is also M/2

Interestingly, if you can make some guess as to what the maximum money in the envelope can be, or if you can play the game multiple times, then you can benefit by switching, whenever you open an envelope less than M/2. I have simulated this two envelope problem here and find that if you have this outside information, on average you can do 1.25 as well as just always switching or never switching.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.