ブラックウェルの賭け


12

Futilityクローゼットに対するBlackwellのベットパラドックスについて読んだことがあります。ここでは要約は次のとおりです。あなたは、二つの封筒が提示され、E yの。封筒にはランダムな金額のお金が入っていますが、お金の分布については何も知りません。あなたはそれを開き、そこにどれくらいのお金があるかをチェックし(x)、選択する必要があります:封筒E xまたはE yを取りますか?ExEyxExEy

無駄なクローゼットとは、レオナルドワプナーと呼ばれる数学者のことです。

私には間違っていると思われるアイデアは次のとおりです。乱数選択します。d < xの場合、E xを取ります。d > xの場合、E yを選択します。dd<xExd>xEy

Wapner:「dがxとyの間にある場合、予測(dで示される)が正しいことが保証されます。これが確率pで発生すると仮定します。dがxとyの両方よりも小さい場合、選択した数値xが2つのうちの大きい場合にのみ、予測が正しくなります。この可能性は50%です。同様に、dが両方の数値よりも大きい場合、選択した数値が2つのうちの小さい方である場合にのみ予測が正しくなります。これは、50%の確率でも発生します。」

[ x y ]にある確率が0より大きい場合、このメソッドの平均成功は1ですd[x,y]。これは、無関係なランダム変数を観察することにより、追加情報が得られることを意味します。12+p2

これはすべて間違っていると思いますし、問題はランダムな整数を選ぶことにあると思います。どういう意味ですか?どんな整数?その場合、確率そのDpdとの間に位置及びyはゼロであり、両方のためのxおよびyは有限です。xyxy

に最大金額に制限がある、または少なくとも1 ... Mからdを選択すると言うと、レシピはx < M / 2であればE yを選択するという簡単なアドバイスに要約されます。そして、x > M / 2であればE xを選択します。M1...MEyx<M/2Exx>M/2

ここで何かが恋しいですか?

編集

さて、今、私は明らかなパラドックスがどこから来たのかを見始めました。無関係なランダム変数が追加情報を提供することは不可能に思えました。

ただし、意識的にdの分布を選択する必要があることに注意してください。例えば、一様分布、またはのための境界線を選択明らかに、我々はピーナッツのためにプレーしている、と我々はの分布を選択した場合などPoissionian分布のDは上で均一であることが[ 10 92 10 9ドル、P D X Y = 0。この最後の確率は何よりまず、エンベロープに何が含まれるか判断することに依存します。λ[109,2109]P(d(x,y))=0

つまり、この手法が機能する場合、封筒内のお金の分布(封筒の金額がどのように選択されたか)がわからないという前提に違反します。ただし、エンベロープの内容が本当にわからない場合、最悪の場合のシナリオでは、適用しても何も失われません。

編集2

別の考え。与えられた場合、dを描画するために、P d < x = P d > x )となるような連続した非負の分布を選択しましょう。私たちはそれをすることを許されています、私は正しいですか?指示どおりに進めます-d < xの場合、エンベロープを保持し、d > xの場合、エンベロープを変更します。論理は変わりません。分布の選択方法によって異なりますが、P dxdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0 (または私は間違っていますか?)。

ただし、ディストリビューションの選択方法を考えると、今やっていることはコイントスに相当します。私たちはコインを投げ、それが頭の場合は封筒を交換し、尾の場合は保持している封筒に貼り付けます。私はどこが間違っていますか?

編集3

OK 我々は、確率関数ベース場合上のX(例えば、我々サンプルDの範囲で一様分布から1 2 Xに、次いで確率P D X Yがの独立していないP 正しい決定| D X Y dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

のであれば、(確率とP)以前のように、推測では、常に正確です。場合xは低い数値である、しかし、及びD X Y より、dがより低く、より高いチャンス有するXをd(x,y)pxd(x,y)dxよりも高いことより我々は間違った判断に偏っているように、。xが2つの数値のうち高い方の場合にも同じ理由が適用されます。xx

つまり、xとは無関係にを描画するプロセスを選択する必要があります。言い換えれば、xyが引き出される分布のパラメーターについて推測する必要があります。最悪の事態はランダムに推測することですが、最善のことは推測が正しいことです。「xとyは少なくとも1 $であるが、最大10dxxy $であると思うので、場合、それを保持し、そうでない場合は交換する」とです。見る。x>5

Wapnerの本(Unexpected Expectations:The Curiosities of a Mathematical Crystal Ball)の問題のポップサイエンス定式化によって誤解されました。

- (第一ヘッドがあれば処理を繰り返す、出てくるまでトスコインWapnerは、幾何学的分布を示唆する「いかなるにより、ランダムな正の整数を選択し、」「の場合)D > X高い推測とIF D < X推測(...)時間の50%以上を正しく推測します。d=xd>xd<x50%以上を正しく指す!」d


1
非常に密接な関係: stats.stackexchange.com/questions/95694
whuber

2
これは、(1)2エンベロープ問題の切り替えに指定された引数が誤っているため、(2)引数を前にベイジアンを追加することで確認できるという意味で、2エンベロープ問題とはまったく異なります。ブラックウェルの賭けに対してワプナーから与えられたものは正しい。
マシューガン

封筒内の金額は、数字の集合の任意の要素がある場合はS、仕事にWapnerの戦略のための必要十分条件は、選択した数のCDFのためであるが、厳密Sに増加する
復活モニカ

OK、まだ何かが欠けています-EDIT 2を見てください 私はどこが間違っていますか?

回答:


8

これは、2エンベロープ問題としてより広く知られています。最も一般的には、量はおよび2 Aとして与えられますが、そうである必要はありません。A2A

いくつかのポイント:

  1. ランダムな整数を一様に選択することはできません *が、引用符で囲まれた部分は一様である必要はありません。分布を選択します-どんな有限値を超える可能性がある限り、それが引数に対して何であるかは関係ありません。

  2. 引用された決定ルールで整数を選択することは意味がありません。お金は離散的であり、ゼロ以外のチャンスd = xがあることを意味するためです。d d=xがあり、その場合には何もリストされないからです。(あるいは、ルールが同じ場合にどうするかを指定するようにルールを変更するため)

  3. それを除けば、非負の連続分布からを選択できます。そうすれば、平等を心配する必要はありません。d

*(一様にランダムな非負整数も一様にランダムな正整数も選択できません)


最大金額に制限がある、たとえば、または少なくとも1 ... Mからdを選択すると言うと、レシピはx < M / 2であればE yを選択するという簡単なアドバイスに要約されます。x > M / 2の場合はE xを選択Md1...MEyx<M/2Exx>M/2

が選択されるランダム分布がM / 2を含むことが判明した場合、これは機能するはずです(50〜50を超える方が良いでしょう)。分布が半分にとどまっている場合はそうではありません。xM/2

ただし、私が最初に紹介したこのゲームのバージョンは、ゲームからの収入を最小限に抑えようとする(おそらく)誰かが封筒を提示するというものです。ディストリビューションを使用して他のエンベロープに切り替えるかどうかを決定する戦略は、その場合でも引き続き機能します。


OK、ポイント(1〜3)が取られました。だから、私は、ランダム、非負の連続的な分布を選択させて頂いておりますそのP D < X = P D > X 、正しいですか?しかし、決定は基本的にコイン投げに基づいています...私は間違っていますか?dP(d<x)=P(d>x)

はまったく必要ありません。必要なのは、2つの金額の間を取得するゼロ以外の確率です。P(d<x)=P(d>x)
Glen_b -Reinstateモニカ

はい。ただし、dの密度関数を自由に定義できます。議論を不合理な結論に導くためにそれをします。d

戦略をxの関数にすることで、dがxとyの間にあるときに正しい選択をするという利点が得られません。ゲームに勝つ方法を定義することになります。あなたが与えるリンクがそのような戦略がうまくいくと主張するなら、それは間違っているだろう
グレン_b-モニカを元に戻す

Wapnerの推論では、xの関数としてを導出するために使用される確率関数を定義することを禁止していますか?限り、P D X Y > 0、その後、彼の推理まだ仕事、私は間違っているでしょうか?私は含ま連続、非負の分布を使用する場合のxに(例えば一様分布1 2 xと、その後、私はこれが事実であることを保証しています。そして、私はまだ、正しい判断を下すかのD X Y dxP(d(x,y))>0x(1,2x)d(x,y)

7

Wapnerの議論は正しい!

いくつかのコメント:

  • x<dd
  • d
  • 特定の状況(例えば、観察するほど大きなエンベロープが得られる可能性が高い場合)では、カットオフ戦略も最適です。
  • より一般的なベイジアン設定では、多くの事前分布に対して単純なカットオフ戦略よりも優れた方法を実行できます。

関連するが異なる問題:

いくつかの@Glen_bと@whuberが言及したように、2つのエンベロープ問題として知られる関連するパズルがあります。ここでは、常にエンベロープを切り替えるために誤った引数が与えられ、ベイズのアプローチを取り、 2つの封筒の内容。

ただし、ある意味では、ここで説明するパズルはかなり異なります。Wapnerの議論は正しい!


1
さて、今、私はパラドックスがどこから来たのかを見る。または、具体的には、追加情報がシステムに流れ込む場所。dの分布を意識的に選択することにより、両方の封筒の金額がどこにあるべきかについての先験的な知識を使用します。最悪のシナリオでは、私たちの知識は役に立たないが、この方法は、それを使用しても不利にならないことを保証する。

少し考えた後、私はまだそれを取得しません-編集2を参照してください。

シナリオ(A)小さな封筒が持っていると想像してください 10 大きな封筒には 20。選びましょうd = 15。 P(x<d)=P(x>d). The decision rule would lead you to the correct choice 100% of the time!
Matthew Gunn

Now let's examine some Scenario (B). Imagine the small envelope has an odd number of dollars from 1 to 9 (eg. 1 or 3 or 5 or 7 or 9) and the large envelope has 1 dollar more. Choose d=5.5 and then P(x<d)=P(x>d). Here though, your repick if <5.5 decision rule isn't as helpful! It leads to the right decision if x=1,3,5,6,8, or 10 and the wrong decision if x=2,4,7,9. Recall the possible pairs are (1,2), (3, 4), (5, 6), (7, 8) (9, 10)$ The OPTIMAL BAYESIAN thing to do knowing this initial distribution is repick if you see an odd amount of money.
Matthew Gunn

We don't know the distribution of x and y, so we cannot pick it in a way that you propose it. Once we opened the envelope, we know x, but we have no idea that it was randomly chosen from integers 1 to 9, and thus we cannot choose d to be 5.5. As mentioned by @Glen_b above, d must be picked from a non-negative, continuous distribution.
January

0

I was intrigued by this and took the pragmatic approach of playing with it in Excel.

I generated three random numbers for x, y, and d in the range 1-100. I then did the comparison between d and x and between x and y and looked at the result, right or wrong.

I did this 500 times and repeated that several times and regularly got the right answer arounf 330 out of 500, as predicted.

I then increased the range of d to 1-10000 and the correct answer dropped to about 260 for 500 runs.

So yes, the selection of d is dependant on the expected values of x and y.

BoB


0

I think the apparent paradox with the Wapner expansion of the equation p + (1-p)/2 is that it assumes that (1-p)/2 >0. For many ranges of d this value is 0.

For example: any d selected from a symmetric distribution centered on the value in the open envelope, gives a probability of wrong 1/2 and correct 1/2.

Any asymmetrically chosen distribution appears to bias the choice the wrong way 1/2 the time.

So is there a way to choose a range and distribution for d such that this equation holds?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.