モンティ・ホールの問題と誤りのあるモンティ


23

モンティは、ドアの後ろにヤギがいた(または空だった)かどうかについて完全な知識がありました。この事実により、プレイヤーは「推測」を他のドアに切り替えることで、時間の経過とともに成功率を倍にすることができます。モンティの知識が完全ではなかった場合はどうなりますか?時々、賞品がヤギと同じ出入り口で本当にあったとしたらどうでしょう?しかし、あなたがあなたのドアを選んで開けるまで、あなたはそれを見ることができなかったのですか?モンティの正解率が100%未満の場合、IFの計算方法を理解するのを助けてくれますか?たとえば、Montyが間違っている場合、平均50%の確率でどうなりますか?プレイヤーは、彼の推測/ドアを切り替えることでさらに利益を得られますか?モンティが正しい確率が33.3%未満で、賞品がドアの後ろにない場合、プレイヤーの最善の選択肢はドアの選択を切り替えないことだと思います。賞品がドアの後ろにないことについて正しいモンティの確率を挿入することにより、切り替えの潜在的な利点を計算する方法を教えてください。私は高校の数学以外に何も持っておらず、69歳ですので、優しくしてください。


洞察と式が提供されてくれてありがとう。「Fallible Monty」が賞/車の不在を予測するのに66%の精度である場合、ドアの最初の選択から切り替えることにはゼロの利点があるようです。...33%のエラー率がデフォルトであるため賞品の基本料金は、あらゆるドアの後ろにあります。ただし、Montyが賞品のない場所を予測することで66%を上回った場合、スイッチングはより大きなユーティリティを導き出します。「専門家」が「専門家の予測」を行うゲームにこの推論を適用しようとしています。3つのおおよそ同じ確率のオプションのうちの1つが正しいものになるでしょう。私はエキスパートが正しいことをほとんど信じておらず、彼の「ヒット率」が33%未満-15%に近いと確信しています。これからの私の結論は、「と同じオプション、私はおそらく間違いであり、他の2つのいずれかに変更する必要があります!;-)


5
Montyの精度が100%未満である場合、それは彼が時々背後にある賞品でドアを開けることを意味しますか?もしそうなら、おそらくあなたはそのドアを選ぶ必要があります。
FAX

回答:


35

通常のモンティホールの問題から始めましょう。車の後ろにある3つのドア。他の2人の背後にはヤギがいます。ドア番号1を選択すると、モンティがドア番号2を開き、その後ろにヤギがいることを示します。推測をドア番号3に切り替える必要がありますか?(各ドアを参照するために使用する数字はここでは重要ではありません。任意の順序を選択でき、問題は同じであるため、物事を単純化するためにこの番号を使用できます。)

もちろん、答えは「はい」です。すでにご存知のとおりですが、計算を見て、後でどのように変化するかを見てみましょう。してみましょうC車でドアの指標となりおよびMモンティは、ドア2がヤギを持っていることを明らかにしたというイベントを示します。pC=3|Mを計算する必要があります。これがより大きければ1/2(我々は2つのだけ残りのオプションを持っているので)、私たちはそのドアに私たちの推測を切り替える必要があります。この確率は、

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
(これは、ベイズの規則をC前にフラットで適用するだけです。)p(M|C=3)車がドア3番の後ろにある場合、Montyは2番のドアを開けるしかありませんでした。p(M|C=1)1/2:車がドア1の後ろにある場合、Montyは残りのドア2または3のいずれかを開くことを選択しましたp(M|C=2)は0に等しくなります。車。これらの数値を入力すると、 p C = 3 | M = 1が得られます。
p(C=3|M)=10.5+0+1=23
これは私たちが精通している結果です。

次に、Montyがどのドアに車があるのか​​を完全に把握していない場合を考えてみましょう。そのため、彼がドアを選択するとき(これをドア番号2と呼びます)、ヤギがいると思うので、誤って車のあるものを選択する可能性があります。してみましょうCモンティはそのドアも考えて車を持っている、とlet p(C|C)彼はその実際の場所を条件に、特定の場所にある車を考えている可能性も。私たちは、これは単一のパラメータによって記述されていることを前提としていますq:彼の精度を決定し、その結果、p(C=x|C=x)=q=1p(Cx|C=x)qが1の場合、Montyは常に正しいです。qが0の場合、Montyは常に間違っています(これはまだ有益です)。場合qある1/3、モンティの情報には、より良いランダム推測よりはありません。

つまり、

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
=pM|C=1pC=1|C=3+pM|C=2pC=2|C=3+pM|C=3pC=3|C=3
=12×121q+0×121q+1×q
=14q4+q=34q+14

つまり、車が本当にドア3の後ろにある場合、次の3つの可能性があります。(1)モンティは1の背後にあると考えた、(2)モンティは2を考えた、または(3)モンティは3を考えた確率q(彼がそれを正しくする頻度)で、他の2つは、それらが間違っている確率(1q)をそれらの間で分割します。次に、それぞれのシナリオで、彼がしたように、彼がドア番号2を指すことを選択した可能性はどれくらいですか?車が1の後ろにあると考えた場合、その確率は2または3を選択できたので2分の1でした。 、彼は常に2を選択していました。

残りの確率も同様に計算できます:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

これをすべて入力すると、p C = 3 | M = 3が得られます。

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
健全性チェックとして、q=1場合、元の答え1が返されることがわかります。11.5=23

それで、いつ切り替えるべきですか?単純にするために、Montyが指し示したドアに切り替えることは許可されていないと仮定します。実際、Montyが少なくともある程度正しい(ランダムな推測よりも)限り、彼が指し示すドアは常に他の人よりも車を持っている可能性が低いため、これは実行可能なオプションではありませんとにかく私たちにとって。したがって、ドア1と3の確率のみを考慮する必要があります。しかし、以前は車がドア2の後ろにあることは不可能でしたが、このオプションはゼロ以外の確率になったため、切り替える必要はなくなりました。場合pC=3|M>0.5、むしろ、我々はスイッチ必要があるときpC=3|M>pC=1|M(以前は同じものでした)。この確率は、p(C=1|M)=0.51.5=13、元のモンティホール問題と同じ。(これはモンティがその背後にあるものに関係なくドア1を指すことができないため、理にかなっています。そのため、ドアについての情報を提供できません。むしろ、精度が100%を下回ると、図2は、実際に車を持つ)ので、私たちが見つける必要があります。qなるようにp(C=3|M)>13

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
基本的に、これは非常に長い道のりであり、車の実際の位置に関するモンティの知識がランダムな推測よりも優れている限り、ドアを切り替える必要があります(実際に考えると、それ)。また、次の式で与えられるように、Montyの精度の関数として、切り替えたときに勝つ可能性を計算することもできます
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
q=1場合、2の答えが得られます。これは、元のモンティホール問題でドアを切り替えることで勝つ可能性が2倍になるという事実に一致します。)

編集:人々はモンティが指しているドアに切り替えることができるシナリオについて尋ねていました。これはq < 1のときに有利になりますq<13、つまり、Montyが(ある程度)信頼できる「嘘つき」である場合。最も極端なシナリオでは、q=0場合、これはMontyが実際に車にヤギがいると考えているドアを意味します。ただし、残りの2つのドアには、まだ車またはヤギのいずれかを置くことができます。

ドア2に切り替える利点は次のとおりです

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
1.5q<0.5場合、つまりq<1の場合、 1よりも大きい(したがって、そのドアに切り替える価値がある)q<13、すでに確立したことが転換点でした。興味深いことに、元のモンティホール問題(q=1の場合)で勝利オッズを2倍にした場合と比較して、q=0場合にドア2に切り替えることで得られる最大のメリットはわずか1.5です。q=1

一般的な解決策は、次の2つのスイッチング戦略を組み合わせることで得られます。q > 1の場合q>13、常にドア3に切り替えます。それ以外の場合は、ドア2に切り替えます。


q < 1/3彼が正確である可能性をモデリングしていないので、期待値は実際に戻っていませんか?それは彼が間違っている可能性をモデリングしているからですか?0に近づいたので、できれば常に嘘をついていることを意味し、予想される賞金は2/3に戻ります
Cireo

2
@Cireo彼は嘘をつかないでしょう、彼は単に間違っているでしょう。嘘は彼の答えが間違っていることを知っていることを暗示します。期待値が上がらない理由は、彼が誤って後ろの車のあるドアを指している(つまり、p(M | C = 2)が上がっている)ため、選択できないためだと思われます。そのドア、どんなに)。q = 0は、車がどこにあるかを常に覚えていないことを意味します。つまり、車が後ろにあるドアを指す可能性が比較的高くなっています。
ビュールマン

3
より一般的なソリューション(これには明らかに必要です)には、「敵対的な」モンティが含まれます。あなたがヤギを選んだか車を選んだかに応じて、彼が指すものを変更する人(または彼が何かを指す場合でも)。
ヤック

3
@Yakk:無限に多くの方法でオッズを変える想像できるシナリオが無限にあります。また、Montyの動作を知っているかどうかにも依存します。彼が敵であることを知っているなら、実際に彼はあなたのオッズを1/3未満に下げることはできません。彼の決定プロセスがわからない場合、それは完全にあなたが何を仮定し、彼が何をするかに依存し、そこには多くの自由度があります。
ルーベンファンベルゲン

1
@KalevMaricq:モンティが嘘をついているという話はあまりしませんでした。それに関する問題は、最初に選んだドアの後ろに車がある可能性があり、それはモンティが選択することを許可されていないことです(そうでなければ、モンティホールの問題ではなくなったと主張します)。そのため、選択できるヤギのドアは2つしかありません。その場合、ヤギの1つが背後にいると言って嘘をつくことはできません。したがって、問題の範囲内で真の「嘘つきモンティ」を構築することは不可能だと思います。代わりに()行ったのは、常にヤギのドアを車のドアと間違えるMontyですが、どのヤギのドアかはわかりません。q=0
ルーベンファンベルゲン

7

これは問題のかなり単純なバリエーションである必要があります(ただし、数学の背景が限られていることに注意してください。まず、Monteが完全であるか完全に信頼できるかを条件に解決策を決定することをお勧めします。最初のケースは、通常のモンテホール問題であるため、作業は必要ありません。2番目の場合、あなたは彼が選んだドアを、賞のあるドアを含むすべてのドアでランダムであると扱います(つまり、彼はまだ賞のないドアを選ぶかもしれませんが、これはランダムです)。これらの各ケースで勝利の確率を計算できる場合、合計確率の法則を使用します モンテが特定のレベルの誤りやすさを持っている場合に、関連する勝ちの確率を決定します(私たちが絶対的であるか完全に誤りやすいかの確率によって指定されます)。


2
私はその対応に感謝していますが、もっと具体的なものを探していました。モンティがドアを選んだことを明記しています。賞がそのドアの後ろにある確率は、ゼロから100%の範囲である可能性があることを指定しています。私は、Montyが正しい/間違っている確率を単純に入力できる式を期待していましたが、残りの式を計算すると、切り替えが勝利する確率を示す数値推定値が得られます。その程度の支援は非現実的な要求ですか?
疑似エゴ

4

ベンの答えに対するコメントに基づいて、この変種のモンティホールについて、ルーベンファンベルゲンとは異なる2つの異なる解釈を提供します。

最初はLiar Montyと呼び、2番目はUnreliable Montyと呼びます。どちらのバージョンでも、問題は次のように進行します。

(0)3つのドアがあり、そのうちの1つは車で、残りの2つはヤギで、ランダムに配置されています。

(1)出場者がドアをランダムに選択します。

(2)モンティは出場者のドアとは異なるドアを選び、ヤギが背後にいると主張します。

(3)出場者は、選択されていない3番目のドアに切り替えるように提案され、問題は「出場者がドアの後ろの車を見つける確率を最大にするためにいつ切り替えるべきか」です。

ライアーモンティでは、ステップ(2)で、競技者がヤギを含むドアを選んだ場合、モンティは事前に定義された確率で車を含むドアを選びます(つまり、0から100%の間で、ヤギはドアの後ろにいます)。このバリアントでは、ステップ(1)で競技者が車を選択した場合、Montyは車を含むドアを決して選択しない(つまり、横になれない)ことに注意してください。

Unreliable Montyでは、ステップ(2)のドアMontyのピックに車が含まれる事前定義の確率があります。ベンの答えに対するあなたのコメントから、これはあなたが興味のあるシナリオであり、私のバージョンはどちらもルーベン・ファン・ベルゲンのものとは異なります。Unreliable MontyはLiar Montyと同じではないことに注意してください。後でこれら2つのケースを厳密に区別します。しかし、これを考慮してください。このシナリオでは、Montyのドアには台以上の車を入れることはできません2313

問題に答えるために、いくつかの方程式を使用する必要があります。私が答えにアクセスできるように、答えを試して言います。私が望んでいる2つのことは、記号の代数的操作と条件付き確率です。前者については、シンボルを使用して以下を示します。

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

Pr()Pr(M¯)

Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23, which is larger than Pr(S)=13, which corresponds to the case when Monty has not given you any information.

I will now demonstrate that Unreliable Monty is equivalent to Liar Monty. In Liar Monty, we are given the quantity Pr(M|C¯), the probability that Monty will lie about his door, knowing that the contestant has not chosen the car. In Unreliable Monty, we are given the quantity Pr(M), the probability that Monty lies about his door. Using the definition of conditional probability Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯), and rearranging, we obtain:

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
since Pr(C¯), the probability that the car is not behind the contestant's chosen door is 23 and Pr(C¯|M), the probability that the car is not behind the contestant's chosen door, if we know that it is behind Monty's door, is one.

Thus, we have shown the connection between Unreliable Monty (represented by LHS of the above equation) and Liar Monty (represented by the RHS). In the extreme case of Unreliable Monty, where Monty chooses a door that hides the car 23 of the time, this is equivalent to Monty lying all the time in Liar Monty, if the contestant has picked a goat originally.

Having shown this, I will now provide enough information to answer the Liar version of the Monty Hall Problem. We want to calculate Pr(S). Using the law of total probability:

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
since Pr(S|C)=Pr(S|C¯ and M)=0 and Pr(S|C¯ and M¯)=1 (convince yourself of this!).

Continuing:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

So you see, when Monty always lies (aka Pr(M|C¯))=1) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S), is 23.

From this you can work out the optimal strategies for both Liar, and Unreliable Monty.

Addendum 1

In response to comment (emphasis mine):

"I added more details in my comment to @alex - Monty is never hostile nor devious, just FALLIBLE, as sometimes he can be wrong for whatever reasons, and never actually opens the door. Research shows that Monty is wrong roughly 33.3% of the time, and the car actually turns out to be there. That is a Posterior Probability of being correct 66.6% of the time, correct? Monty never chooses YOUR door, and you will never choose his. Do these assumptions change anything?"

This is as I understand, the Unreliable Monty Hall Problem introduced at the start of my answer.

Therefore, if Monty's door contains the car 13 of the time, we have the probability of winning when you switch to the last unpicked door as:

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)


Alex and @Ruben van Bergen et al Thanks for the helpful details. Assume Monty's never hostile, just fallible and tells you "I am pretty sure that the the Car is NOT behind this door." but does not open the door. Let's assume Research shows he is WRONG only about 33.3% of the time, thus correct 66.6% (a Posterior Probability?). There is still some benefit to switching, but once his accuracy reaches only 33.3% then it would make NO sense to switch to either HIS door or the other one. Literally a case of "your guess is as good as mine." Does any of this change your Analyses or Formulae?
Pseudoego

No, this doesn't change my analysis. I added something which I hope clarifies the question in your comment. Btw, I wouldn't read too much into the words "hostile", "fallible", "monty lies". These don't really mean anything unless defined with precision as the (conditional) probability that Monty is wrong about a door containing a goat.
Alex

Pretty annoyed that my OWN answer to MY OWN question would be deleted with the only explanation given is that this site is not for "discussion" - when I am mainly explaining why I think the Answers given so far are Correct, and explaining how they will be useful. There was far more discussion in most of the other answers given. This seems myopic to me - at best - and moronic - at worst - to delete somebody's answer to their own question: how can you possibly explain WHY you are rating an Answer as the BEST without discussing it? Thanks to all who replied regardless.
Pseudoego

@Pseudoego your last comment is better post as a comment on your original question. I didn't see your answer, but it sounds like you want to discuss the existing answers, in which case you can modify your original question.
Alex

0

For some reason, a moderator decided to delete my own answer to my own question, on the grounds that it contained "discussion." I don't really see HOW I can explain what is the Best Answer without discussing what makes it work for me, and how it can be applied in practice.

I appreciate the insights and formulae which were provided in the previous answers. It appears to be that IF "Fallible Monty" is only 66% accurate in predicting the absence of a Prize/Car THEN there is ZERO benefit to switching from your original choice of doors....because his 33% error rate is the default base rate for the Prize being behind ANY door. One assumes, though, that IF Monty gets better than 66% at predicting where there is NO PRIZE THEN switching derives greater Utility.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.