1.不必要な確率。
このノートの次の2つのセクションでは、決定理論の標準ツールを使用して、「より大きい推測」問題と「2つのエンベロープ」問題を分析します(2)。このアプローチは、簡単ですが、新しいようです。特に、「常に切り替える」または「切り替えない」手順よりも明らかに優れている、2つのエンベロープの問題に対する一連の決定手順を特定します。
セクション2では、(標準の)用語、概念、表記法を紹介します。「より大きな問題である推測」のすべての可能な決定手順を分析します。この資料に精通している読者は、このセクションをスキップすることを好むかもしれません。セクション3では、2つのエンベロープの問題に同様の分析を適用します。セクション4の結論は、キーポイントをまとめたものです。
これらのパズルの公開されているすべての分析では、考えられる自然の状態を支配する確率分布があると想定しています。ただし、この仮定はパズル文の一部ではありません。これらの分析の重要な考え方は、この(不当な)仮定を捨てることで、これらのパズルの見かけのパラドックスを簡単に解決できるということです。
2.「より大きな推測」問題。
実験者は、異なる実数とx 2が2枚の紙片に書かれていると言われます。彼女はランダムに選択されたスリップの番号を見ます。この1つの観察結果のみに基づいて、彼女はそれが2つの数値のうち小さいか大きいかを判断しなければなりません。x1x2
確率についてのこのような単純だがオープンエンドの問題は、混乱を招き、直観に反することで有名です。特に、確率が絵に入る少なくとも3つの異なる方法があります。これを明確にするために、正式な実験的観点を採用しましょう(2)。
損失関数を指定することから始めます。私たちの目標は、以下に定義する意味で、その期待を最小限にすることです。適切な選択は、実験者が正しく推測した場合は損失をに等しくし、それ以外の場合は0にすることです。この損失関数の期待値は、誤った推測の確率です。一般に、間違った推測にさまざまなペナルティを割り当てることにより、損失関数は推測の目的を正しく捕捉します。確かに、損失関数の採用は、x 1 および x 2の事前確率分布を仮定するのと同じくらい任意です。 10x1x2、しかしそれはより自然で基本的です。決定を下すことに直面したとき、私たちは当然、正しいか間違っているかの結果を考慮します。どちらの方法でも結果がない場合、なぜ気にしますか?(合理的な)意思決定を行うときはいつでも潜在的な損失の考慮を暗黙的に行うため、損失の明示的な考慮から利益を得ます。私たちは見なければならない-有用な解決策を得るのを妨げることができる。
決定理論は、観測結果とその分析をモデル化します。サンプル空間、「自然の状態」のセット、および決定手順の3つの追加の数学オブジェクトを使用します。
サンプル空間 は、考えられるすべての観測で構成されています。ここでは、R (実数のセット)で識別できます 。 SR
自然の状態 は、実験結果を支配する可能性のある確率分布です。(これは、イベントの「確率」について話す最初の意味です。)「より大きい推測」問題では、これらは、 等しい確率で異なる実数x 1 および x 2で値を取る離散分布です。 の1Ωx1x2各値で 2。Ωは、 によりパラメータ化することができる{ω=(X1、X2)∈R×R| x1>x2}。12Ω{ω=(x1,x2)∈R×R | x1>x2}.
決定空間は、可能な決定のバイナリセット です。Δ={smaller,larger}
これらの用語では、損失関数は定義された実数値関数です。決定が「悪い」こと(2番目の引数)と現実(1番目の引数)を比較します。Ω×Δ
最も一般的な決定手続き 実験に利用可能である無作為化 1:任意の実験結果について、その値は、上の確率分布です Δ。つまり、結果xを観察して決定すること は必ずしも明確ではなく、分布δ (x )に従ってランダムに選択すること です。(これは、確率が関係する2番目の方法です。)δΔxδ(x)
に2つの要素しかない場合 、ランダム化された手順は、事前に指定された決定に割り当てる確率によって識別できます。 △
物理スピナーは、このようなバイナリランダム化手順を実装します。自由に回転するポインターは、確率δで 1つの決定に対応する上部領域で停止し、そうでない場合は確率1 - δで左下領域で停止します(x )。完全の値を指定することによって決定されるスピナーδ (Xに)∈ [ 0 、1 ]。△δ1 - δ(x )δ(X )∈ [ 0 、1 ]
したがって、決定手順は関数として考えることができます
δ′:S→ [ 0 、1 ] 、
どこ
Prδ(x )(larger)=δ′(x) and Prδ(x)(smaller)=1−δ′(x).
逆に、そのような関数 は、ランダム化された決定手順を決定します。無作為化の決定の範囲、特別な場合には、決定論的決定含む δ 'にある{ 0 、1 }。δ′δ′{0,1}
結果 xの決定手順δのコストは、δ (x )の 予想損失であるとしましょう。期待値は、決定空間Δの確率分布 δ (x )に関するもの です。自然の各状態ω(リコール、サンプル空間Sの二項確率分布 )は、任意の手順δの予想コストを決定し ます。これは、リスクの δ のための ω、リスクδ(ω )δバツδ(x )δ(x )△ωSδδω危険δ(ω )。ここでは、自然の状態についての予測が採用されてい ます。ω
決定手順は、リスク関数の観点から比較されます。 自然の状態が本当に未知の場合、とδは2つの手順であり、すべてのωについて リスクε(ω )≥ リスクδ(ω )である場合、手順δは決して悪くないため、 手順εを使用しても意味 がありません(場合によってはより良いかもしれません)。このような手順 ε は許容されませんεδ危険ε(ω )≥ リスクδ(ω )ωεδε; それ以外の場合は許容されます。多くの場合、許容される手順が多数あります。それらはどれも他の手順で一貫してアウトパフォームできないため、それらのいずれかを「良好」と見なします。
は事前分布が導入されていないことに注意してください((1)の用語で「Cの 混合戦略」)。これは、確率が問題設定の一部になる3番目の方法です。これを使用すると、現在の分析が(1)およびその参照よりも一般的でありながら、より単純になります。ΩC
表1は、自然の真の状態が与えられる場合のリスクを評価します 。x 1 > x 2で あることを思い出してください 。ω = (x1、x2)。バツ1> x2。
表1。
決定:結果バツ1バツ2確率1 / 21 / 2大きい確率δ′(x1)δ′(x2)LargerLoss01SmallerProbability1−δ′(x1)1−δ′(x2)SmallerLoss10Cost1−δ′(x1)1−δ′(x2)
Risk(x1,x2): (1−δ′(x1)+δ′(x2))/2.
これらの用語では「より大きい推測」問題になります
あなたがについて何も知らない与えられた 及び X 2が、それらが異なっていることを、あなたは決定手続きを見つけることができますを除いて、 δリスクいる [ 1 - δ "(最大(X 1は、xは2))+ δ "(分(Xを1、x 2))] / 2 は確実に1未満ですx1x2δ[1–δ′(max(x1,x2))+δ′(min(x1,x2))]/2?12
このステートメントは、x > yの場合は常に を要求することと同等 です。 そこには、それはいくつかの厳密な増加関数で指定する実験者決定手続きのために必要かつ十分である δ ":S → [ 0 、1 ] 。 この一連の手順には、1のすべての「混合戦略Q」が含まれていますが、それよりも大きくなっています。たくさんありますδ′(x)>δ′(y)x>y.δ′:S→[0,1].Q ランダム化されていない手順よりも優れたランダム化された決定手順
3.「2つの封筒」の問題。
この簡単な分析により、以前は特定されていなかった良い問題を含む、「より大きな推測」問題に対する多数の解決策が明らかになったことは心強いことです。 同じアプローチで、他の問題である「2つのエンベロープ」問題(または「ボックス問題」と呼ばれることもある)について明らかにすることができます。これは、2つの封筒のうちの1つをランダムに選択してプレイするゲームに関するもので、その1つは他の封筒の2倍のお金を持っていることが知られています。封筒を開いて量xを観察した後 x その中にお金がある場合、プレーヤーはお金を未開封の封筒に入れるか(「切り替える」)、または開いた封筒に入れるのかを決定します。プレイヤーはどのエンベロープがより大きな量を含んでいるかに関して等しく不確実であるため、切り替えではなく切り替えは等しく受け入れられる戦略であると考えるだろう。それはのペイオフの間で「等しい確率」の選択肢提供していますのでパラドックスは、その切り替えは、優れた選択肢であるように思わあり 及び X / 2を、その期待の値が 5 のx / 4 開いた封筒の値を超えています。これらの戦略は両方とも決定論的で一定であることに注意してください。2xx/2,5x/4
この状況では、正式に書くことができます
SΩΔ={x∈R | x>0},={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},and={Switch,Do not switch}.
前と同じように、任意の決定手順 から関数と考えることができる S に[ 0 、1 ] 、今回は再び書き込むことができるスイッチングしていない確率とを関連付けることによって、δ '(X )。当然のスイッチング必須の確率は、相補的な値である1 - δ '(X )。δS[0,1],δ′(x)1–δ′(x).
表2に示す損失は、ゲームのペイオフのマイナスです。それは自然の真の状態の関数であり、、結果のX(いずれかとすることができる ω 又は 2 ω、及び結果に依存して決定)。ωxω2ω
表2。
Outcome(x)ω2ωLossSwitch−2ω−ωLossDo not switch−ω−2ωCost−ω[2(1−δ′(ω))+δ′(ω)]−ω[1−δ′(2ω)+2δ′(2ω)]
損失関数の表示に加えて、表2は任意の決定手順コストも計算します 。ゲームは1の等しい確率で2つの結果を生成するためδ、ω が自然の真の状態である場合のリスク は12ω
Riskδ(ω)=−ω[2(1−δ′(ω))+δ′(ω)]/2+−ω[1−δ′(2ω)+2δ′(2ω)]/2=(−ω/2)[3+δ′(2ω)−δ′(ω)].
手段は常に(スイッチング定数プロシージャ、)、または常に立っ特許(δ '(X )= 1)、リスクを有するであろう - 3 ω / 2。任意の厳密に増加関数、又はより一般的には、任意の関数δ ' に範囲が[ 0 、1 ]そのため δ '(2 X )> δ '(X ) すべての正の実数のため のxδ′(x)=0δ′(x)=1−3ω/2δ′[0,1]δ′(2x)>δ′(x)手順を決定 δ よりも厳密に小さい常にリスク機能を有する - 3 ω / 2を自然の真の状態にかかわらず、したがって、いずれかの一定の手続きに優れています ω! したがって、自然の状態に関係なく、リスクが低く、決して高くない手順が存在するため、一定の手順は受け入れられません。x,δ−3ω/2ω
これを前述の「より大きい推測」問題の解決策と比較すると、両者の密接な関係が示されています。どちらの場合も、適切に選択されたランダム化手順は、「明白な」一定の戦略よりも明らかに優れています。
これらのランダム化された戦略には、いくつかの注目すべき特性があります。
ランダム化された戦略には悪い状況はありません。エンベロープ内の金額がどのように選択されても、長期的にはこれらの戦略は一定の戦略よりも悪くなりません。
制限値をランダム化戦略無しと1支配他のいずれかのための期待場合δ (ω 、2 ωは)エンベロープであるがために期待超えるεを、次いでいくつかの他の可能な状態が存在する(η 、2 η ))エンベロープで、εの期待値がδの期待値を超えてい ます。01δ(ω,2ω)ε(η,2η)εδ
戦略は、特殊な例として、ベイジアン戦略の多くと同等の戦略が含まれています。「スイッチあれば言う任意戦略xが少ない何らかの閾値よりもTステーさもなければ」に相当するδ (X )= 1 、X ≥ T 、δ (X )= 0それ以外の場合。δxTδ(x)=1x≥T,δ(x)=0
それでは、常に切り替えを好む議論の誤りは何ですか? これは、選択肢に確率分布が存在するという暗黙の仮定にあります。具体的に は、開かれたエンベロープでを観察 すると、スイッチングの直感的な引数は条件付き確率Prob(未開封のエンベロープの量| x が観察された)に基づきます。これは、自然の基底状態のセットで定義される確率です。しかし、これらはデータから計算できません。決定論的フレームワークは 、問題を解決するためにΩの確率分布を必要とせず 、問題がそれを特定することもありません。xxΩ
この結果は、微妙ではあるが重要な点で(1)とその参照によって取得された結果とは異なります。 他の解決策はすべて、(無関係であるとしても)事前の確率分布があると仮定し、それが 本質的にS上で均一でなければならないことを示してい ます。 それは、順番に、不可能です。ただし、ここで示した2エンベロープ問題の解決策は、特定の事前分布の最良の決定手順ではないため、このような分析では見落とされます。現在の処理では、事前確率分布が存在できるかどうかは問題ではありません。これを次のように特徴付けることができますΩS.封筒の内容が不確実である(以前の配布で説明されている)ことと、その内容が完全に無知であること(以前の配布が関係ないようにすること)の違い。
4.結論。
「より大きい推測」問題では、観測値が2つのうち大きい方をランダムに決定し、観測値が増加するにつれて確率が増加するという良い手順があります。単一の最良の手順はありません。「2包絡線」問題では、観測値が増加するにつれて増加する確率で、観測された金額を維持する価値がある(つまり、2つのうちの大きい方)ことをランダムに決定するのが良い手順です。繰り返しますが、単一の最良の手順はありません。どちらの場合も、多くのプレーヤーがそのような手順を使用し、特定ので独立してゲームをプレイした場合、(ωの値に関係なく)全体として、負けよりも勝つことになります。ωω
どちらの問題でも、問題の一部ではない追加の仮定(自然状態に関する事前の分布)を作成すると、明らかなパラドックスが生じます。各問題で指定されていることに焦点を当てることで、この仮定は完全に回避され(作成される可能性があるため)、逆説が消え、簡単な解決策が出現します。
参考文献
(1)D.サメット、I。サメット、およびD.シュマイドラー、2つの封筒パズルの背後にある1つの観察。 American Mathematical Monthly 111(2004年4月)347-351。
(2)J.キーファー、統計的推論の紹介。 スプリンガー出版、ニューヨーク、1987年。
sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = X
で積分します。f (X)は、特定のXが与えられると、最初のエンベロープが大きくなる可能性です。