ベイズ推定器は、真のパラメーターが前のものの可能な変量であることを要求しますか?


9

これは哲学的な質問のビットかもしれませんが、ここで私達は行く:決定理論では、リスクのベイズ推定量θX のためのθ Θ事前分布に関して定義されたπΘθ^(x)θΘπΘ

ここで、一方で、真のがデータを生成した(つまり、「存在する」)には、θπの下で可能な変数である必要があります。一方、θは既知ではないため、事前分布が選択されているため、真のθが、選択したπの下で可能な変量であるという保証はありません。θθπθθπ

さて、どうやらθが変量になるようにを選択する必要があるようです。そうでなければ、特定の定理が成り立たなくなります。たとえば、ミニマックス推定値は、最も好ましい事前分布のベイズ推定値にはなりません。なぜなら、その領域からθを含む大きな領域を除外し、その領域からθを含めることで、事前分布を任意に悪くすることができるからです。ただし、θが実際に領域内にあることを保証することは困難です。πθθθ

だから私の質問は:

  1. 一般的に、実際のπの可能な変量であると想定されていますか?θπ
  2. これは保証されますか?
  3. これに違反するケースは少なくとも何らかの方法で検出できるので、条件が満たされない場合、ミニマックスなどの定理に依存しませんか?
  4. それが必要でない場合、なぜ決定理論の標準結果が保持されるのですか?

回答:


6

とてもいい質問です!それは確かに「良い」事前分布が「真」パラメータに正の確率または正の密度値を与えることを意味するだろうが、純粋には判断の観点から、こうである必要はありません。このことは、「直感」への単純な反例π θ 0> 0と、必要でなければならないπ ⋅が前の密度となるθ 0パラメータの「真の」値は、鮮やかであるのminimaxity結果Casella and Strawderman(1981):単一の観測値xに基づいて正規平均μを推定する場合θ0

π(θ0)>0
π()θ0μその追加の制約付き | μ | < ρ、場合 ρが十分に小さい場合、 ρ 1.0567に具体的には、ミニマックス推定相当(最も好ましくない)均一の前に { - ρ ρ }つまり、 πはに等しい重みを与える - ρ ρ(及び任意になし平均のその他の値 μ π θ = 1xN(μ,1)|μ|<ρρρ1.0567{ρ,ρ}πρρμ ときρが増加少なくとも良好前、その支持体が成長しているが、可能な値の有限集合を残り見ます。ただし、事後期待E[μ| x]はρρ)で任意の値を取ることができます。
π(θ)=12δρ(θ)+12δρ(θ)
ρE[μ|x](ρ,ρ)

ディスカッションの中心(コメントを参照)は、ベイズ推定量がサポートのポイントになるように制約されていた場合 、そのプロパティがまったく異なる可能性があるということです。π()

同様に、許容可能な推定量を検討する場合、コンパクトセットで適切な事前分布に関連付けられているベイズ推定量は、サポートが制限されていますが、通常は許容されます。

ΘL(θ,δ)π(θ|x)dθ
XΘL(θ,δ)π(θ)f(x|θ)dθdx
θ0

θ^π(x)=Θθπ(θ|x)dθ
L2π

余談ですが、読んでいるとき

真のθがデータを生成した(つまり、「存在する」)には、θはπの下で可能な変量でなければなりません。たとえば、確率がゼロではなく、密度がゼロではありません。

θ0πxf(x|θ0)πAAθ^π


μ[0,+)μ

1
通常、Berger(1985)を参照してください。最も前の優先度はミニマックスリスクに対応します。
西安

1
θπ(θ)Θ=[m,m]Θ

1
統合リスクには、どの段階でも「真の」パラメーターは含まれません。したがって、この意味では問題ではありません。
西安

1
したがって、ある意味では、リスクは私たちが実際に経験するものではなく、私たちが期待する損失を捉えます。これは非常に役に立ちました。どうもありがとうございました。
user32849

8
  1. θ

  2. (,)[0,1](0,)

  3. 事後が前のドメインの一方のエッジで「積み上げ」られており、前がその同じエッジのドメインに不必要な制限を課している場合、これは不必要な制限が問題を引き起こしている可能性があるという臨時の指標です。ただし、これが発生するのは、a)実際の事前知識ではなく利便性によって主に駆動される事前情報を構築した場合、およびb)事前に誘導された便利な形式により、パラメータのドメインがその「自然な」ドメインと見なすことができます。

そのような例は、潜在的に計算上の困難を回避するために、ゼロからわずかに離れた分散項で以前のものを制限する古い、うまくいけば時代遅れの習慣です。分散の真の値が境界とゼロの間にある場合、まあ...しかし、実際にデータを与えられた分散の潜在的な値について考えるか、(たとえば)代わりに分散のログに事前分布を置くと、この問題を回避する必要があります。同様の軽度の巧妙さにより、ドメインを制限する優先順位を一般的に回避できます。

  1. #1で回答。

2
答えに反対票を投じた人が戻ってきたチャンス-なぜ「役に立たない」のですか?
jbowman

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.