限界尤度を推定するのが難しい/扱いにくいのはなぜですか?


9

私がここで尋ねる一般的に基本的な質問がありますが、これはしばらくの間私を悩ませてきました。私がベイジアン統計を読んだことのほとんどを通して、それは事実上、限界尤度はしばしば扱いにくいか、推定することが難しいと述べました。どうして?

しばしば述べられる理由には、推定される積分/総和の高次元の性質に関するステートメント、または可能なモデルの領域が無限であるというステートメントが含まれます。

このコミュニティに、理由を掘り下げ、この問題を簡単な言葉で説明することをお願いします。

リソースへのリンクもいただければ幸いです。これを明確に説明するリソースを探すために用語をグーグルで検索しましたが、それらのほとんどは説明なしで問題を述べているだけです。また、機械学習の本のパターン認識とケビンマーフィーの機械学習の本も持っています。私はこれらのテキストの説明に満足していないので、明確でシンプルなものを探しています。

回答:


2

例による答えは次のとおりです。次の階層モデルがあるとします for groups and observations aグループおよび既知の値および。 限界尤度は 積分の次元は

YigindN(θg,1)θgindN(μ,τ2)μ|τ2N(m,τ2/k)τ2IG(a,b)
g=1,,Gi=1,,ngm,k,a,b
y=(y1,1,,yn1,1,y1,2,,yn2,2,,y1,G,,ynG,G),
G + 2 G
p(y)=g=1G[i=1ngN(yig;θg,1)]N(θg;μ,τ2)dθ1dθGdμdτ2.
G+2およびが大きい場合、これは高次元の積分です。ほとんどの数値積分手法では、この積分の妥当な近似値を取得するために、極端な数のサンプルまたは反復が必要になります。G

この積分はたまたま閉じた形で限界尤度を持っているので、数値積分手法が限界尤度をどれだけうまく推定できるかを評価できます。周辺尤度の計算が難しい理由を理解するには、たとえば、単一の観測値、単一のグループ、とが既知であるなど、単純なものから始めます。徐々に問題を徐々に難しくしていくことができます。数値積分手法が真実とどのように関連しているかをご覧ください。問題の次元、つまりが増加するにつれて、同じ精度を得るには、ますます多くのサンプルまたは反復が必要になることに気づくでしょう。最後に、σ 2 G Y I G I N D P O E θ Gμσ2GYigindPo(eθg)そして今、あなたは閉じた形をしていないわずかな可能性を持っています。真実を知ったときの経験に基づいて、真実を知らない場合の数値の見積もりをどれだけ信じますか?数値の見積もりにあまり自信がないと思います。


答えてくれてありがとう。このような概念を説明する資料に関する推奨事項はありますか?テキスト、論文などを探してくれてありがとう!
user1556364 2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.