関心が単にモデルのパラメーターを推定するだけで(ポイントワイズおよび/または間隔推定)、以前の情報が信頼できず、弱い場合(これは少しあいまいですが、選択のシナリオを確立しようとしています)事前は困難です)...なぜ誰かが、古典的なアプローチの代わりに「非情報的」な不適切な事前確率でベイジアンアプローチを使用することを選択するのでしょうか?
関心が単にモデルのパラメーターを推定するだけで(ポイントワイズおよび/または間隔推定)、以前の情報が信頼できず、弱い場合(これは少しあいまいですが、選択のシナリオを確立しようとしています)事前は困難です)...なぜ誰かが、古典的なアプローチの代わりに「非情報的」な不適切な事前確率でベイジアンアプローチを使用することを選択するのでしょうか?
回答:
情報量の少ない事前分布を使用している場合でも、ベイジアンアプローチを使用する2つの理由:
結果は非常に似ていますが、その解釈は異なります。
信頼区間は、実験を何度も繰り返し、95%の時間で真のパラメーターを取得できるという概念を意味します。ただし、95%の確率でキャプチャできるとは言えません。
一方、信頼できる間隔(ベイジアン)では、間隔が真の値をキャプチャする95%の「チャンス」があると言うことができます。更新:よりベイジアン的な言い方をすれば、結果に対して95%の自信を持つことができます。
パラメーターの完全な事後分布を提供することは、ベイジアンアプローチの利点です。従来の方法よりも、通常、尤度関数のモードで表されるパラメーターの点推定のみを提供し、漸近正規性の仮定と2次近似を使用します。不確実性を記述する対数尤度関数の ベイジアンフレームワークでは、パラメーターの完全な事後分布が利用できるため、不確実性を評価するために近似を使用する必要はありません。さらに、ベイジアン分析は、古典的な統計の信頼区間の概念よりも簡単に解釈されるパラメーターまたはパラメーターの関数の信頼できる区間を提供できます(Congdon、2001)。
そのため、たとえば、2つのパラメーターの差について信頼できる間隔を計算できます。
サー・ハロルド・ジェフリーズは、ベイジアンアプローチの強力な支持者でした。彼は、拡散不適切な事前分布を使用すると、結果のベイジアン推論は、頻度論的推論アプローチと同じになることを示しました(つまり、ベイジアンの信頼できる領域は、頻度論的信頼区間と同じです)。ほとんどのベイジアン人は、適切な有益な事前を主張しています。不適切な事前分布には問題があり、一部の事前分布は本当に情報価値がないと主張することができます。私は、これらのジェフリーズの事前を使用するベイジアンがジェフリーズの信者としてそれを行うと思います。ベイジアンアプローチの最も強力な擁護者の一人であるデニス・リンドリーは、ジェフリーズを大いに尊敬していたが、有益な事前事項を主張した。
ベイジアンアプローチには実用的な利点があります。多くの場合、必須である推定に役立ちます。また、新しいモデルファミリを有効にし、より複雑な(階層的、マルチレベル)モデルの構築を支援します。
たとえば、混合モデル(分散パラメーターを持つ変量効果を含む)では、低レベルのパラメーター(モデル係数。これはREMLと呼ばれます)を無視して分散パラメーターを推定すると、より良い推定が得られます。ベイジアンアプローチはこれを自然に行います。これらのモデルでは、REMLを使用しても、分散パラメーターの最尤(ML)推定値はゼロまたは下方向に偏っていることがよくあります。分散パラメーターの適切な事前分布が役立ちます。
ポイント推定(MAP、最大事後確率)が使用される場合でも、事前分布によりモデルファミリが変更されます。やや共線的な変数の大きなセットを伴う線形回帰は不安定です。L2正則化は改善策として使用されますが、ガウス(非情報)事前およびMAP推定によるベイジアンモデルとして解釈できます。(L1正則化は異なる事前分布であり、異なる結果をもたらします。実際、ここでは事前分布は多少情報を提供するかもしれませんが、単一のパラメーターではなく、パラメーターの集合的性質に関するものです。)
そのため、物事を成し遂げるためだけにベイジアンアプローチが必要な、いくつかの一般的で比較的単純なモデルがあります!
機械学習で使用される潜在ディリクレ割り当て(LDA)など、より複雑なモデルでは、事態はさらに有利になります。また、ディリクレ過程に基づいたモデルなど、一部のモデルは本質的にベイジアンです。
いくつかの理由があります。
今、情報価値のない事前分布を使用することの欠点については、私が最も重要だと思うものから始めて、非常に重要な技術的側面のいくつかに向かっています:
最後の点は、適切な事後を確保するためにかなり曖昧な(またはわずかに情報が少ない)優先順位を好むことの議論です。確かに、これらからサンプリングすることも難しい場合があり、後部全体が調査されていないことに気付かない場合があります。しかし、あいまいな(しかし適切な)事前分布をもつベイジアン手法は、多くの分野で、頻繁な観点から非常に優れた小さなサンプルプロパティを持つことが示されており、それらを使用するための引数として、確かにそれを見ることができますが、少し多くのデータではほとんどありません情報のない事前分布を使用した方法との違い。