どうやら、ベイズ因子は、パラメータ空間全体(MLEだけでなく)で統合された各モデルの尤度を表す尤度を何らかの形で使用しています。この統合は、通常どのように実際に達成されますか?パラメーター空間から数千(数百万)のランダムサンプルのそれぞれで尤度を計算しようとするだけですか、それともパラメーター空間全体で尤度を統合するための分析方法がありますか?
まず、データとモデルに対してなどの用語を考慮する状況は、尤度モデルと見なされます。これは多くの場合、統計分析、フリークエンシーまたはベイジアンのパンとバターであり、これはあなたの分析が良い適合または悪い適合のいずれかを示唆することを意図している部分です。したがって、ベイズ因子は尤度比と根本的に異なることを何もしていません。P(D|M)DM
ベイズ因子を正しい設定にすることが重要です。たとえば、2つのモデルがあり、確率からオッズに変換すると、ベイズ因子は以前の信念に対する演算子のように機能します。
PosteriorOdds=BayesFactor∗PriorOdds
P(M1|D)P(M2|D)=B.F.×P(M1)P(M2)
本当の違いは、尤度比の計算が安価であり、一般に概念的には指定が簡単なことです。MLEでの尤度は、それぞれベイズ因子の分子と分母の点推定にすぎません。ほとんどの頻繁な構文のように、これは、取得が困難な不自然な事前条件を持つベイズ分析の特別なケースと見なすことができます。しかし、ほとんどの場合、分析的に扱いやすく、計算が簡単であるために発生しました(近似ベイジアン計算アプローチが登場する前の時代)。
計算のポイントまで、はい:実質的に関心のあるほとんどすべてのケースで、大規模なモンテカルロ手順を使用して、ベイジアン設定のさまざまな尤度積分を評価します。特定の分布を仮定した場合に動作するGHKなどの特殊なシミュレーターがあり、これらの仮定を行うと、完全に分析的なベイズ因子が存在する分析的に扱いやすい問題を見つけることができます。
しかし、誰もこれらを使用しません。理由はありません。最適化されたMetropolis / Gibbsサンプラーおよび他のMCMCメソッドを使用すると、これらの問題に完全にデータ駆動型でアプローチし、積分を数値的に計算することは完全に扱いやすくなります。実際、多くの場合、これを階層的に実行し、データ収集メカニズム、無視できない実験計画などに関連するメタ優先度の結果をさらに統合します。
詳細については、Bayesian Data Analysisの本をお勧めします。しかし、著者のアンドリュー・ゲルマンは、ベイズ因子をあまり気にしていないようです。余談ですが、私はゲルマンに同意します。ベイジアンに行く場合は、後部全体を活用します。モデル選択は弱く、ほとんど役に立たない推論の形式であるため、ベイズ法でモデル選択を行うことはハンディキャップのようなものです。可能であれば、モデルの選択肢に対する分布を知りたいのですが、必要がない場合に「モデルAはモデルBよりも優れている」という種類のステートメントに量子化することに関心がある人はいますか。
さらに、ベイズ係数を計算するとき、尤度比の場合と同様に、複雑さの補正を適用します(自動的に尤度の相互検証推定を介して、または分析的にAICを介して)?
これは、ベイジアン手法の優れた点の1つです。ベイズ因子は、技術的な意味でモデルの複雑さを自動的に考慮します。2つのモデルとして、それぞれモデルの複雑さをと、とサンプルサイズの単純なシナリオを設定できます。。M1M2d1d2d1<d2N
次いで、場合とベイズ因子である分子に、という仮定の下で真の一つであるようにすることを証明することができ、に近づくモデルの複雑さの違いに依存するレートでであり、ベイズ因子はより単純なモデルを優先します。具体的には、上記のすべての仮定の下で、であることを示すことができますB1,2M1M1N→∞B1,2∞
B1,2=O(N12(d2−d1))
私はこの導出と、シルビア・フリューワート・シュナッター著の「有限混合とマルコフ交換モデル」からの議論に精通しているが、それの根底にある認識論をより深く掘り下げるより直接的な統計的記述がある可能性が高い。
私はここでそれらを与えるほど詳細を知りませんが、これとAICの派生の間にはかなり深い理論的つながりがあると思います。カバーとトーマスによる情報理論の本は、少なくともこれをほのめかしました。
また、尤度比とベイズ因子の哲学的違いは何ですか(nb尤度比とベイズ法一般の哲学的違いについては質問していませんが、具体的に客観的証拠の表現としてのベイズ因子です)。尤度比と比較して、ベイズ因子の意味をどのように特徴付けることができますか?
「解釈」のWikipediaの記事のセクションでは、この(証拠スケールのジェフリーズ強さを示す特にチャートを)議論の良い仕事をしていません。
いつものように、ベイジアン手法と頻度論的手法の基本的な違いを超えた哲学的なものはあまりありません(既におなじみのようです)。
主なことは、オランダの本の意味では尤度比が一貫していないことです。尤度比からのモデル選択推論により、負けた賭けを受け入れるシナリオを作成できます。ベイジアン法は一貫性がありますが、非常に貧弱な可能性があり、主観的に選択する必要がある事前分布で動作します。トレードオフ..トレードオフ...
FWIW、私はこの種の非常にパラメータ化されたモデル選択はあまり良い推論ではないと思います。私はベイジアン手法を好み、それらをより階層的に整理することを好みます。計算が実行可能である場合は、完全な事後分布を中心に推論を行いたいです。ベイズ因子にはきちんとした数学的特性があると思いますが、ベイジアン自身としては、それらに感銘を受けていません。ベイジアン分析の非常に有用な部分を隠します。つまり、敷物の下に掃き寄せるのではなく、野外で事前に対処することを強制し、完全な事後の推論を行うことができます。