この質問(特に第6章)に答えるための優れた情報源として、Bayesian Data Analysisという本をお勧めします。しかし、ベイジアンがこの問題を攻撃する通常の方法の1つは、事後予測P値(PPP)を使用することです。PPPがこの問題を解決する方法を説明する前に、まず次の表記法を定義します。
してみましょう観測されたデータを可能とθのパラメータのベクトルです。yを定義しますyθとして、複製データいる可能性データとして、我々は、予測考えるように、観察、またはされてしまう生成実験ならば明日を参照してくださいyの今日は、同じモデルと同じ値で複製されたθの観測を作成しましたデータ。yrepyθ
ノートは、我々はの分布定義する事後予測分布を有する知識の現在の状態を所定の
P (Y 担当者 | Y )= ∫ Θ P (Y 担当者 |yrep
p(yrep|y)=∫Θp(yrep|θ)p(θ|y)dθ
これで、検査するデータの側面であるテスト量を定義することで、モデルとデータの不一致を測定できます。試験量、または不一致尺度、、予測シミュレーションにデータを比較する際に基準として使用されるパラメータおよびデータのスカラー要約です。テスト量は、テスト統計が古典的なテストで果たすベイジアンモデルチェックで役割を果たします。表記法T (y )を定義しますT(y、θ )T(y)データのみに依存する検定量である検定統計量。ベイジアンのコンテキストでは、事後分布の下でモデルパラメーターに依存できるようにテスト統計を一般化できます。
古典的には、検定統計量のp値で
、P C = Prの(T (Y 担当者)≥ T (Y )| θ )
確率は、分布引き継がれるY 担当者とθ固定。T(y)
pC= Pr (T(y担当者)≥ T(y)| θ )
y担当者θ
ベイジアンの観点から、事後予測分布に関するデータの適合性の欠如は、テスト量のテール領域確率、またはp値によって測定され、次の事後シミュレーションを使用して計算されます。 。Bayesianアプローチでは、テスト量は未知のパラメーターの事後分布からの引き分けで評価されるため、テスト量はデータと同様に未知のパラメーターの関数になります。(θ 、y担当者)
pB= Pr (T(y担当者、θ )≥ T(y、θ )| y)
θy担当者p (θ 、y担当者| y)pB= ∬Θ私T(y担当者、θ )≥ T(y| θ)p (y担当者| θ)p(θ | y)dy担当者dθ 、
私
Lθy担当者θLp (y担当者、θ | y)T(y、θl)T(y担当者リットル、θl)L
T(y担当者リットル、θl)≥ T(y、θl)
L = 1 、。。。、L
従来のアプローチとは対照的に、ベイジアンモデルチェックでは、「迷惑パラメーター」を処理するための特別な方法は必要ありません。事後シミュレーションを使用して、モデル内のすべてのパラメーターを暗黙的に平均します。
追加の情報源であるAndrew Gelmanも、PPPに関する非常に素晴らしい論文をここに掲載しています:http :
//www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf