回答:
事後予測チェックとは、簡単な言葉で言うと、「適合モデルの下で複製されたデータをシミュレートし、それらを観察されたデータと比較する」ことです(Gelman and Hill、2007、p。158)。したがって、事後予測を使用して、「実際のデータとシミュレートされたデータとの間の系統的な矛盾を探します」(Gelman et al。2004、p。169)。
「データを2回使用する」ことについての議論は、モデルを推定し、モデルがデータに適合するかどうかを確認するためにデータを使用することですが、一般的には悪い考えであり、外部データでモデルを検証することをお勧めします、推定には使用されませんでした。
事後予測チェックは、モデルが現実に関する「有効な」予測を提供するかどうかを評価する際に役立ちます-観測されたデータに適合するかどうか。これは、モデルの構築とチェックの有用な段階です。モデルが「OK」であるか、他のモデルより「優れている」かについての明確な答えは得られませんが、モデルが意味を成すかどうかを確認するのに役立ちます。
これは、LaplacesDemon vignette Bayesian Inferenceでうまく説明されています。
事後予測チェック(予測分布を使用)には、データの二重使用が含まれ、尤度の原則に違反します。ただし、モデルの比較と推論ではなく、モデルの妥当性を研究するための不一致の測定に使用が制限されている場合、事後予測チェックを支持して議論が行われました(Meng 1994)。