ベイジアンp値にデータに加えてパラメーターが含まれるのはなぜですか？

Gelmanのベイジアンデータ分析の146ページで、Gelmanはモデルの適合性をチェックする方法としてベイジアンp値について説明しています。アイデアは、観測データ（）を、実験を再現した場合にモデルによって生成された可能性のあるデータ（）と比較することです。 $y$ $y^{rep}$

彼はベイジアンp値を次のように定義しています。

p_{B} = P r (T (y^{r e p}, θ) \geq T (y, θ) | y)

$p_B = Pr(T(y^{rep}, \theta) \geq T(y, \theta) | y)$

テスト統計をパラメーターの関数であるにするのが理にかなっている理由がよくわかりません。実際、目標が「観測されたデータとモデルによって生成された可能性のあるデータとの比較」である場合、比較は厳密にと間で行われるべきではありませんか？ $\theta$ $y$ $y^{rep}$

たとえば、同じページのGelmanは、通常のモデルの適合性をチェックする例を提供しています。テスト統計は次のとおりです。

T (y, θ) = | y_{(61)} - θ | - | y_{(6)} - θ |

$T(y, \theta) = | y_{(61)} - \theta | - |y_{(6)} - \theta |$

ここで、は通常のモデルの平均です。この検定統計量は、6次および61次の統計量を超えて、極端な尾でのモデルの適合を無視するように設計されています。 $\theta$

代わりに次の検定統計量を使用して、純粋にデータに依存しないのはなぜですか？

T (y, θ) = | y_{(61)} - \bar{y} | - | y_{(6)} - \bar{y} |

$T(y, \theta) = | y_{(61)} - \bar y | - |y_{(6)} - \bar y |$

bayesian p-value goodness-of-fit

— ハイゼンベルク
ソース

複製データのみに基づくテスト統計の使用を妨げるものは何もありません。

この例の要点は、モデルはが通常ではなく平均周りに分布していると想定していることです。したがって、Gelmanらで提供されている検定統計量。al。正規性の仮定について何かをテストしますが、テスト統計が何をテストしているかは本当に明確ではありません。 $y_i$ $\theta$ $\overline{y}$

— ハラドニエミ
ソース

複製データのみに基づいてテスト統計を使用することは100％コーシャであることに同意します。問題は、なぜモデルパラメーターを含むテスト統計を使用するのが適切なのかということです。概念的には、モデルを使用していくつかの予測を行い、それらの予測を観測された「グラウンドトゥルース」と比較することは理にかなっています。最初に確認したいモデルからのを含むに対して比較できることは意味がありません。それは私には円形のようです。

T (y)

$T(y)$

T (y, θ)

$T(y, \theta)$

θ

$\theta$

— ハイゼンベルク