一般的な適合度テストに相当するベイジアンとは何ですか?


25

2つのデータセットがあります。1つは物理的観測(温度)のセットからのもので、もう1つは数値モデルのアンサンブルからのものです。モデルのアンサンブルが真の独立したサンプルを表すと仮定し、観測がその分布から引き出されているかどうかを確認するために、完全なモデル分析を行っています。計算した統計は正規化されており、理論的には標準正規分布でなければなりません。もちろん完璧ではないので、適合度をテストしたいと思います。

頻度論的推論を使用して、Cramér-vonMises統計(またはKolmogorov-Smirnovなど)、または同様のものを計算し、テーブルで値を検索してp値を取得し、値がどの程度低いかを判断するのに役立ちます観測値がモデルと同じである場合、参照してください。

このプロセスのベイジアン等価物は何でしょうか?つまり、これら2つの分布(計算された統計値と標準正規分布)が異なるという確信の強さを定量化するにはどうすればよいですか?


このような何かが法案に合うかもしれません。
シアン

回答:


23

この質問(特に第6章)に答えるための優れた情報源として、Bayesian Data Analysisという本をお勧めします。しかし、ベイジアンがこの問題を攻撃する通常の方法の1つは、事後予測P値(PPP)を使用することです。PPPがこの問題を解決する方法を説明する前に、まず次の表記法を定義します。

してみましょう観測されたデータを可能とθのパラメータのベクトルです。yを定義しますyθとして、複製データいる可能性データとして、我々は、予測考えるように、観察、またはされてしまう生成実験ならば明日を参照してくださいyの今日は、同じモデルと同じ値で複製されたθの観測を作成しましたデータ。yrepyθ

ノートは、我々はの分布定義する事後予測分布を有する知識の現在の状態を所定の P Y 担当者 | Y = Θ P Y 担当者 |yrep

p(yrep|y)=Θp(yrep|θ)p(θ|y)dθ

これで、検査するデータの側面であるテスト量を定義することで、モデルとデータの不一致を測定できます。試験量、または不一致尺度、予測シミュレーションにデータを比較する際に基準として使用されるパラメータおよびデータのスカラー要約です。テスト量は、テスト統計が古典的なテストで果たすベイジアンモデルチェックで役割を果たします。表記法T y を定義しますTyθTyデータのみに依存する検定量である検定統計量。ベイジアンのコンテキストでは、事後分布の下でモデルパラメーターに依存できるようにテスト統計を一般化できます。

古典的には、検定統計量のp値、P C = PrのT Y 担当者T Y | θ 確率は、分布引き継がれるY 担当者θ固定。Ty

pC=PrTy担当者Ty|θ
y担当者θ

ベイジアンの観点から、事後予測分布に関するデータの適合性の欠如は、テスト量のテール領域確率、またはp値によって測定され、次の事後シミュレーションを使用して計算されます。 。Bayesianアプローチでは、テスト量は未知のパラメーターの事後分布からの引き分けで評価されるため、テスト量はデータと同様に未知のパラメーターの関数になります。θy担当者

pB=PrTy担当者θTyθ|y
θy担当者pθy担当者|y
pB=ΘTy担当者θTy|θpy担当者|θpθ|ydy担当者dθ

Lθy担当者θLpy担当者θ|yTyθlTy担当者lθlL

Ty担当者lθlTyθl
l=1L

従来のアプローチとは対照的に、ベイジアンモデルチェックでは、「迷惑パラメーター」を処理するための特別な方法は必要ありません。事後シミュレーションを使用して、モデル内のすべてのパラメーターを暗黙的に平均します。

追加の情報源であるAndrew Gelmanも、PPPに関する非常に素晴らしい論文をここに掲載しています:http : //www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf


3

一方、比較的単純な可能性:適合度の円滑な試験、例えば [1] -比較的簡単になるであろう(重量関数としてヌル密度に対して)直交多項式によって構築されたヌルから平滑偏差の点でフレーム代替、多項式の係数はnullの柔軟だがパラメトリックな拡張を形成するため、ベイジアンフレームワークに持ち越します。

[1]:Rayner、JCWおよびDJ Best(1990)、
「適合度の滑らかなテスト:概要」、
International Statistics Review58:1(4月)、pp。9-17

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.