問題
情報に基づいた事前データとデータを指定して事後密度を推定するベイズ分析を実行するR関数を書いています。ユーザーが前のものを再検討する必要がある場合、関数が警告を送信することを望みます。
この質問では、事前評価の評価方法に興味があります。以前の質問では、情報に基づいた事前情報を示すメカニズムを説明しました(こことここ。)
次の場合は、事前の再評価が必要になる場合があります。
- データは、以前のことを述べたときに考慮されなかった極端なケースを表しています
- データのエラー(たとえば、前のデータがkgであるときにデータがgの単位である場合)
- コード内のバグのため、利用可能な事前設定のセットから間違った事前設定が選択されました
最初のケースでは、データ値がサポートされていない範囲(たとえば、logNまたはGammaの0未満)にない限り、通常、事前分布は依然として十分拡散しているため、データは一般的に圧倒します。その他のケースはバグまたはエラーです。
ご質問
- データを使用して事前評価を行うことの妥当性について何か問題はありますか?
- この問題に最適な特定のテストはありますか?
例
これらは、(赤)または(青)のいずれかの母集団からのものであるため、以前のとの一致が不十分な2つのデータセットです。N (0 、5 )N (8 、0.5 )
青色のデータは有効な事前+データの組み合わせである可能性がありますが、赤色のデータは負の値でサポートされる事前分布が必要です。
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')