背景:現在、さまざまなベイジアン階層モデルを比較する作業を行っています。データは、参加者iと時間jの幸福度の数値的尺度です。約1000人の参加者と、参加者ごとに5〜10個の観察結果があります。
ほとんどの縦断的データセットと同様に、時間的に近い観測値は、離れた観測値よりも大きな相関関係を持つ何らかの自己相関を期待しています。いくつかのことを簡略化すると、基本モデルは次のようになります。
ここで、遅延のないモデルを比較しています。
遅延モデルの場合:
ここで者レベルの平均値とされているβ 1はラグパラメータである(すなわち、ラグ効果は、その時点の予測値から前回の時点から観測の偏差の倍数を加算します)。また、y i 0(つまり、最初の観測の前の観測)を推定するためにいくつかのことをしなければなりませんでした。
私が得ている結果は次のことを示しています。
- 遅延パラメーターは、約.18、95%CI [.14、.21]です。すなわち、それは非ゼロです
- モデルに遅延が含まれると、平均偏差とDICは両方とも数百増加します。
- 事後予測チェックは、遅延効果を含めることにより、モデルがデータの自己相関をより良く回復できることを示しています
したがって、要約すると、ゼロ以外のラグパラメーターと事後予測チェックは、ラグモデルが優れていることを示唆しています。それでも平均逸脱とDICは、遅延のないモデルの方が優れていることを示唆しています。これは私を困惑させます。
私の一般的な経験では、有用なパラメーターを追加する場合、少なくとも平均偏差を減らす必要があります(複雑さのペナルティーの後でもDICは改善されません)。さらに、遅延パラメーターの値をゼロにすると、遅延なしモデルと同じ偏差が得られます。
質問
ラグパラメーターがゼロ以外であり、事後予測チェックが改善される場合でも、なぜラグ効果を追加するとベイジアン階層モデルの平均逸脱が増加するのでしょうか?
最初の考え
- 私は多くの収束チェックを行いました(たとえば、トレースプロットを見る;チェーンおよびラン全体の逸脱結果の変化を調べる)両方のモデルが後方に収束したようです。
- ラグエフェクトを強制的にゼロにするコードチェックを実行しました。これにより、ラグのないモデルの逸脱を回復できました。
- また、平均偏差からペナルティーを引いた値を調べました。これにより、期待値で偏差が生じるはずであり、これによりラグモデルが悪化しました。
- おそらく、最初の観測の前に暗黙の時点をどのように推定したかについて、いくつかの問題があります。
- おそらく、このデータのラグ効果は弱いだけです
- で最大の信頼度を使用
lme
してモデルを推定してみましたcorrelation=corAR1()
。ラグパラメーターの推定値は非常に似ていました。この場合、ラグモデルは、ラグのないものよりも対数尤度が大きく、AICが(約100)小さくなりました(つまり、ラグモデルの方が優れていることが示唆されました)。そのため、これにより、ラグを追加することでベイジアンモデルの逸脱も低くなるという考えが強化されました。 - おそらく、ベイジアン残差について何か特別なことがあります。ラグモデルが前の時点で予測されたyと実際のyの差を使用する場合、この量は不確実になります。したがって、遅延効果は、このような残差値の信頼できる間隔で動作します。