負の二項回帰(負の二項GLM)を使用してモデルを作成しようとしています。サンプルサイズが比較的小さく(300を超える)、データがスケーリングされていません。適合度を測定するには2つの方法があることに気付きました。1つは逸脱度であり、もう1つはピアソン統計です。使用する適合度の測定値をどのように決定できますか?適合度測定を選択する際に検討できる基準はありますか?
負の二項回帰(負の二項GLM)を使用してモデルを作成しようとしています。サンプルサイズが比較的小さく(300を超える)、データがスケーリングされていません。適合度を測定するには2つの方法があることに気付きました。1つは逸脱度であり、もう1つはピアソン統計です。使用する適合度の測定値をどのように決定できますか?適合度測定を選択する際に検討できる基準はありますか?
回答:
逸脱度に基づく適合度検定は、適合モデルと飽和モデル(各観測値が独自のパラメーターを取得するモデル)の間の尤度比検定です。ピアソンのテストはスコアテストです。適合モデルが正しい場合、スコアの期待値(対数尤度関数の1次導関数)はゼロであり、適合性の欠如のより強い証拠として、ゼロとの差が大きくなります。理論はSmyth(2003)、「スコアテスト統計としてのピアソンの適合度統計」、統計と科学:テリースピードのフェストシュリフトで説明されています。
実際には、人々は通常、カイ二乗分布に対する両方の漸近近似に依存しています。負の二項モデルの場合、これは期待されるカウントが小さすぎないことを意味します。Smythは、飽和モデルの特定の形式を仮定する必要はなく、近似モデルをnullとしてのみ考慮しているため、ピアソン検定はモデルの誤指定に対してより堅牢であると指摘しています。私はそれらの間の多くの違いに気づいたことがありません。
どちらかとの適合性の大幅な欠如は、おそらくすでに知っていること、つまりモデルが現実を完全に表現しているわけではないことを示していることを反映したい場合があります。サンプルサイズが大きいほど、このことを知らされる可能性が高くなります。おそらく、より密接な問題は、モデルを改善できるかどうか、およびどの診断方法が役立つかです。