2
GLMの分散テストは実際に*有用*ですか?
GLMの「過剰分散」の現象は、応答変数の分散を制限するモデルを使用するたびに発生し、データはモデルの制限が許容するよりも大きな分散を示します。これは、ポアソンGLMを使用してカウントデータをモデル化するときによく発生し、よく知られたテストで診断できます。過剰分散の統計的に有意な証拠があることがテストで示された場合、通常、元のモデルで発生する制限から分散パラメーターを解放するより広範な分布ファミリーを使用してモデルを一般化します。ポアソンGLMの場合、負の二項または準ポアソンGLMのいずれかに一般化するのが一般的です。 この状況には明らかな異議があります。なぜポアソンGLMから始めるのですか?(比較的)自由な分散パラメーターを持つより広い分布形式から直接始めて、分散パラメーターをデータに適合させ、過剰分散テストを完全に無視することができます。データ分析を行う他の状況では、少なくとも最初の2モーメントの自由度を許可する分布形式をほぼ常に使用しますが、なぜここで例外を設けるのですか? 私の質問:分散を修正する分布(ポアソン分布など)から始めて、過剰分散テストを実行する正当な理由はありますか?この手順は、この演習を完全にスキップして、より一般的なモデル(たとえば、負の二項分布、準ポアソンなど)に直接進むことと比較してどうですか?言い換えれば、なぜ自由分散パラメーターを持つ分布を常に使用しないのですか?