平均がポアソン分布の場合、分散もです。一般化線形モデルのフレームワーク内では、これ
はポアソンモデルの分散関数が
であることを意味します。このモデルの仮定は、さまざまな理由で間違っている可能性があります。たとえば、ポアソン分布が要求するものよりも大きい分散を持つ過剰分散されたカウントデータは、たとえば、頻繁に発生します。 μ V (μ )= μμμ
V(μ)=μ
分散の仮定からの逸脱は、回帰のコンテキストではいくつかの形をとることがあります。最も簡単なのは、分散関数が
、が分散パラメーターである場合です。これは準ポアソンモデルです。同じ近似回帰モデルが得られますが、統計的推論(値と信頼区間)は、推定された分散パラメーターを使用して、過分散または過分散に対して調整されます。ψ > 0 P
V(μ)=ψμ
ψ>0p
分散関数の関数形式も間違っている可能性があります。
たとえば、2次多項式
ます。例には、二項式、負の二項式、およびガンマモデルが含まれます。これらのモデルのいずれかをポアソンモデルの代替として選択すると、近似回帰モデルだけでなく、その後の統計的推論にも影響します。形状パラメーターがの負の二項分布の場合、分散関数は
これから、場合、ポアソン分布の分散関数が得られることがわかります。λ > 0 V (μ )= μ ( 1 + μ
V(μ)=aμ2+bμ+c,
λ>0λ→∞V(μ)=μ(1+μλ).
λ→∞
ポアソンモデルの分散関数がデータに適切かどうかを判断するために、OPの提案に従って分散パラメーターを推定し、それが約1(おそらく正式なテストを使用)かどうかを確認できます。このような検定は特定の代替案を示唆するものではありませんが、準ポアソンモデル内で最も明確に理解されます。分散関数の関数形が適切かどうかをテストするために、ポアソンモデル()の負の二項モデル()に対する尤度比検定を作成できます。帰無仮説の下では、非標準の分布があることに注意してください。または、ネストされていないモデルを比較するために、一般的にAICベースのメソッドを使用することもできます。ポアソンモデルの過分散に対する回帰ベースのテストλ < ∞λ=∞λ<∞ 一般的な分散関数のテストのクラスを探索します。
ただし、まず最初に、残差プロット、たとえば、ピアソンまたは逸脱残差(またはそれらの2乗値)のプロットを近似値に対して検討することをお勧めします。分散の関数形が間違っている場合、これは残差プロットで漏斗形状(または残差の2乗の傾向)として表示されます。関数形式が正しい場合、つまりファンネルやトレンドがない場合でも、過剰または過小分散が存在する可能性がありますが、これは分散パラメーターを推定することで説明できます。残差プロットの利点は、分散関数のどこに問題があるかをテストよりも明確に示唆することです。
OPの具体的なケースでは、0.8が指定された情報からの分散不足を示しているかどうかを言うことはできません。5と0.8の推定に焦点を合わせる代わりに、まずポアソンモデルと負の二項モデルの分散関数の適合を調査することをお勧めします。分散関数の最も適切な関数形式が決定されたら、必要に応じて、いずれかのモデルに分散パラメーターを含めて、追加の過剰または不足分散の統計的推論を調整できます。SASでそれを簡単に行う方法は、残念ながら、私が手助けできるものではありません。