負の二項/ポアソン回帰における過分散と過分散


11

SASでポアソン回帰を実行していたところ、ピアソンのカイ2乗値を自由度で割った値が約5であり、有意な過剰分散を示していました。したがって、負の二項モデルをproc genmodで近似し、ピアソンのカイ2乗値を自由度で割った値が0.80であることがわかりました。これは現在、分散不足であると考えられていますか?もしそうなら、これをどのように処理するのですか?私は過剰分散について多くを読み、これを処理する方法を知っていると信じていますが、分散不足があるかどうかを処理または決定する方法に関する情報は乏しいです。誰でも手伝ってくれる?

ありがとう。


回答:


17

平均がポアソン分布の場合、分散もです。一般化線形モデルのフレームワーク内では、これ はポアソンモデルの分散関数が であることを意味します。このモデルの仮定は、さまざまな理由で間違っている可能性があります。たとえば、ポアソン分布が要求するものよりも大きい分散を持つ過剰分散されたカウントデータは、たとえば、頻繁に発生します。 μ V μ = μμμ

V(μ)=μ

分散の仮定からの逸脱は、回帰のコンテキストではいくつかの形をとることがあります。最も簡単なのは、分散関数が 、が分散パラメーターである場合です。これは準ポアソンモデルです。同じ近似回帰モデルが得られますが、統計的推論(値と信頼区間)は、推定された分散パラメーターを使用して、過分散または過分散に対して調整されます。ψ > 0 P

V(μ)=ψμ
ψ>0p

分散関数の関数形式も間違っている可能性があります。 たとえば、2次多項式 ます。例には、二項式、負の二項式、およびガンマモデルが含まれます。これらのモデルのいずれかをポアソンモデルの代替として選択すると、近似回帰モデルだけでなく、その後の統計的推論にも影響します。形状パラメーターがの負の二項分布の場合、分散関数は これから、場合、ポアソン分布の分散関数が得られることがわかります。λ > 0 V μ = μ 1 + μ

V(μ)=aμ2+bμ+c,
λ>0λ
V(μ)=μ(1+μλ).
λ

ポアソンモデルの分散関数がデータに適切かどうかを判断するために、OPの提案に従って分散パラメーターを推定し、それが約1(おそらく正式なテストを使用)かどうかを確認できます。このような検定は特定の代替案を示唆するものではありませんが、準ポアソンモデル内で最も明確に理解されます。分散関数の関数形が適切かどうかをテストするために、ポアソンモデル()の負の二項モデル()に対する尤度比検定を作成できます。帰無仮説の下では、非標準の分布があることに注意してください。または、ネストされていないモデルを比較するために、一般的にAICベースのメソッドを使用することもできます。ポアソンモデルの過分散に対する回帰ベースのテストλ < λ=λ< 一般的な分散関数のテストのクラスを探索します。

ただし、まず最初に、残差プロット、たとえば、ピアソンまたは逸脱残差(またはそれらの2乗値)のプロットを近似値に対して検討することをお勧めします。分散の関数形が間違っている場合、これは残差プロットで漏斗形状(または残差の2乗の傾向)として表示されます。関数形式が正しい場合、つまりファンネルやトレンドがない場合でも、過剰または過小分散が存在する可能性がありますが、これは分散パラメーターを推定することで説明できます。残差プロットの利点は、分散関数のどこに問題があるかをテストよりも明確に示唆することです。

OPの具体的なケースでは、0.8が指定された情報からの分散不足を示しているかどうかを言うことはできません。5と0.8の推定に焦点を合わせる代わりに、まずポアソンモデルと負の二項モデルの分散関数の適合を調査することをお勧めします。分散関数の最も適切な関数形式が決定されたら、必要に応じて、いずれかのモデルに分散パラメーターを含めて、追加の過剰または不足分散の統計的推論を調整できます。SASでそれを簡単に行う方法は、残念ながら、私が手助けできるものではありません。


2
+1、これは良い一般情報です。OPの明確な質問に具体的に対処した場合、OPにとってより役立つ可能性があります。(1)は.8に分散不足です。&(2)もしそうなら、それをどう扱うか。
ガン-モニカの回復

@gung、私はより具体的なアドバイスを与えるために答えを編集しました。利用可能な情報から0.8が1より大幅に小さいかどうかを判断することはできません。また、分散パラメーターが1であるかどうかに焦点を当てたIMHOは転換です。私の編集は、OPが代わりに焦点を当てるべきだと私が思うことを説明しています。
NRH、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.