GLMの分散テストは実際に有用ですか？

GLMの「過剰分散」の現象は、応答変数の分散を制限するモデルを使用するたびに発生し、データはモデルの制限が許容するよりも大きな分散を示します。これは、ポアソンGLMを使用してカウントデータをモデル化するときによく発生し、よく知られたテストで診断できます。過剰分散の統計的に有意な証拠があることがテストで示された場合、通常、元のモデルで発生する制限から分散パラメーターを解放するより広範な分布ファミリーを使用してモデルを一般化します。ポアソンGLMの場合、負の二項または準ポアソンGLMのいずれかに一般化するのが一般的です。

この状況には明らかな異議があります。なぜポアソンGLMから始めるのですか？（比較的）自由な分散パラメーターを持つより広い分布形式から直接始めて、分散パラメーターをデータに適合させ、過剰分散テストを完全に無視することができます。データ分析を行う他の状況では、少なくとも最初の2モーメントの自由度を許可する分布形式をほぼ常に使用しますが、なぜここで例外を設けるのですか？

私の質問：分散を修正する分布（ポアソン分布など）から始めて、過剰分散テストを実行する正当な理由はありますか？この手順は、この演習を完全にスキップして、より一般的なモデル（たとえば、負の二項分布、準ポアソンなど）に直接進むことと比較してどうですか？言い換えれば、なぜ自由分散パラメーターを持つ分布を常に使用しないのですか？

— モニカを復活させる
ソース

私の推測では、基礎が本当にポアソンである場合、正しい場合、glmの結果は、推定値の分散が必要以上に大きいという意味で効率的な推定値のようなよく知られた特性を示しませんモデルが使用されていました。推定値は、おそらく偏りがないか、MLEのものではありません。しかし、それは私の直観であり、間違っている可能性があります。良い答えが何なのか興味があります。

— mlofton

私の経験では、（データ生成プロセスの知識から）過剰分散が存在しないことがわかっている場合、過剰分散のテストは（逆説的に）主に役立ちます。このコンテキストでは、過分散のテストにより、線形モデルがデータ内のすべての信号を拾っているかどうかがわかります。そうでない場合は、モデルに共変量を追加することを検討する必要があります。そうであれば、より多くの共変量は助けになりません。

— ゴードンスミス

@GordonSmyth：それは良い答えだと思う。あなたがそれをそれ自身の答えに変えたくないならば、私はそれを私のものに折り畳むでしょう。

— クリフAB

@GordonSmythは、適合度テストとしての逸脱の分析について常に悩まされていた1つのことに気づきました。共変量の欠落は、過剰分散と混同されます。教材がどのように教えられるかに関するいくつかの問題を示唆しています。私はカテゴリーでクラスを教えていますが、教科書はこの点をあまり強く主張していません。

— 男

@guyはい、そうです。人々は、残差偏差が常にカイ二乗分布であると仮定する傾向がありますが、そうではないことがよくあります。私たちは最近の教科書doi.org/10.1007/978-1-4419-0118-7でこれらの点をより良くしようとしましたが、スペースの制限内ですべてをカバーするのは困難です。

— ゴードンスミス

回答:

原則として、99％の時間で、より柔軟なモデルを使用することをお勧めします。そうは言っても、なぜそうしないのかについての2つの半論があります。

（1）柔軟性が低いと、推定がより効率的になります。分散パラメーターは平均パラメーターよりも安定性が低い傾向があるため、固定平均分散関係の仮定は標準誤差をより安定させる可能性があります。

（2）モデル検査。理論物理学のため、さまざまな測定値がポアソン分布で記述できると信じている物理学者と仕事をしました。平均=分散という仮説を棄却すると、ポアソン分布仮説に反する証拠が得られます。@GordonSmythのコメントで指摘されているように、特定の測定値がポアソン分布に従うべきであると信じる理由がある場合、過剰分散の証拠がある場合、重要な要素が欠落しているという証拠があります。

$Var[y] = \alpha E[y]$ $\alpha \neq 1$

— クリフAB
ソース

2.5：もちろん、その制限がないランダムな効果を持つ負の二項およびGLMMがあります。

— ビョルン

@Björn：だからこそ、それは議論の半分にすぎない。準尤度法にのみ適用されます。私の知る限りでは、何のための可能性に基づいた方法はありません下の分散が、これは準尤度モデルを用いて解析することが可能にもかかわらず、。

— クリフAB

また、2.5：私の理解では、望ましい関係を満たす指数分散ファミリはありません。つまり、準スコアは本物のスコアに対応していません。それは存在しないという意味ではありません何の目的の関係を満たすカウントデータのためのディストリビューションの家族は、そのような家族がたくさんいるはずです。

— 男

@CliffABの分散が不十分なデータには、Conway-Maxwell-Poissonモデルがあります。en.m.wikipedia.org / wiki / ...は、いくつかのRパッケージで実装されています。

— ディミトリスリゾプーロス

モデルを予測に使用する場合、より単純なモデルを好むもう1つの理由は、他のすべてが等しい場合、より単純なモデルの方が予測品質が優れていることです。私はAIC、BIC、およびPAC全般について考えています。

— meh

これは私自身の質問ですが、答えとして自分自身の2セントも投稿するので、この質問に関する多くの視点を追加します。ここでの問題は、最初に1パラメーター分布をデータに適合させることが賢明かどうかです。1パラメーター分布（ポアソンGLM、または固定試行パラメーターを使用した2項GLMなど）を使用する場合、分散は自由パラメーターではなく、平均の何らかの関数に制約されます。これは、分散がその分布の構造に従うことを完全に確信できない状況では、1パラメーター分布をデータに適合させることはお勧めできません。

1パラメーター分布をデータに近似することは、ほとんどの場合悪い考えです。データは、提案されたモデルが示すよりもしばしば厄介であり、特定の1パラメーターモデルが取得できると信じる理論的な理由がある場合でも、多くの場合、データは実際には、その1つのパラメーター分布とパラメーター値の範囲が混在しています。これは、多くの場合、分散の自由度を高める2パラメーター分布などのより広範なモデルと同等です。以下で説明するように、これはカウントデータの場合のポアソンGLMに当てはまります。

質問で述べたように、統計のほとんどのアプリケーションでは、少なくとも最初の2つの瞬間が自由に変化することを許可する分布形式を使用することが標準的な方法です。これにより、モデルが人為的に制約するのではなく、適合モデルでデータが推定された平均と分散を決定できるようになります。この2番目のパラメーターを使用すると、モデル内の1つの自由度のみが失われます。これは、データから分散を推定できる利点と比較すると、わずかな損失です。もちろん、この推論を拡張して、歪度の適合を可能にする3番目のパラメーター、尖度の適合を可能にする4番目のパラメーターなどを追加できます。

いくつかの非常に小さな例外はありますが、ポアソンGLMは悪いモデルです。私の経験では、ポアソン分布をフィッティングしてデータをカウントすることは、ほとんど常に悪い考えです。カウントデータの場合、データの分散がポアソン分布に対して「過度に分散」することは非常に一般的です。理論がポアソン分布を指している場合でも、多くの場合、最良のモデルはポアソン分布の混合であり、分散が自由パラメーターになります。実際、カウントデータの場合、負の二項分布は、速度パラメーターのガンマ分布をもつポアソン混合です。、したがって、ポアソン分布のプロセスに従ってカウントが到着すると考える理論的な理由がある場合でも、「過剰分散」があり、負の二項分布がはるかによく適合する場合がよくあります。

データをカウントするためにポアソンGLMを適合させてから、「過剰分散」をチェックするための統計的テストを行う慣行は時代錯誤であり、良い慣行となることはほとんどありません。統計分析の他の形式では、2パラメーター分布から始めず、分散制限を任意に選択してから、この制限をテストして分布からパラメーターを削除しようとします。このように物事を行うことにより、モデル選択に使用される最初の仮説検定と実際のモデル（ポアソンまたはより広い分布）で構成される、厄介なハイブリッド手順を実際に作成します。初期のモデル選択テストからハイブリッドモデルを作成するこの種のプラクティスは、全体的なモデルの品質を低下させることが多くのコンテキストで示されています。

類似のハイブリッド手法が使用されている類似の状況は、平均差のT検定にあります。以前は、統計コースで最初にLeveneのテスト（または、かなり単純な「経験則」）を使用して2つの母集団間の分散が等しいかどうかをチェックし、データがこのテストに「合格」した場合、等分散を想定したスチューデントT検定を使用し、データが検定に「失敗」した場合は、代わりにウェルチのT検定を使用します。これは実際には本当に悪い手順です（たとえば、こことここを参照してください）。予備の仮説検定を組み合わせてモデルを選択するための厄介な複合検定を作成するよりも、分散を仮定しない後者の検定を使用する方がはるかに優れています。

カウントデータの場合、通常、負の二項モデルまたは準ポアソンモデルなどの2パラメーターモデルを近似することにより、良好な初期結果が得られます。（後者は実際の分布ではないことに注意してください。しかし、それでも合理的な2パラメーターモデルを提供します。）さらに一般化が必要な場合は、通常、ゼロインフレの追加であり、過剰な数のゼロがあります。データ内。ポアソンGLMに制限することは、人為的で無意味なモデル選択であり、過剰分散のテストではそれほど改善されません。

さて、ここに小さな例外があります：上記に対する唯一の本当の例外は2つの状況です：

（1）1つのパラメーター分布の仮定が満たされていると信じる先験的な理論的理由が非常に強く、分析の一部はデータに対してこの理論モデルをテストすることです。または

（2）何らかの他の（奇妙な）理由で、分析の目的はデータの分散について仮説検定を行うことなので、この分散をこの仮説の制限に実際に制限してから、この仮説を検定します。

これらの状況は非常にまれです。これらは、データ生成メカニズムに関する先験的な理論的知識がある場合にのみ発生する傾向があり、分析の目的はこの基礎となる理論をテストすることです。これは、厳密に制御された条件下（物理学など）でデータが生成される非常に限られた範囲のアプリケーションの場合です。

— モニカを復活させる
ソース

GLMの分散テストは実際に*有用*ですか？

GLMの分散テストは実際に有用ですか？