ポアソンモデルと準ポアソンモデルで推定された同一の係数


12

保険環境で請求件数データをモデル化する際に、私はポアソンから始めましたが、その後、過剰分散に気付きました。準ポアソンは、基本的なポアソンよりも大きい平均分散関係をよりよくモデル化しましたが、係数はポアソンモデルと準ポアソンモデルの両方で同一であることに気付きました。

これがエラーでない場合、なぜこれが起こっているのですか?ポアソンよりも準ポアソンを使用する利点は何ですか?

注意事項:

  • 根本的な損失は過剰ベースであり、それが(私は)Tweedieの動作を妨げました-しかし、それは私が試した最初の分布でした。また、NB、ZIP、ZINB、およびハードルモデルを調べましたが、それでもQuasi-Poissonが最適であることがわかりました。
  • AERパッケージのdispersiontestを使用して過分散をテストしました。私の分散パラメーターは約8.4で、p値は10 ^ -16の大きさでした。
  • family = poissonまたはquasipoissonでglm()を使用し、コードのログリンクを使用しています。
  • ポアソンコードを実行すると、「In dpois(y、mu、log = TRUE):non-integer x = ...」という警告が表示されます。

Benのガイダンスによる有用なSEスレッド:

  1. ポアソン回帰におけるオフセットの基本的な数学
  2. 係数のオフセットの影響
  3. 共変量としての露出とオフセットの使用の違い

Tweedieディストリビューションはより良いアイデアではないでしょうか?
-duffymo

最初からTweedieを試してみましたが、損失データはゼロからではなく、過剰に基づいています。カウントの分散に対処するために、負の二項モデル、ZIP、およびハードルモデルも試しました。
フランクH.

1
データの非整数値がどこから来たのかについてもう少し説明できますか?
ベンボルカー

6
の比率を計算して頻度/レートをモデル化しないでくださいcounts/exposure。むしろ、offset(log(exposure))モデルにオフセット()項を追加する必要があります。
ベンボルカー

1
これは実用的ですが、ポアソン(準ポアソンではない)モデリングを行うときに最も重要です。すぐに参照できる良いものは知りません。CrossValidatedで関連する回答がここに見つからない場合は、フォローアップの質問になります。
ベンボルカー

回答:


25

これはほとんど重複しています。リンクされた質問は、係数の推定値、残差、または自由度が変化することを期待すべきではないことを説明しています。ポアソンから準ポアソンに移動するときに変化する唯一のことは、以前に1に固定されたスケールパラメーターが、残留変動性/適合度の推定値から計算されることです(通常、ピアソン残差の二乗和によって推定されます) (χ2)残差dfで漸近的に使用しても同じ結果が得られますが、残差dfで除算されます。その結果、標準誤差は、このスケールパラメーターの平方根でスケーリングされ、信頼区間とp値。

準尤度の利点は、データがポアソン(=同種の独立したカウント)であると仮定することの基本的な誤りを修正することです。ただし、この方法で問題を修正すると、データに関する他の問題が隠される可能性があります。(以下を参照してください。)準尤度は、過剰分散を処理する1つの方法です。何らかの方法で過剰分散に対処しない場合、係数は妥当ですが、推論(CI、p値など)はゴミになります。

  • 上でコメントしたように、過剰分散にはさまざまなアプローチがあります(Tweedie、さまざまな負の二項パラメーター化、準尤度、ゼロインフレ/変化)。
  • 過分散係数が5(8.4)を超えると、何らかのモデルの不適合(外れ値、ゼロインフレ[これまでに試したことがある]、非線形性)によって駆動されているかどうか少し心配になる全面的な不均一性を表すよりも。これに対する私の一般的なアプローチは、生データと回帰診断のグラフィカルな調査です...

非常に役立ちます。ポアソンの変数と変数のレベルのp値は、あなたが言及したスケーリングのために、準ポアソンの場合よりも統計的に有意であることがわかりました。外れ値をテストしましたが、これが問題になることはありませんでした。過剰分散によって隠されている他の問題、またはこれらの問題を見つけるためのそのようなアプローチの例は何ですか?
フランクH.

ほとんどの場合、リンク(ログ)スケールでの応答の非線形性。残差対適合プロットと残差対予測変数プロットをチェックして、パターンがあるかどうかを確認します。
ベンボルカー

1
+1素敵なレイアウト!あなたの最初の段落の明快さに本当に感謝しています。
アレクシス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.