分散データが不十分な場合の適切なモデルは何ですか?


24

は、明らかに分散が不十分なRのカウントデータをモデル化しようとしています(分散パラメーター〜.40)。これがおそらくglmwith family = poissonまたは負の二項(glm.nb)モデルが重要でない理由です。データの説明を見ると、カウントデータの典型的なスキューはなく、2つの実験条件の残差も均一です。

だから私の質問は:

  1. カウントデータが実際にカウントデータのように動作しない場合、カウントデータに特別な回帰分析を使用する必要さえありますか?私は時々非正規性に直面します(通常は尖度が原因です)が、非正規性を説明するためにトリム平均を比較するためにパーセンタイルブートストラップ法(Wilcox、2012)を使用しました。カウントデータのメソッドは、Wilcoxによって提案され、WRSパッケージで実現されている堅牢なメソッドに置き換えることができますか?

  2. カウントデータに回帰分析を使用する必要がある場合、分散不足をどのように説明しますか?ポアソン分布と負の二項分布はより高い分散を前提としているため、適切ではないでしょうか?準ポアソン分布を適用することを考えていましたが、通常は過剰分散に推奨されます。私は、Rのパッケージで過分散過小分散を説明できると思われるベータ二項モデルについて読みましたVGAM。しかし、著者は、ティルドポアソン分布を推奨しているようですが、パッケージには見つかりません。 。

誰でもデータが分散していない場合の手順を推奨できますか?また、おそらくそのためのサンプルRコードを提供できますか?


1
データが分散されていないことをどのように確認しますか?分散パラメーターはどのように計算していますか?
香港大井

1
線形予測点の推定と値の予測では、低分散が問題になることはめったにありませんが、テストと間隔が不必要に保守的である場合があります(準ファミリがそれを支援します)。ただし、「通常の」尤度アプローチについては、COMポアソンモデルおよびその他の一般化されたポアソンモデルを確認してください。
モモ

@ Hung Ooi:dispersiontest(Poissonmodel、alternative = c( "less"))で分散をテストしましたが、テストは重要でした。
シル

1
@ Momo:2つの実験条件でネゴシエートするダイアドが正しいオファーで異なるかどうかをテストします。正しい申し出は、ダイアッドがチームのそれぞれの利益に対応するより多くの問題を主張することを意味します。他の当事者にとってより価値のある問題を主張します。まず、これがカウントデータであることを認識していませんでした。COMポアソンによるConway-Maxwell-Poisson分布を意味しますか?すでにどうもありがとう!
シル

3
追加情報をありがとう。はい、私はconway-maxwellポアソンを意味しました。Shmueli&coは、そのための一種の一般化線形モデルを開発しました。試してみたい場合は、Rパッケージもあります。
モモ

回答:


9

分散が不十分なポアソンデータを処理するための最良の標準的な方法は、一般化されたポアソンモデルまたはハードルモデルを使用することです。3つのパラメーターカウントモデルは、分散不足のデータにも使用できます。たとえば、Faddy-Smith、Waring、Famoye、Conway-Maxwell、およびその他の一般化されたカウントモデル。これらの唯一の欠点は、解釈可能性です。しかし、一般的な分散不足のデータには、一般化されたポアソンを使用する必要があります。これは、過剰分散データの負の二項式に似ています。これについては、Cambridge University Pressの2冊の本、Modeling Count Data(2014)とNegative Binomial Regression、第2版(2011)で詳しく説明しています。Rでは、VGAMパッケージにより一般化ポアソン(GP)回帰が可能です。分散パラメーターの負の値は、分散不足の調整を示します。GPモデルを使用して、過剰に分散したデータにも使用できますが、ただし、一般的にはNBモデル​​の方が優れています。結局のところ、分散不足の原因を特定し、それに対処するのに最も適切なモデルを選択することが最善です。


お帰りなさい!アカウントを登録および/または統合してください(ヘルプセンターの[アカウント]セクションでこれを行う方法についての情報を参照できます)。その後、自分の質問を編集およびコメントできます。(元のアカウントがあるここに。)
GUNG -復活モニカ

SPSSで一般化ポアソン解析を実行できますか?
グレースキャロル

3

かつて人々がソーシャルゲームをプレイする頻度に関係していた分散型ポアソンに出会いました。これは、金曜日に人々がプレーする極端な規則性によるものであることが判明しました。金曜日のデータを削除すると、予想される過剰分散ポアソンが得られました。おそらく、同様にデータを編集するオプションがあります。


1

男女差のある個人が好む子供の数に典型的な、低分散がゼロインフレと融合する状況があります。これをこれまでにキャプチャする方法が見つかりませんでした

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.