過剰分散カウントデータのポアソン回帰の代替方法の選択


12

私は現在、すべてが次の指標を使用する一連の行動実験からのデータを分析しています。この実験の参加者は、一連の10個のアナグラムを解決するのに(架空の)他の人が使用できる手がかりを選択するように求められます。参加者は、アナグラムを解く際のパフォーマンスに応じて、これらの他の人々がお金を稼ぐか失うかを信じるように導かれます。手がかりは、それらがどれほど役立つかによって異なります。たとえば、RUNNINGのアナグラムであるアナグラムNUNGRINの場合、3つの手がかりがあります。

  1. 素早く動く(役に立たない)
  2. マラソンレースで行うこと(参考)
  3. 必ずしも健康的な趣味ではない(役に立たない)

メジャーを形成するために、参加者が他の人にとって役に立たない手がかりを選択した回数(10回のうち)をカウントします。実験では、さまざまな異なる操作を使用して、人々が選択する手がかりの有用性に影響を与えています。

有用性/有用性の尺度はかなり強く正に歪んでいるため(多くの人が常に最も有用な10の手がかりを選択します)、またこの尺度はカウント変数であるため、これらのデータを分析するためにポアソン一般化線形モデルを使用しています。しかし、ポアソン回帰についてさらに読むと、ポアソン回帰は独立して分布の平均と分散を推定しないため、データセットの分散を過小評価することが多いことを発見しました。準ポアソン回帰や負の二項回帰など、ポアソン回帰の代替案を調査し始めました。しかし、私はこの種のモデルにはかなり慣れていないので、アドバイスを求めてここに来ています。

この種のデータに使用するモデルに関する推奨事項はありますか?私が知っておくべき他の考慮事項はありますか(たとえば、ある特定のモデルは他のモデルよりも強力ですか?)選択したモデルがデータを適切に処理しているかどうかを判断するには、どのような診断を検討する必要がありますか?


分散が平均に等しいという仮定を緩和するためのロバストな分散/共分散推定量はどうでしょうか?
-boscovich

2
それらはカウントデータであり、非負であるため、分散を説明する準ポアソンモデルまたは負の二項回帰モデルはどうですか?
アルン

1
準ポアソンモデルまたは負の二項モデルを使用することを考えましたが、理解できないのは、データを適切にモデリングしていることを確認するためにどのようなダイアゴニズムを検討するかです。いくつかの選択肢(準ポアソン、負の二項モデル、および「ゼロ拡張」モデル)があるため、これらの選択肢を選択する良い方法があるかどうかも疑問に思っています。たとえば、あるメソッドは一般的に他のメソッドよりも強力ですか?
パトリックS.フォーシャー

1
それはデータに依存します。それらすべてをデータ(ポアソン、負の二項、ゼロ膨張ポアソン、負の二項、問題のある人のハードルモデル)に当てはめて、AICやBICなどで比較してみませんか?cran.r-project.org/web/packages/pscl/vignettes/countreg.pdfを参照してください次に、データに最適なものを選択してください。準尤度モデルを使用することもできますが、それは好みの問題であり、あまり好きではありません。
モモ

1
どの分布が応答に適したモデルであるかを確認するには、vcd :: distplot関数を使用できます。
モモ

回答:


12

結果は、10の内の有用な手がかりの数であり、これは二項確率変数です。したがって、過剰分散を可能にするために、おそらく準二項式のような二項回帰で分析する必要があります。ポアソンおよび誤解を招く名前の負の二項分布は、無制限のカウントデータに適していることに注意してください。


2
負の二項式は、ポサーが最初に提案したポアソンの過剰分散の選択肢であるため、言及しました。各回答者にはx / 10の手がかりがあるため、2項式になる可能性がありますが、10個の手がかりごとにi番目の回答者の固定確率piがあり、出現は独立しています。それはそうでないかもしれません。
マイケルR.チャーニック

2
ベータ二項は別の可能性です(ベータ二項は負の二項分布がポアソンに対するものであるため、二項分布に対するものです)。 betabinaod、パッケージそれを行います。
ベンボルカー

5

可能な結果がポアソンのように無限である場合、私も負の二項式を見ることをお勧めします。Joe Hilbeの本の1つを参照してください。彼はGEEに1つ、負の二項回帰に1つを持ち、ポアソン回帰とは対照的です。しかし、Anikoが指摘したように、各回答者が持つことができる手がかりは10個しかないため、ポアソンも負の指数関数も適切ではありません。


4

@Anikoの良い点。別の選択肢はベータ回帰です。「A Better Lemon Squeezer」というタイトルの論文があり、この方法に関する多くの情報を提供しました。


2
ただし、ベータは、整数の有限セットのカウント変数ではなく、割合のモデル化に使用されます。
マイケルR.チャーニック

@MichaelChernickの幅広い用途があります。記事をご覧ください。
ピーターフロム-モニカの復職

@PeterFlomまた、間隔[0,1]のデータは処理できず、(0,1)のみです。
コロン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.