私は現在、すべてが次の指標を使用する一連の行動実験からのデータを分析しています。この実験の参加者は、一連の10個のアナグラムを解決するのに(架空の)他の人が使用できる手がかりを選択するように求められます。参加者は、アナグラムを解く際のパフォーマンスに応じて、これらの他の人々がお金を稼ぐか失うかを信じるように導かれます。手がかりは、それらがどれほど役立つかによって異なります。たとえば、RUNNINGのアナグラムであるアナグラムNUNGRINの場合、3つの手がかりがあります。
- 素早く動く(役に立たない)
- マラソンレースで行うこと(参考)
- 必ずしも健康的な趣味ではない(役に立たない)
メジャーを形成するために、参加者が他の人にとって役に立たない手がかりを選択した回数(10回のうち)をカウントします。実験では、さまざまな異なる操作を使用して、人々が選択する手がかりの有用性に影響を与えています。
有用性/有用性の尺度はかなり強く正に歪んでいるため(多くの人が常に最も有用な10の手がかりを選択します)、またこの尺度はカウント変数であるため、これらのデータを分析するためにポアソン一般化線形モデルを使用しています。しかし、ポアソン回帰についてさらに読むと、ポアソン回帰は独立して分布の平均と分散を推定しないため、データセットの分散を過小評価することが多いことを発見しました。準ポアソン回帰や負の二項回帰など、ポアソン回帰の代替案を調査し始めました。しかし、私はこの種のモデルにはかなり慣れていないので、アドバイスを求めてここに来ています。
この種のデータに使用するモデルに関する推奨事項はありますか?私が知っておくべき他の考慮事項はありますか(たとえば、ある特定のモデルは他のモデルよりも強力ですか?)選択したモデルがデータを適切に処理しているかどうかを判断するには、どのような診断を検討する必要がありますか?