ポアソン回帰の仮定とそれらをRでテストする方法


11

どの回帰が私のデータに最適であるかをテストしたいと思います。私の従属変数はカウントであり、ゼロがたくさんあります。

また、使用するモデルとファミリ(ポアソンまたは準ポアソン、またはゼロ膨張ポアソン回帰)と、仮定をテストする方法を決定するためにいくつかの助けが必要になります。

  1. ポアソン回帰:私が理解している限り、強い仮定は、従属変数の平均=分散であるというものです。これをどのようにテストしますか?彼らはどのくらい近くにいる必要がありますか?これには無条件または条件付きの平均と分散が使用されますか?この仮定が当てはまらない場合はどうすればよいですか?
  2. 分散が平均よりも大きい場合、分散が過剰であり、これに対処するための潜在的な方法は、より多くの独立変数、またはfamily = quasipoissonを含めることです。この分布には他の要件や前提条件がありますか?(1)と(2)のどちらがより適しているかを確認するには、どのテストを使用しますかanova(m1,m2)
  3. また、過剰分散が発生した場合、負の二項分布を使用できることも読みました。Rでこれを行うにはどうすればよいですか?quasipoissonとの違いは何ですか?
  4. ゼロ膨張ポアソン回帰:vuongテストを使用して、どのモデルがより適切に適合するかを確認したことを読みました。

    > vuong (model.poisson, model.zero.poisson)

    あれは正しいですか?インフレがゼロの回帰にはどのような仮定がありますか?

  5. UCLAのAcademic Technology Services、Statistical Consulting Groupには、ゼロインフレーションポアソン回帰に関するセクションがあり、標準ポアソンモデル(b)に対してゼロインフレーションモデル(a)をテストします。

    > m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
    > m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
    > vuong(m.a, m.b)

| persons最初のモデルの部分が何をするのか、なぜこれらのモデルを比較できるのか理解できません。回帰は同じであり、別のファミリーを使用することを期待していました。

回答:


8

X¯S2F(1,n1)n

このテストは共変量を無視することに注意してください。そのような状況で過剰分散をチェックするためのおそらく最良の方法ではありません。

また、このテストはおそらくゼロインフレ仮説に対して弱いことにも注意してください。

3)Rの負の2項式:パッケージglm.nbからMASS使用するか、負の2項式リンクを使用zeroinflしてpsclパッケージから関数を使用します。

4)zip(ゼロ膨張ポアソン)は混合モデルです。サブジェクトがグループA(0が確実)またはグループB(カウントがポアソン分布または負の2項分布)に属しているという、バイナリの結果があります。観察された0は、たまたま幸運だったグループAの被験者+グループBの被験者によるものです。モデルの両方の側面は共変量に依存する可能性があります。グループメンバーシップはロジスティックのようにモデル化され(対数オッズは共変量で線形)、ポアソン部分は通常の方法でモデル化されます。対数平均は共変量で線形です。したがって、ロジスティックの通常の仮定(特定の0部分)とポアソンの通常の仮定が必要です。言い換えれば、zipモデルは過剰分散の問題を解決しません-ゼロの大きな塊を解決するだけです。

5)データセットが何であるかわからず、参照を見つけることができませんでした。zeroinflは、ポアソンパーツとバイナリ(一部0かどうか)パーツの両方のモデルを必要とします。ある0の部分が2番目になります。だからmaは、人が特定の0であるかどうかは「人」に依存すると言っています-そして、主題が特定の0ではないと仮定すると、カウントはキャンピングカーと子供の関数です。つまり、log(mean)は、0カウントを必要としない被験者のキャンピングカーと子の線形関数です。

mbは、キャンピングカーと子に関するカウントの一般的な線形モデルです-両方とも固定効果であると想定されています。リンク関数はポアソンです。


ありがとうございました!簡単な質問:Rでfamily = poissonを使用してglmでNagelkerkeのようにr ^ 2または疑似r ^ 2を生成する方法はありますか?ありがとうございました!
Torvon 2012年

0
  1. ライブラリ(pastecs)

stat.desc(dep_var)-平均と分散が等しいかどうかを確認します。ここから、ベクトルのゼロの%を計算することもできます。


3
サイトへようこそ。これは回答というよりはコメントのようなものです。また、適切なスペルなどを使用することをお勧めします。これはテキストメッセージではなく、このサイトを読む多くの人々は第2または第3または....言語として英語を使用しています。
Peter Flom-モニカの回復

3
このクイック返信の改善に取り組んでください。
12
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.