どの回帰が私のデータに最適であるかをテストしたいと思います。私の従属変数はカウントであり、ゼロがたくさんあります。
また、使用するモデルとファミリ(ポアソンまたは準ポアソン、またはゼロ膨張ポアソン回帰)と、仮定をテストする方法を決定するためにいくつかの助けが必要になります。
- ポアソン回帰:私が理解している限り、強い仮定は、従属変数の平均=分散であるというものです。これをどのようにテストしますか?彼らはどのくらい近くにいる必要がありますか?これには無条件または条件付きの平均と分散が使用されますか?この仮定が当てはまらない場合はどうすればよいですか?
- 分散が平均よりも大きい場合、分散が過剰であり、これに対処するための潜在的な方法は、より多くの独立変数、またはfamily = quasipoissonを含めることです。この分布には他の要件や前提条件がありますか?(1)と(2)のどちらがより適しているかを確認するには、どのテストを使用しますか
anova(m1,m2)
? - また、過剰分散が発生した場合、負の二項分布を使用できることも読みました。Rでこれを行うにはどうすればよいですか?quasipoissonとの違いは何ですか?
ゼロ膨張ポアソン回帰:vuongテストを使用して、どのモデルがより適切に適合するかを確認したことを読みました。
> vuong (model.poisson, model.zero.poisson)
あれは正しいですか?インフレがゼロの回帰にはどのような仮定がありますか?
UCLAのAcademic Technology Services、Statistical Consulting Groupには、ゼロインフレーションポアソン回帰に関するセクションがあり、標準ポアソンモデル(b)に対してゼロインフレーションモデル(a)をテストします。
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
| persons
最初のモデルの部分が何をするのか、なぜこれらのモデルを比較できるのか理解できません。回帰は同じであり、別のファミリーを使用することを期待していました。