R in Action(Kabacoff、2011年)は、ロジスティック回帰の過分散をテストするために次のルーチンを提案しています。
二項分布を使用してロジスティック回帰を近似します。
model_binom <- glm(Species=="versicolor" ~ Sepal.Width,
family=binomial(), data=iris)
準二項分布を使用してロジスティック回帰を近似します。
model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width,
family=quasibinomial(), data=iris)
カイ二乗を使用して、過剰分散をテストします。
pchisq(summary(model_overdispersed)$dispersion * model_binom$df.residual,
model_binom$df.residual, lower = F)
# [1] 0.7949171
カイ二乗分布がここで過剰分散のテストに使用されている方法と理由を誰かが説明できますか?p値は0.79です。これは、過剰分散が二項分布モデルの問題ではないことをどのように示しますか?
2
観測値を相関させない限り、ベルヌーイ分布に適合しないのはかなり困難です。フィットが不十分だと思われる場合はどうでしょうか?
—
フランクハレル2014年
相関関係のある観察とは、各ベルヌーイ試験が独立していないということですか?
—
ルチアーノ2014年
はい、例えば、シリアルまたはクラスター内相関。非独立した試験。
—
フランクハレル