ロジスティック回帰における過剰分散のテスト


8

R in Action(Kabacoff、2011年)は、ロジスティック回帰の過分散をテストするために次のルーチンを提案しています。

二項分布を使用してロジスティック回帰を近似します。

model_binom <- glm(Species=="versicolor" ~ Sepal.Width,
                   family=binomial(), data=iris)

準二項分布を使用してロジスティック回帰を近似します。

model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width, 
                           family=quasibinomial(), data=iris)

カイ二乗を使用して、過剰分散をテストします。

pchisq(summary(model_overdispersed)$dispersion * model_binom$df.residual, 
       model_binom$df.residual, lower = F)
# [1] 0.7949171

カイ二乗分布がここで過剰分散のテストに使用されている方法と理由を誰かが説明できますか?p値は0.79です。これは、過剰分散が二項分布モデルの問題ではないことをどのように示しますか?


2
観測値を相関させない限り、ベルヌーイ分布に適合しないのはかなり困難です。フィットが不十分だと思われる場合はどうでしょうか?
フランクハレル2014年

相関関係のある観察とは、各ベルヌーイ試験が独立していないということですか?
ルチアーノ2014年

1
はい、例えば、シリアルまたはクラスター内相関。非独立した試験。
フランクハレル

回答:


4

説明されているアプローチは、不必要な計算を必要とします。検定統計量は

sum(residuals(model_binom, type = "deviance")^2)

χ2

χ2


4
上記の答えを次のように変更する必要はありませんか?sum(residuals(model_binom, type = "deviance")^2)/model_binom$df.residual
Steve VW
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.