nullとモデル偏差を使用してGLMモデルをテストする


11

私はRでglmモデルを構築し、テストおよびトレーニンググループを使用してテストしたので、うまく機能すると確信しています。Rの結果は次のとおりです。

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

係数のすべてのp値は期待どおりに小さくなっています。

この質問(GLM Rの残差とヌル逸脱の解釈)を見ると、次の方程式を使用して、帰無仮説が成立するかどうかを計算できるはずです。

p-value = 1 - pchisq(deviance, degrees of freedom)

これを貼り付けると次のようになります。

1 - pchisq(256600, 671266)
[1] 1

それで、すべての係数のp値が非常に小さいか、これを計算する方法を誤って解釈したとしても、ここでは帰無仮説を棄却できないと私は考えていますか?

回答:


18

ここには誤解があります。ヌル偏差とモデルの偏差のは、自由度がヌルdf からモデルのdfを引いた値に等しいカイ2乗として分布します。あなたのモデルでは、それは:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

デフォルトでpchisq()は、値の左側に分布の比率を与えます。差よりも極端な比率を得るにはlower.tail = FALSE、結果をから指定または減算できます(あなたと私が行ったように)。 1


2
ステートメントで正確にどの仮説をテストしてい1-pchisq(256600 - 237230, df=(671266 - 671263))ますか?
jII 2015

5
@jesterII、あなたは、逸脱が偶然に予想されるよりも大きく変化したかどうかをチェックしています。つまり、モデル全体がnullモデルよりも優れているかどうかをテストしています。これは、線形モデルのグローバルF検定に似ています。
ガン-モニカの復活

帰無仮説は「モデル全体が帰無モデルよりも優れている」であり、帰無仮説を棄却しました。つまり、モデルは貧弱です。
jII 2015

3
@ jesterII、null仮説はありません:「モデル全体はnullモデルより優れていません 」。これは拒否されたため、データはnullモデルと一致していません。注意、これは必ずしも私たちのモデルが「良い」または「正しい」ことを意味するわけではありません。
ガン-モニカの復活
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.