RおよびAICでのdrop1コマンドの使用


7

モデル構築のためにRでdrop1コマンドを使用している間、AIC値が最も低い変数をドロップする必要があると言われています。同じ理由は何でしょうか?AICは情報の損失について話しているので、AIC値は低い方が良いことはわかっていますが、AICが低い変数を削除するのは直観に反するようです。誰かがそうする理由を説明できますか?


回答:


8

からの指定されたAICはdrop1、変数ではなくモデル全体に​​関連するため、出力は、AICが最も低いモデルを生成するために削除する変数を示します。たとえば、組み込みのデータセットswiss

lm1 <- lm(Fertility ~ ., data = swiss)
drop1(lm1, test = "F")  # So called 'type II' anova

Single term deletions

Model:
Fertility ~ Agriculture + Examination + Education + Catholic + 
    Infant.Mortality
                 Df Sum of Sq    RSS    AIC F value    Pr(>F)    
<none>                        2105.0 190.69                      
Agriculture       1    307.72 2412.8 195.10  5.9934  0.018727 *  
Examination       1     53.03 2158.1 189.86  1.0328  0.315462    
Education         1   1162.56 3267.6 209.36 22.6432 2.431e-05 ***
Catholic          1    447.71 2552.8 197.75  8.7200  0.005190 ** 
Infant.Mortality  1    408.75 2513.8 197.03  7.9612  0.007336 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

ここで、を削除Examinationすると、AICが最も低いモデルが生成されます

:それはp値よりもAICを使用する方が良いかもしれないが、関連ノートで、任意の自動モデル選択アルゴリズムを使用して悪い習慣と考えられている 自動モデル選択のためのアルゴリズムを


1
実際、一度に1つの変数を表示している場合、AICを使用することは、p値のカットオフを15.7%に設定することに相当します
Glen_b -Reinstate Monica

@Glen_bおもしろい!カイ二乗分布の裾に基づく漸近的な結果だと思いますか?次に、大きなサンプルの場合、p値とAICの使用は同じように悪いです!?
ロバートロング

1
はい、漸近的なカイ2乗の結果(Rを使用する場合はpchisq(2,1,lower.tail=FALSE))。これは両側z検定のp値(pnorm(sqrt(2),lower.tail=FALSE)*2)に対応するため、dfがかなり小さい場合を除いて、t検定またはF検定のp値のカットオフ(40 dfを超えると、16% dfの最も近い整数パーセントに)
Glen_b-モニカを2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.