Rでanova()関数を使用して2つのモデルを比較する


32

次のドキュメントからanova()

オブジェクトのシーケンスが与えられると、「anova」は指定された順序でモデルを互いにテストします...

モデルを互いにテストすることはどういう意味ですか?そして、なぜ順序が重要なのですか?

GenABELチュートリアルの例を次に示します。

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

この出力をどのように解釈しますか?

回答:


31

を使用するanova(lm.1,lm.2,test="Chisq")と、カイ二乗検定を実行して比較lm.1しますlm.2(つまり、残差平方和の減少が統計的に有意であるかどうかを検定します)。これは、lm.1およびlm.2がネストされたモデルである場合にのみ意味があることに注意してください。

α=0.05α=0.1

線形モデル近似のANOVAも確認してください。


1
しかし、それは2つのうちのどちらが優れているかどうかについて何かを暗示していますか?ありがとう!
qed

5
「より良い」という用語の定義に依存します。残差平方和が少ないモデルとして定義する場合、答えはイエスです。これは、このテストが残差平方和の減少を比較するためです。
2013年

3
一方、2つのモデルに大きな違いがない場合、より単純なモデルの方が「優れている」と主張できますか?ここでパーシモニーについて考えています。
シニーニョ

1
anova(mod1、mod2、test = "LRT")の場合、これはどのような違いがありますか?
-ElleryL
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.