2つのモデルの比較にanovaを使用する方法


9

anova2つのモデルを比較するときの結果をどのように理解すればよいですか?

例:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

マンページには、「1つまたは複数の適合モデルオブジェクトの分散(または逸脱)の計算分析テーブル」と記載されています。しかし、外の教授はそれがモデルの比較に使用されるかもしれないと述べました-それは私がやろうとしていることです。

したがって、私はanova(model1, model2)、帰無仮説「モデルは同じ」を棄却する必要があるかどうかを示すp値を使用して取得できると想定します。

p値が(たとえば、)0.05未満の場合、モデルが大幅に異なると述べてもよいですか?


あなたの例では、model1とmodel2はネストされていますか?つまり、両方のモデルに予測変数の共有セットと同じ結果変数がありますが、1つのモデルに1つ以上の追加の予測変数がありますか?
EdM、

1つは同様Y ~ X + X^2、2つ目はY ~ X + X^2 + X^3
ペトルベル、

回答:


13

モデルがネストされている(つまり、同じ結果変数であり、モデル2にモデル1のすべての変数と2つの追加変数が含まれる)と仮定すると、ANOVA結果は、2つの追加変数が共同で十分な分散を説明し、両方の変数の係数は0です。これは事実上あなたが言ったことです。両方の係数が0の場合、モデルは同じです。

Model1:y=a+bx1+cx2+dx3;Model2:y=a+bx1+cx2x3car::Anovaanova


私があなたを正しく理解していれば、0.05未満のp値はモデルが異なることを証明しますか?
petrbel

3
私はそれらの単語を使用しません(つまり、「証明する」と「モデルは異なります」)が、同じことを意味します。私はあなたのデータは、係数が0またはデータが係数が両方とも0ではないという対立仮説をサポートしていることの両方であることを帰無仮説をサポートしていないと言うでしょう
le_andrew

1
モデルが異なることが証明されている、または帰無仮説がサポートされていないと主張する前に、データがp値の計算および解釈の根底にある分散分析仮定を合理的に満たしていることを確認してください。
EdM、

念のため、タイプIの二乗和の最後の部分anova()は、1つのモデルでが使用されている状況にのみ適用されますか?
Jasper、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.