説明変数を追加すると、二乗残差の合計が増加しないのはなぜですか?


9

筆者は、OLSを取り上げた私の計量経済学のテキスト(Introductory Econometrics)で、「別の説明変数が追加されたときにSSRが下がる必要がある」と書いています。それはなぜです?


1
本質的に、次の変数との線形関係が何もない場合(0サンプル部分相関)、SSRは同じままになるためです。何らかの関係がある場合は、次の変数を使用してSSRを削減できます。
Glen_b-2015

3
ステートメントは精神的には正しいですが、真実ではありません。SSRは、既存の変数の線形結合である変数を追加しても、同じままです(落ちません)。結局のところ、新しい変数を無視することで、古い変数で達成したのと同じSSRの最小値を達成できるため、新しい変数を追加しても事態が悪化することはありません。
whuber

私はここで同様の質問に答えました:stats.stackexchange.com/questions/306267/…。あなたはそれが役に立つかもしれません。
Josh、

回答:


18

線形回帰モデルがあると仮定して、表記を簡単にするために、最初に1つ、次に2つの共変数を検討します。これは、2組の共変数に一般化されます。最初のモデルは 、2番目のモデルは これは、残差の二乗和を最小化することで解決されます。モデル1ではを最小化 し、モデル2では最小化し 。モデル1の正しい推定量を見つけたとしましょう。次に、同じ値を選択することで、モデル2でまったく同じ残差平方和を取得できます。

I:yi=β0+β1x1i+ϵi
II:yi=β0+β1x1i+β2x2i+ϵi
SSR1=i(yiβ0β1x1i)2SSR2=i(yiβ0β1x1iβ2x2i)2β0,β1および。より適切な値を検索することで、より低い和の二乗残差を見つけることができます。β2=0β2

要約すると、モデルは入れ子になっています。つまり、モデル1でモデル化できるすべてのものがモデル2で一致できるという意味で、モデル2はモデル1よりも一般的です。常により良い解決策を見つけてください。

これは実際には統計とは関係ありませんが、最適化に関する一般的な事実です。


1
このように考えたことがない、本当に役に立ちました!
Eric Xu

1

SSRは、データと推定モデルの間の不一致の尺度です。

別の変数を考慮に入れるオプションがある場合、この変数にさらに多くの情報が含まれていると、フィットは自然に厳しくなります。つまり、SSRが低くなります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.