切片が含まれる場合、線形回帰の残差が常にゼロになるのはなぜですか?


14

私は回帰モデルのコースを取っていますが、線形回帰に提供されるプロパティの1つは、切片が含まれるときに残差が常にゼロになることです。

なぜそうなのか、誰かが良い説明を提供できますか?


3
あなたは最初の熟考に単変量サンプルでは、それぞれの値からサンプルの平均を減算することにより、あなたが得る残差も0に合計理由の密接に関連するが単純な質問(。あなたができる場合によって代数を、次の試してみてください)好きかもしれない
Glen_bを-モニカの復元

3
「合計がゼロ」が「説明変数の1つに直交する」ことを認識するとすぐに、答えは幾何学的に明白になります。
whuber

回答:


18

これは、正規方程式、つまりOLS推定器が解く方程式から直接得られます。

X(yXb)e=0

括弧内のベクトルは、もちろん、残差ベクトル、または線形代数が好きならXの列空間の直交補数へのの投影です。X行列に1のベクトルを含めると、従来のように最初の列にある必要はありませんが、yXX

1e=0i=1nei=0

2変数問題では、これは見やすくなります。2乗残差の合計を最小化すると、

=1nyabバツ=0

切片に関する微分を取るとき。これから、おなじみの推定量を取得します

a=y¯bバツ¯

ここでも、推定量の構成がこの条件を課していることがわかります。


16

かなり直感的な説明を探している場合。

ある意味では、線形回帰モデルは単なる平均にすぎません。算術平均を見つけるにはバツ¯いくつかの値に対してバツ1バツ2バツn、我々が意味で中心性の尺度である値を見つけ、その各偏差として定義されている全ての偏差(の和ui=xix¯)平均値の右側は、その平均の左側にあるすべての偏差の合計に等しくなります。サンプルの平均を説明する最良の方法は言うまでもなく、この測定が優れているという固有の理由はありませんが、それは確かに直感的で実用的です。重要な点は、このように算術平均を定義することにより、算術平均を作成したら、その平均からのすべての偏差は定義によりゼロになる必要があるということです!

線形回帰では、これに違いはありません。私たちは(回帰直線上にある)当てはめ値とされている実際の値との間のすべての差の合計ようなラインにフィットより上のラインが正確に回帰直線と全ての値の間のすべての差の合計に等しく、下記ライン。繰り返しますが、これがフィットを構築するための最良の方法である固有の理由はありませんが、それは簡単で直感的に魅力的です。算術平均の場合と同様に、この方法で近似値を構築することにより、必然的に、その行からのすべての偏差がゼロになる必要があります。そうでなければ、これはOLS回帰ではありません。


2
+1を使用して、単純明快で直感的な答えを得ることができます

2

切片は、多重線形回帰

y^i=β0+β1xi,1+β2xi,2++βpxi,p
に含まれている場合 、Y iは = β 0 + β 1 X I 1 + β 2 X I 2 + ... + β P X I P 最小二乗回帰での二乗和エラーは最小限に抑えられます。
SSE=i=1n(ei)2=i=1n(yiyi^)2=i=1n(yiβ0β1xi,1β2xi,2βpxi,p)2
偏微分を取りますβ0に関してSSEの値を0に設定します。
SSEβ0=i=1n2(yiβ0β1xi,1β2xi,2βpxi,p)1(1)=2i=1nei=0
したがって、切片が線形回帰に含まれる場合、残差は常にゼロになります。


1

1バツ

1=バツe
e1Tyy^

したがって、

1Tyy^=1THy=eTバツTバツバツTバツ1バツTy=eTバツTバツTバツバツTバツ1バツTy=eTバツTバツTy=0。


0

行列代数を使用した簡単な導出:

e として書くことができます 1Te

それから

1Te=1TMバツy どこ Mバツは直交行列です。以来Mバツ 対称であるため、再配置できるため、 Mバツ1Ty

ゼロに等しい場合 Mバツ そして 1 直交である。これは、リグレッサの行列が バツ contains the intercept (a vector of 1, indeed).


I don't think this is right.
Michael R. Chernick

If you explain why then I will be happy to learn something
Mino

0
  1. ei=yi[1,X][a,b]=yiXba=via
  2. ddaei2ei1=via=0 so a^=1nvi
  3. ei=ivia=ivinnivi=0

..

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.