線形回帰:*なぜ*二乗和を分割できるのか?


9

この投稿は、2変量線形回帰モデルます。私は常に、総二乗和(SSTO)を誤差の二乗和(SSE)とモデルの二乗和(SSR)に信頼性をもって分割してきましたが、一度考え始めたら、わかりません。なぜ機能するの ...Yi=β0+β1xi

理解している部分:

yi:yの観測値

y¯:観測されたすべての sの平均yi

y^i:特定の観測値のxに対するyの適合/予測値

yiy^i:残差/エラー(平方され、すべての観測値に対して合計された場合、これはSSEです)

y^iy¯:モデルフィッティングされた値が平均とどの程度異なるか(平方され、すべての観測値に対して合計された場合、これはSSRです)

yiy¯:観測された値が平均とどの程度異なるか(すべての観測で保証され、合計された場合、これはSSTOです)。

何も二乗せずに、単一の観測で理由を理解できます。そして、理由を理解できます。すべての観測値を合計したい場合は、それらを2乗する必要があります。そうしないと、合計が0になります。(yiy¯)=(y^iy¯)+(yiy^i)

理由がわかりません(例:SSTO = SSR + SSE)。あなたが、状況があればということであるように思わは、、ない。なぜそうではないのですか? A = B + C 、A 2 = B 2 + 2 B C + C 2 A 2 = B 2 + C 2(yiy¯)2=(y^iy¯)2+(yiy^i)2A=B+CA2=B2+2BC+C2A2=B2+C2


5
最後の段落で要約を省略しました。SST = SSR + SSEは合計ですが、直前に書いたあなたの等式は、そこに合計記号がないと実際には真ではありません。i
Glen_b-2017

最後の段落では、(たとえば、SSTO = SSR + SSE)が必要ではありません(例:SSTO = SSR + SSE)。「eg」は、ラテン語の「exempli gratia」または「たとえば」のラテン語句の省略形です。"ie"は " id est "の略で、英語で "つまり" と読むことができます。
Matthew Gunn 2017年

回答:


9

あなたが、状況があればということであるように思わは、 、ない。なぜそうではないのですか?A 2 = B 2 + 2 B C + C 2 A 2 = B 2 + C 2A=B+CA2=B2+2BC+C2A2=B2+C2

概念的には、とは直交している(つまり、直交している)ため、であるという考え方です。B CBC=0BC


ここでの線形回帰のコンテキストでは、残差 y_i-は、意地悪な予測 _i-直交してい。線形回帰からの予測は、が直交分解であるため、同様の意味で直交分解を作成します。、Y I - ˉ Y Y3 4 = 3 0 + 0 4 ϵi=yiy^iy^iy¯y(3,4)=(3,0)+(0,4)

線形代数バージョン:

みましょう:

z=[y1y¯y2y¯yny¯]z^=[y^1y¯y^2y¯y^ny¯]ϵ=[y1y^1y2y^2yny^n]=zz^

線形回帰(定数を含む)は、を2つのベクトルの合計に分解します:予測と残差zz^ϵ

z=z^+ϵ

してみましょうは内積を示します。(より一般的には、は内積することができます。).,.X,Y E[XY]

z,z=z^+ϵ,z^+ϵ=z^,z^+2z^,ϵ+ϵ,ϵ=z^,z^+ϵ,ϵ

最後の行は、(つまり、とは直交です)。通常の最小二乗回帰が構築する方法に基づいて、とが直交していることを証明できます。z^,ϵ=0z^ϵ=zz^z^ϵz^

z^である線状突起のによって定義される部分空間への線形スパン説明変数の、など、....残差はその部分空間全体に直交するため、(、などのスパンにある)は直交。zx1x2ϵz^x1x2ϵ


を内積として定義したので、は、単に(つまり、SSTO = SSR + SSE).,.z,z=z^,z^+ϵ,ϵi(yiy¯)2=i(y^iy¯)2+i(yiy^i)2


8

全体のポイントは、特定のベクトルが直交し、ピタゴラスの定理を使用することを示しています。

多変量線形回帰について考えてみましょう。OLS推定量はことはわかっています。今見積もりを検討してくださいY=Xβ+ϵβ^=(XtX)1XtY

Y^=Xβ^=X(XtX)1XtY=HY(H行列は「ハット」行列とも呼ばれます)

ここで、はYのへの正射影行列です。今私たちは持っていますHS(X)

YY^=YHY=(IH)Y

ここで、の直交補への射影行列であり、であり、。したがって、とは直交していることがわかります。(IH)S(X)S(X)YY^Y^

次に、サブモデル考えます。Y=X0β0+ϵ

ここで、と、OLS推定器があり、への射影行列を使用してとをします。同様に、とは直交していることがます。そしていまX=[X0|X1]β0^Y0^H0S(X0)YY0^Y0^

Y^Y0^=HYH0Y=HYH0HY=(IH0)HY

ここで再び、の補数に正射影行列であり、である。したがって、と直交性があります。つまり、最後に(IH0)S(X0)S(X0)Y^Y0^Y0^

||YY^||2=||Y||2||Y^||2=||YY0^||2+||Y0^||2||Y^Y0^||2||Y0^||2

そして最後に||YY0^||2=||YY^||2+||Y^Y0^||2

最後に、考えると、平均は単にです。^ Y 0、Y=β0+EY¯Y0^Y=β0+e


回答ありがとうございます!S()とは何ですか(投稿のS(X)のように)?
bluemouse 2017年

XS(X)は、行列の列によって生成される部分空間です。X
ŁukaszGrad
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.