OLSを使用して残差の誤差を回帰すると、勾配が常に正確に1になるのはなぜですか?


10

私は、Rの簡単なシミュレーションを使用して、誤差と残差の関係を実験していました。1つわかったことは、サンプルサイズや誤差の分散に関係なく、モデルを当てはめると常に勾配が正確にになることです。1

errorsβ0+β1×residuals

これが私がやっていたシミュレーションです:

n <- 10 
s <- 2.7 

x <- rnorm(n) 
e <- rnorm(n,sd=s)
y <- 0.3 + 1.2*x + e

model <- lm(y ~ x) 
r <- model$res 

summary( lm(e ~ r) )

eそして、r非常に(ただし、完全に)小さなサンプルのため、相関しているが、これは自動的に行われます、なぜ私が理解することはできません。数学的または幾何学的な説明をいただければ幸いです。


5
lm(y~r)lm(e~r)lm(r~r)1Rrs<-r;lm(r~s)

1
@whuberに感謝します。私はそれを受け入れることができるように答えよりも作りたいですか、それともこれを複製としてマークしますか?
GoF_Logistic 2017

1
重複しているとは思わないので、コメントを回答に拡大しました。
whuber

回答:


11

whuberの答えは素晴らしいです!(+1)私は、最も親しみやすい表記法を使用して問題を解決し、(あまり興味深くなく、よりルーチンな)派生がここに含める価値があると考えました。

y=Xβ+ϵXRn×pϵyXXT(yXβ^)=0,

β^=(XTX)1XTy.
r=yXβ^=(IH)y=(IH)ϵ,
H=X(XTX)1XT

ϵr

(rTr)1rTϵ=([(IH)ϵ]T[(IH)ϵ])1[(IH)ϵ]Tϵ=ϵT(IH)TϵϵT(IH)T(IH)ϵ=ϵT(IH)ϵϵT(IH)ϵ=1,
IHϵim(X)

1Tr=0


+1ソリューションが慎重かつ明確に機能するのを見るのはいつでも素晴らしいことです。
whuber

11

xeY=βx+ebβr=YbxO

図

βxeYbxYbxr

xOY(βx)YrrYrYererrr1


re=r+(βb)xY=e+βx=r+(2βb)xxxrr1xr

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.