一般化された最小二乗:回帰係数から相関係数へ?


10

1つの予測子を持つ最小二乗の場合:

y=βx+ϵ

とがフィッティングの前に標準化されている場合(つまり、)、次のようになります。、Y N 0 1 xyN(0,1)

  • Rβはピアソン相関係数と同じです。r
  • X = β Y + εβは反映された回帰で同じです:x=βy+ϵ

一般化された最小二乗(GLS)の場合、同じことが当てはまりますか?つまり、データを標準化した場合、回帰係数から直接相関係数を取得できますか?

データの実験から、反映されたGLSはさまざまな係数を導き、また、回帰係数が相関の期待値と一致していると確信していません。私は人々がGLS相関係数を引用しているのを知っているので、彼らがどのようにしてそれらに到達し、それゆえ彼らが本当に何を意味するのか疑問に思っていますか?β

回答:


4

答えは「はい」です。線形回帰係数は、予測子と応答の相関ですが、正しい座標系を使用する場合のみです

つまり、、が中央に配置され、標準化されている場合、各と間の相関は、ドット積のみであることを思い出してください。また、線形回帰の最小二乗解は y x i y x t i yx1,x2,,xnyxiyxity

β=(XtX)1Xty

そのような場合、次いで(単位行列)をXtX=I

β=Xty

そして、相関ベクトルを回復します。この関係を真にする元の予測子の適切な線形結合を見つけるによって、を満たす予測子観点から回帰問題をリキャストすることはしばしば魅力的です(または同等に、座標の線形変化); これらの新しい予測子は主成分と呼ばれます。X TX =Ix~iX~tX~=I

したがって、全体として、あなたの質問に対する答えはイエスですが、予測子自体が無相関である場合のみです。それ以外の場合、式

XtXβ=Xty

は、予測因子と応答の相関を回復するために、予測因子同士の相関とベータを混合する必要があることを示しています。

余談ですが、これは、1つの変数線形回帰で常に結果が真になる理由も説明しています。予測ベクトルが標準化されると、次のようになります。x

x0tx=ixi=0

ここで、はすべて1の切片ベクトルです。したがって、(2列の)データ行列自動的に満たし、結果は次のようになります。 X X t X = Ix0XXtX=I

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.