OLS回帰でのベータ係数の行列からスカラー表記への変換


7

私の計量経済学試験で、スカラー表記を忘れた場合、行列表記を覚えて逆に作業することで自分自身を救うことができることがわかりました。しかし、以下は私を混乱させました。

単純な見積もりを考えると

yi^=β0^+β1^xi1

どのようにして

β^=(XX)1Xy

β^1=i=1n(xix¯)(yiy¯)i=1n(xix¯)2

動けなくなる

β^1=i=1nxiyii=1nxi2

は何を使用していますか?切片の項の列を含めましたか?X
whuber

はい、モデルが単にy_i = beta_0 + \ beta_1x_ {i1}であると想定します
JuniorBurger

私の要点は、行列形式にセンタリング行列M_0が含まれていないため、\ bar {x}と\ bar {y}をどのように導出するのですか?
JuniorBurger

その1の列を含めた場合、の逆を正しく計算していません。これは行列であり、適用する必要がありますしたがって、はベクトルを提供します。XX2×2Xy2
whuber

申し訳ありませんが、質問を明記していない場合があります。私の主な質問は、xとyのサンプル平均はどこから来るのですか?マトリックス表記から始めて、Va​​r(x)に対するスカラーbeta_1、Cov(x、y)の式にどのように到達しますか?
JuniorBurger 2018年

回答:


4

解決

行列代数は気が遠くなる可能性があり、エレガントに実行されない場合、非常に多くの(余分な)代数操作が必要になる可能性があります。しかし、状況は、見た目よりはるかに簡単です(行列作成するので最初にものの列を置くことによって、および独立した値の後、カラムそれの後)X(xi)

XX=(nSxSxSxx)

そして

Xy=(SySxy)

(は、変数とその積の合計の便利な(そしてかなり一般的な)省略形です)。したがって、推定の正規方程式は、連立線形方程式として書き出された場合、単にSβ^=(β^0,β^1)

nβ^0+Sxβ^1=SySxβ^0+Sxxβ^1=Sxy,

とで解決され 実際、このab initioを実際に解決する必要はありません。この時点で行う必要があるのは、実際に機能する式を確認することだけです。それは基本的な代数だけを必要とします。同じ結果をはるかに明るく一般化できる方法で生成するより良い方法があるので、それを示しません。β^0β^1.β^1


動機と一般化

正規方程式は、残差の二乗和を最小化する問題を考慮することによって導出されることを思い出してください。

SSR=i(yi(β0+β1xi))2.

外観中のものの列に対応する、一方の外観列に対応における。 一般に、これらの列は直交していません。 (内積がゼロの場合、2つのベクトルは直交していることを思い出してください。幾何学的に、これはそれらが垂直であることを意味します。これについての詳細は、リファレンスを参照してください)。最も簡単な選択は、各から定数を減算して、結果を定数列に直交させることです。である、我々は数の追求のためにβ0Xβ1(xi)Xxic

0=(1,1,,1)(x1c,x2c,,xnc)=i(1(xic))=Sxnc.

一意の解は、明らかに平均です したがって、「中心に置かれた」変数観点からモデルを書き直してみましょう 最小化するように求めますc=Sx/n=x¯,xi.xix¯.

SSR=i(yi(β0+β1x¯+β1(xix¯)))2.

簡単にするために、未知の定数項を次のように書きます。

α=β0+β1x¯,

ソリューション一度ということを理解と得られ、我々は簡単に見積もりを見つけますα^β^1

β^0=α^β^1x¯.

未知数、正規方程式は(α^,β^1)

(n00i(xix¯)2)(α^β^1)=(Syi(xix¯)yi).

2つの連立線形方程式として書き出されると、各未知数はそれ自体の方程式で分離されます。これは簡単に解決できます。これは、直交列があることで実現されます。X 具体的には、方程式のありますβ^1

i(xix¯)2 β^1=i(xix¯)yi.

これは、これから望ましい結果に至るまでの短くて単純な代数的ステップです。(という事実を使用してください。)i(xix¯)y¯=0.

複数の変数への一般化は同じ方法で行われます。最初のステップで、の最初の列の適切な倍数を他の各列から差し引いて、結果のすべての列が最初の列に直交するようにします。(これは、1つの未知の定数線形方程式を解くことに帰着することを思い出してください。これは簡単です。)2番目の適切な倍数を減算して繰り返します。Xc,(新しい)3列目、4列目、...などの列の列を使用して、最初の2つの列に同時に直交させます。それらが相互に直交するまで、この方法で列を「スイープアウト」し続けます。結果の正規方程式は一度に最大1つの変数を含むため、簡単に解くことができます。最後に、解決策は、元の変数(あなたが見積もりに変換する必要があるだけのように変換されたバックする必要がと推定値に戻す通常の回帰場合を)。方法の各ステップで行うのは、古い方程式から新しい方程式を作成し、一度に1つの変数を解くことだけです。α^β^1β^0


参考文献

正規方程式を解くためのこのアプローチのより正式な説明については、「グラム-シュミットの直交化」を参照してください。

重回帰におけるその使用がで議論されているのLynne Lamotte線形モデルの基礎としてグラムシュミット建設、アメリカの統計学者68(1)、2014年2月。

他を計算せずに単一の係数推定値を見つける方法を確認するには、https://stats.stackexchange.com/a/166718/919の分析を参照してください

幾何学的な解釈のために、で私の答えを参照https://stats.stackexchange.com/a/97881/919https://stats.stackexchange.com/a/113207/919


3

定数とで回帰する場合、行列は したがって、 および ここから取得できますか?xiX

(1x11xn)
XX=(nixiixiixi2)
(XX)1=1nixi2(ixi)2(ixi2ixiixin)

ああ、マトリックスの逆をとることについてのビデオを見たばかりです...明らかに、マトリックスの表記法/操作に関する私の知識は、完全に新しいものではありませんでした!
JuniorBurger

@ user212080単純な線形回帰の場合、行列の逆の標準式を使用せずに、問題手動で解決できます。XtXβ=Xty
Sextus Empiricus

2

これに苦労している可能性のある他の誰かのために、私はすべてを以下に段階的に書きました。

説明を簡単にするために、1変数()の最小サンプルと2つの観測()のみがあるとします。スカラーでの推定はxk=1n=2yi^=β0^+β1^xi

β^=(β0^β1^)

y=(yiyi)

X=(1xi1xi)

したがって

X=(11xixi)

そして;

XX=(ni=1nxii=1nxii=1nxi2)

\ textbf {逆行列}の規則を思い出してください。ここで、det [。] =行列の行列式、およびadj [。] =行列の補助(時々随伴と呼ばれる)。

(XX)1=1det[XX]×adj[XX]
det[XX]=1adbc=1ni=1nxi2(i=1nxi)2
adj[XX]=(dbca)=(i=1nxi2i=1nxii=1nxin)

したがって

(XX)1=1det[XX]×adj[XX]=(i=1nxi2ni=1nxi2(i=1nxi)2i=1nxini=1nxi2(i=1nxi)2i=1nxini=1nxi2(i=1nxi)2nni=1nxi2(i=1nxi)2)

Xy=(11xixi)×(yiyi)=(i=1nyii=1nxiyi)

したがって

β^=(XX)1Xy(β0^β1^)=(i=1nxi2ni=1nxi2(i=1nxi)2i=1nxini=1nxi2(i=1nxi)2i=1nxini=1nxi2(i=1nxi)2nni=1nxi2(i=1nxi)2)×(i=1nyii=1nxiyi)

β1^=i=1nxi×i=1nyini=1nxi2(i=1nxi)2+n×i=1nxiyini=1nxi2(i=1nxi)2β1^=ni=1nxiyii=1nxii=1nyini=1nxi2(i=1nxi)2
思い出す、したがって(同様); % 1ni=1nxi=x¯i=1nxi=nx¯yi
β1^=ni=1nxiyinx¯ny¯ni=1nxi2(nx¯)2β1^=ni=1nxiyin2x¯y¯ni=1nxi2n2(x¯)2Dividing by n;β1^=i=1nxiyinx¯y¯i=1nxi2n(x¯)2
β1^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.