分散インフレ係数の方程式


8

以下の質問以前尋ね、分散拡大要因(のVIFは)のように表すことができる Wは、単位長スケーリングされたバージョンであり、X

VIFj=Var(b^j)σ2=[wjwjwjWj(WjWj)1Wjwj]1
WX

ここから方程式VIF j = 1に到達する方法を誰かに教えてもらえますか R 2 jは、他のリグレッサ変数でxjを回帰することから得られる複数の決定の係数です。

VIFj=11Rj2
Rj2xj

これらの行列演算を正しく行うのに多くの問題があります...

回答:


9

あなたが言及したように、すべてのX変数が相関変換によって標準化され、X単位長をスケーリングしたバージョンであると仮定します。標準化されたモデルは、X変数間の相関を変更しません。VIFは、元の線形モデルの標準化された変換が行われたときに計算できます。標準化された変換後の設計行列をX = [ 1 X 11X 1 p 1 1 X 21X 2 p 1と表します

X=[1X11X1,p11X21X2,p11Xn1Xn,p1].
次いで、
XX=[n00rXX],
rXXの相関行列であるX変数。我々はまた、知っている
σ2{β^}=σ2(XX)1=σ2[1n00rXX1.]
VIFkk=1,2,,p1であり、kの対角項番目のrXX1rXXの行と列を並べ替えて他のkの結果を得ることができるため、k=1場合にのみこれを証明する必要があります。定義しましょう: X1rXXk
X(1)=[X12X1,p1X22X2,p1Xn2Xn,p1],X1=[X11X21Xn1].
どちらの行列も設計行列とは異なることに注意してください。Xの係数のみを考慮するため、X変数、設計行列の1ベクトルは、計算では無視できます。したがって、使用してシューアの補数を
rXX1(1,1)=(r11r1X(1)rX(1)X(1)1rX(1)1)1=(r11[r1X(1)rX(1)X(1)1]rX(1)X(1)[rX(1)X(1)1rX(1)1])1=(1β1X(1)X(1)X(1)β1X(1))1,
β1X(1)の回帰係数であり、X1X2,,Xp1切片を除いて。実際、すべてのX変数は平均ゼロで標準化されているため、切片が原点になるはずです。一方、(すべてを明示的な行列形式で記述できれば、より簡単になります)
R12=SSRSSTO=β1X(1)X(1)X(1)β1X(1)1=β1X(1)X(1)X(1)β1X(1).
したがって、
VIF1=rXX1(1,1)=11R12.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.