あなたが言及したように、すべてのX変数が相関変換によって標準化され、X単位長をスケーリングしたバージョンであると仮定します。標準化されたモデルは、X変数間の相関を変更しません。VIFは、元の線形モデルの標準化された変換が行われたときに計算できます。標準化された変換後の設計行列をX ∗ = [ 1 X 11 … X 1 、p − 1 1 X 21 … X 2 、p − 1と表します
X∗=⎡⎣⎢⎢⎢⎢⎢11⋮1X11X21⋮Xn1……⋮…X1,p−1X2,p−1⋮Xn,p−1⎤⎦⎥⎥⎥⎥⎥.
次いで、
X∗′X∗=[n00′rXX],
rXXの相関行列であるX変数。我々はまた、知っている
σ2{β^}=σ2(X∗′X∗)−1=σ2[1n00′r−1XX.]
VIFk用k=1,2,…,p−1であり、kの対角項番目のr−1XX。rXXの行と列を並べ替えて他のkの結果を得ることができるため、k=1場合にのみこれを証明する必要があります。定義しましょう:
X(−1rXXkX(−1)=⎡⎣⎢⎢⎢⎢⎢X12X22⋮Xn2……⋮…X1,p−1X2,p−1⋮Xn,p−1⎤⎦⎥⎥⎥⎥⎥,X1=⎡⎣⎢⎢⎢⎢X11X21⋮Xn1⎤⎦⎥⎥⎥⎥.
どちらの行列も設計行列とは異なることに注意してください。Xの係数のみを考慮するため、X変数、設計行列の1ベクトルは、計算では無視できます。したがって、使用してシューアの補数を、
r−1XX(1,1)=(r11−r1X(−1)r−1X(−1)X(−1)rX(−1)1)−1=(r11−[r1X(−1)r−1X(−1)X(−1)]rX(−1)X(−1)[r−1X(−1)X(−1)rX(−1)1])−1=(1−β′1X(−1)X′(−1)X(−1)β1X(−1))−1,
β1X(−1)の回帰係数であり、X1にX2,…,Xp−1切片を除いて。実際、すべてのX変数は平均ゼロで標準化されているため、切片が原点になるはずです。一方、(すべてを明示的な行列形式で記述できれば、より簡単になります)
R21=SSRSSTO=β′1X(−1)X′(−1)X(−1)β1X(−1)1=β′1X(−1)X′(−1)X(−1)β1X(−1).
したがって、
VIF1=r−1XX(1,1)=11−R21.