多重線形回帰係数と偏相関は直接リンクされ、同じ意味(p値)を持ちます。部分rは、ベータ係数(標準化された回帰係数)とともに、係数を標準化するもう1つの方法です。したがって、従属変数がで、独立変数がと場合、、Y 、X 1 、X 21yバツ1バツ2
ベータ:βバツ1= ryバツ1− ryバツ2rバツ1バツ21 - r2バツ1バツ2
部分r:ryバツ1。バツ2= ryバツ1− ryバツ2rバツ1バツ2(1 − r2yバツ2)(1 − r2バツ1バツ2)−−−−−−−−−−−−−−−−√
分子は同じであり、両方の式が同じ一意の効果を測定することを示しています。2つの式が構造的に同一である方法とそうでない方法について説明します。バツ1
3つの変数すべてをz標準化(平均0、分散1)したとします。分子は、その後の二種類の間の共分散に等しい残差:予測する際に左()残差によって [標準両方の変数]と予測する際に左(b)の残差によって [標準の両方の変数]。さらに、残差(a)の分散はです。残差(b)の分散はです。x 2 x 1 x 2 1 - r 2 y x 2 1 - r 2 x 1 x 2yバツ2バツ1バツ21−r2yx21−r2x1x2
ための式部分相関は、次いで明確無地ピアソンの式表示ピアソン:残差()と残差(B)との間に、このインスタンスで計算されるように、、我々が知っている共分散の幾何平均である分母で除算し、 2つの異なる分散。rrr
標準化された係数betaは構造的にPearsonに似ていますが、分母が自身の分散の幾何平均であることだけが異なります。残差(a)の分散はカウントされませんでした。残差の分散の2番目のカウント(b)に置き換えられました。したがって、ベータは、2つの残差の共分散であり、それらの1つ(具体的には、対象の予測子関連するもの)の分散に対する相対です。すでに指摘したように、部分相関は、ハイブリッド分散に対する同じ共分散です。両方のタイプの係数は、他の予測変数の環境での効果を標準化する方法です。x 1 x 1rx1x1
違いのいくつかの数値的結果。およびよる重回帰のR-square が1である場合、予測変数と従属変数の両方の偏相関も1絶対値になります(ただし、ベータは通常1にはなりません)。実際、前述したように、残差との残差との相関です。場合は何ではありません内のされ、正確に何をされていない内の、その後内の何もないでもないもx 1 x 2 r y x 1。x 2 x 2 y x 2 x 1 y x 1 x 2 x 2 y 1 - r 2 y x 2 x 1 1 - r 2 x 1 x 2 r y x 1。X 2 β X 1つの Y Yyx1x2ryx1.x2y <- x2
x1 <- x2
x2y x2x1yx1x2:完全にフィット。の独立した部分(によって比較的高くキャプチャされた場合、説明されていない()部分の量は何でも())、は高くなります。一方、、キャプチャされている説明されていない部分自体が実質的な部分である場合にのみ高くなります。バツ2y1 - r2yバツ2バツ11 - r2バツ1バツ2ryバツ1。バツ2βバツ1yy
上記の公式から、ベータと対応する部分rの間の変換式を取得します(2予測子回帰から任意数の予測子を含む回帰に拡張し)。バツ1、x2、x3、。。。
ryバツ1。バツ= βバツ1var (eバツ1← X)var (ey← X)−−−−−−−−−−√、
どこ現在の(除くすべての予測変数のコレクションを表します)。はをで回帰した残差であり、はをで回帰した残差であり、これらの回帰の変数は標準化されています。x 1 e y ← X y X e x 1 ← X x 1 Xバツバツ1ey← Xyバツeバツ1← Xバツ1バツ
注:すべての予測子と偏相関を計算する必要がある場合、通常、2つの追加の回帰を行う必要があるこの式は使用しません。むしろ、スイープ操作(多くの場合、段階的およびすべてのサブセット回帰アルゴリズムで使用されます)が実行されるか、アンチイメージ相関行列が計算されます。xyバツ
β X 1 = B 、X 1 σ X 11 βバツ1= bバツ1σバツ1σyは、生のと切片付き回帰の標準化された係数との関係です。bβ