線形回帰の標準化された


9

私はさまざまな結果を予測するために重回帰を適用した記事の結果を解釈しようとしています。しかし、「S(標準B係数は以下のように定義β X 1 = B 、X 1S D X 1βここで、yは従属変数、x1は予測子です)報告されたものは、報告されたR2と一致しないようです。βx1=Bx1SDx1SDyyx1R2

ここに画像の説明を入力してください

-0.83、-0.29、-0.16、-0.43、0.25、および-0.29のにもかかわらず、報告されたR 2は0.20のみです。βR2

また、3つの予測値:体重、BMI、および脂肪%は、マルチコリニアであり、r = 0.8〜0.9の周りで性別内で相互に相関しています。

あるこれらと値の妥当なβさん、または間にはストレートな関係が存在しないβさんとR 2はR2ββR2

さらに、マルチコリニア予測子に関する問題は、4番目の予測子(VO2max)のに影響を与える可能性があります。β


この文脈でのとは何ですか?ベータ係数(標準化された回帰)?または、他の何か?もしそうなら、彼らはあなたが得るすべてが標準偏差の観点からの解釈であると本当に言うことができません。係数が大きな影響を意味するという事実は、R 2値が高いことを意味しないβR2
Repmat

1
ßは標準化されたb係数を表します。1予測子の場合、βはピアソンのrに等しく、R二乗に直接関連しますが、この多変量の場合、βが高いということはR二乗が高いことを意味しませんか?
サカリジュカラネン2016

2
ββ=Cov(y,x)Var(x)Cov(y,x)Var(y)×Var(x)=ρ(y,x)βR2

5
βbrxysysxrsyx

なぜあなたがこれを間違っていると考えるのかまだわかりませんか?論文にいくつかの要約統計がある場合は、数値が合計されるかどうかを簡単に確認できます。あなたもそうするための式を提供しました。単純に効果が大きいという理由だけで、モデルがyの分散を説明するのに優れていると結論付けることはできません。
Repmat 2016

回答:


17

通常の最小二乗回帰幾何学的解釈は、必要な洞察を提供します。

x1x2yx1x2E2yE3y^yE2R2y^

直交リグレッサ

最も良い状況は、最初の図のように、説明変数が直交している場合です。

図1は、リグレッサと$ \ hat y $を平面内のベクトルとして示しています。

x1y^x1x2β1x1β2x2y^R2

ピタゴラスの定理はアサート

R2=|y^|2=|β1x1|2+|β2x2|2=β12(1)+β22(1)=β12+β22.

ピタゴラスの定理は任意の数の次元で成立するため、この推論は任意の数のリグレッサに一般化され、最初の結果が得られます。

R2

R2

相関

負の相関関係にあるリグレッサは、直角より大きい角度で出会います。

図2負の相関関係を持つリグレッサを示す

R2

y^R20x1x2R2

図

この明白な結果、2番目の一般性を記念してみましょう。

R2

ただし、次の図が示すように、これは普遍的な関係ではありません。

図3は、負の相関関係にあるリグレッサを示していますが、ベータには反対の符号があります。

R2y^1/2R21

正の相関関係にあるリグレッサを使用して同様の例を構築し、それによって鋭角で出会うことは、あなたの想像に任せます。

R2

R2


代数的結果

x1,x2,,xpy(1,1,,1)

|xi|2=|y|2=1.

xin×pX

Σ=XX

xi

β=(XX)1Xy=Σ1(Xy).

さらに、定義により、フィットは

y^=Xβ=X(Σ1Xy).

R2

R2=|y^|2=y^y^=(Xβ)(Xβ)=β(XX)β=βΣβ.

R2

i=1pβi2=ββ.

L2Ap2

|A|22=i,jaij2=tr(AA)=tr(AA).

コーシー・シュワルツの不平等は、

R2=tr(R2)=tr(βΣβ)=tr(Σββ)|Σ|2|ββ|2=|Σ|2ββ.

1p2p×pΣ|Σ|21×p2=p

R2pββ.

xi

R2R2/p


結論

R2y^R2

1.1301R21

0.830.69R20.20VO2max

R2x1x2y^x1x2y未知の量(これら3つすべてが共変量にどのように関連しているかに依存します)によって、操作しているベクトルの実際のサイズについてほとんど何も知らせません。


y^y^

@amoeba正解です。私はこれらのイメージを作成するのが速すぎました!問題を修正する機会が得られるまで、私は(できれば一時的に)この投稿を削除します。これを指摘していただきありがとうございます。
whuber

@Amoeba写真を修正し、それに合わせて分析を変更しました。詳細は大幅に変更されましたが、結論は変わりません。
whuber

1
@amoeba再びあなたは正しいです。興味のある読者を失うリスクがありますが、幾何学的な直観を定量化せざるを得なくなりましたが、私はその結論を引き締め、少し代数でそれを正当化しました。(代数が正しいと信じています!)
whuber

1
どうもありがとう!余談ですが、VO2maxは体重とBMIに負の相関があります。上記の表では、VO2maxは実際にはVO2maxを体重で割ったものに相当します(これはVO2maxを体のサイズに合わせる悪い方法です)。表のVO2max /重みは、性別を除いて、他のすべての予測因子と負の相関があります。これは、前述のように、高βで低R二乗を説明する可能性があります。
サカリジュカラネン2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.