可能ですか


8

OLSでは、 R2 2つの変数の回帰の合計は、 R2 個々の変数の2つの回帰の場合。

R2(YA+B)>R2(YA)+R2(YB)

編集:うーん、これは些細なことです。それは、ジムで考えていた問題を解決しようとするときに得られるものです。もう一度時間を無駄にしてすみません。答えは明らかにイエスです。

YN(0,1)

AN(0,1)

B=YA

R2(YA+B)=1、明らかに。だがR2(YA) 制限内で0である必要があり、 R2(YB) 上限は0.5にする必要があります。


残差の二乗和を含む)表示方程式の不等式について質問していますか、それとも、その式の前の文に関連する不等式について質問していますか。R2、決定係数?
2011

に興味があった R2; 問題を修正するために編集されました。
bsdfish '30 / 09/30

いいね。幾何学的な説明もあります。
枢機卿

3
質問が「未回答」のままにならないように、回答を編集して実際の回答とすることができます。
Karl、

これについて直感的な答えが得られる可能性はありますか?もしR2分散のパーセントは説明されていますか?それでは、各変数の専用モデルよりも、完全モデルでより多くの分散をどのように説明できますか?
kmace 2017

回答:


4

以下は、ランダムなシードを設定するRの少しです。これにより、データセットが動作することを示すデータセットが生成されます。

set.seed(103)

d <- data.frame(y=rnorm(20, 0, 1),
                a=rnorm(20, 0, 1),
                b=rnorm(20, 0, 1))

m1 <- lm(y~a, data=d)
m2 <- lm(y~b, data=d)
m3 <- lm(y~a+b, data=d)

r2.a <- summary(m1)[["r.squared"]]
r2.b <- summary(m2)[["r.squared"]]
r2.sum <- summary(m3)[["r.squared"]]

r2.sum > r2.a + r2.b

(すでに分析的に示したように)それが可能であるだけでなく、それを行うことは難しくありません。3つの正規分布変数を考えると、約40%の確率で発生するようです。


ワオ。MITの人たちは、一般的に想定されているよりも多くの時間を持つ必要があります;-)
xmjx

長い会議の中で行き詰まりました。:)
ベンジャミン・マコヒル

-1

それは不可能です。さらに、AとBがまったく相関している場合(rがゼロでない場合)、両方の回帰のrsqは、個々の回帰のrsqの合計よりも小さくなります。

AとBが完全に無相関であっても、 調整された rsq(ケースと予測子の比率が低い場合に不利になる)は、2つのソリューション間でわずかに異なる場合があります。

多分あなたはあなたが交差させた経験的な証拠についてもっと共有したいと思います。


あなたはこれを再考したいと思うかもしれません。または、シミュレーションを試してください。:)
枢機卿

それは正確にいつであることに注意してください A そして B されている非常に1があることに相関質問で述べた不平等を参照してください。:)
枢機卿

次の極端なシナリオを考えてみましょう。 X1 そして X2 の代わりに A そして B。(潜在的な)2変量正規分布をとります。しましょうY最大の固有値を持つ固有ベクトルへの2変量法線の投影です。しましょうX1最小固有値の固有ベクトルへの射影。のために0<ρ<1、させて X2=ρY+1ρ2X。そうしてR2 ために X1 ゼロであり、 R2 ために X2任意に小さくできます。しかしR2X1+X2常に 1です(なぜですか)。おそらく、投稿を編集することを検討してください。
枢機卿

...そして X1+X2実際の合計ではなく、両方の予測子を組み込んだモデルを意味します。より良い表記はおそらく直接合計によるでしょうX1X2
枢機卿
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.