可能な範囲


10

、、 3つの時系列があるとします。X1X2Y

上で通常の線形回帰を実行している〜()、我々が得る。通常の線形回帰〜X_2を取得R ^ 2 = VをU <Vと仮定YX1Y=bX1+b0+ϵR2=UYX2R2=VU<V

最小値と最大値の可能な値何R2回帰のYX1+X2Y=b1X1+b2X2+b0+ϵ)は?

新しい変数を追加すると常にR ^ 2が増加するため、最小R2V +小さな値である必要があると思いますが、この小さな値を定量化する方法がわからず、最大範囲を取得する方法もわかりません。R2

回答:


9

1)編集:以下の枢機卿のコメントは、最小R2質問に対する正しい答えがVであることを示していますV。したがって、私は「興味深い」私の投稿を削除していますが、最終的には正しくありません。OPの投稿のその部分に答えます。

2)最大R2は1です。次の例を検討してください。

x1 <- rnorm(100)
x2 <- rnorm(100)
y <- x1 + 2*x2

> summary(lm(y~x1))$r.squared
[1] 0.2378023                 # This is U
> summary(lm(y~x2))$r.squared
[1] 0.7917808                 # This is V; U < V
> summary(lm(y~x1+x2))$r.squared
[1] 1

ここでは、の分散を0に固定しています。が必要な場合でも、状況は少します。どんどん小さくすることで、任意に1に近づけることができますが、最小の問題と同様に、そこに到達することができないため、最大値はありません。1は常により大きいため、上限になりますが、としての制限でもあります。σ 2 ε > 0 R 2 σ 2 ε R 2 σ 2 ε0ϵσϵ2>0R2σϵ2R2σϵ20


2
(+1)いくつかのコメント:これは良い答えです。あなたが漸近的なアプローチをとったのは興味深いことですが、OPがそれに興味を持っているのか、それとも固定 1つ(または両方)に興味があるのか​​は明らかではありません。この回答は、OPのの制約とは少し矛盾しています。たとえば、またはの場合場合、最小はすべての固定サンプルサイズ正確にです。(これらの例の病理を失礼します。)また、OLSは、予測子に追加の制約がない場合、必ずしも一貫していません。:)U < V X 1 = 0 X 1 = 1R R 2 V = V N nU<VX1=0X1=a1aRR2V:=V(n)
枢機卿

@cardinal-再読すると、なぜ私が最小問題にそのアプローチを採用したのか理解できませんが明らかに正しい答えのように見え、暗黙的に観察したように、それを達成する例を構築できたでしょう。最高の部分の静脈...まあ、たぶん今朝のエスプレッソはたまたまカフェイン抜きでした。(たぶん私も投稿する前に私の回答をもっと徹底的にレビューすべきでしょう!)V
jbowman '15

私はあなたが書いたものを削除すべきではないと思います、それは私質問に答えるための興味深いアプローチを見つけました!私が言及する病状は確かに最小の許容しますが、が実際に何を意味するのか疑問に思うかもしれません。他の例は、この問題の一般的なバージョンでは、追加のが他の予測子の列スペースにある場合に拡張されるため、おそらくそれほど病的ではありません。:)X 1 = 0 X iR2X1=0Xi
2012

1
@cardinal-ありがとう!私はそれを、おそらくもう少し正式に再構築して、しばらくしてから下部に戻します。
jbowman 2012

5

ましょうとの間の相関等しくおよび、間の相関等しくおよび、およびとの間の相関および。次に、フルモデルのを除算すると、 X 1 X 2 、R 1 Y、X 1 YのR 2 Y X 2 Y R 2 Vr1,2X1X2r1,YX1Yr2,YX2YR2V

(1(1r1,22))(12r1,2r1,Yr2,Y+UV).

そう等しいフルモデルののみならとまたは VのR 1 2 = 0 、R 2 1 Y = U = 0R2Vr1,2=0r1,Y2=U=0

r1,22=2r1,2r1,Yr2,YUV.

場合、フルモデル用に等しい。R 2 U + Vr1,2=0R2U+V


(+1)かわいい。サイトへようこそ。より完全に参加できるように、アカウントの登録を検討してください。後でこの表現をもう少し詳しく見る必要があります。:)
枢機卿

4

と制約がない場合、最小値はで、最大値はより小さいです。これは、2つの変数が完全に相関している場合(2番目の変数を追加してもがまったく変更されない場合)または両方が直交している場合(両方の結果を含む)がです。コメントでも、それぞれがの列ベクトルであるに直交している必要があることが正しく指摘されていました。V V min V + U 1 R 2 U + V 1UVVmin(V+U,1)R2U+V1

制約追加しました。ただし、可能性があり。つまり、、その場合、です。最後に、である可能性があるため、上限はです。 U = 0 X 1Y = 最大= V + 0 X 1X 2V + U 1 U<VX1X2U=0X1Ymin=max=V+0X1X2min(V+U,1)

との関係について知っていれば、もっと言えると思います。 X 2X1X2


1
(+1)ただし、とが直交している場合、モデルに両方を含めると、個々の値が合計されることは(まったく)正しくないことに注意してください。我々はまた、彼らはすべてのもののベクトルに直交する必要がある。このサイトでを使用して数学をマークアップできることに注意してください。:)X 2 R 2 1 LX1X2R21LATEX
2012

それは本当です。コメント、およびを使用できることを指摘していただき、ありがとうございます。私は、インライン/方程式のために[それがかもしれないと思ったが、mathjaxスタイルのエスケープをしようとした(と書き込み私はTeXの中で魔法のように働いていたのと同じように:)。LATEX
ジョシュア
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.