母集団のr二乗変化の信頼区間を取得する方法


10

簡単な例のために、2つの線形回帰モデルがあると仮定します

  • モデル1は、3つの予測因子を持っているx1ax2bと、x2c
  • モデル2には、モデル1からの3つの予測子と2つの追加の予測子がx2aあり、x2b

母集団の分散が説明人口回帰式がある モデル1及びρ 2 2 増分分散がある集団におけるモデル2によって説明するモデル2についてΔは、ρ 2 = ρ 2 2 - ρ 2 1 ρ(1)2ρ(2)2Δρ2=ρ(2)2ρ(1)2

私は、の推定のための標準誤差と信頼区間を得ることに興味を持ってい。例にはそれぞれ3および2の予測子が含まれていますが、私の研究対象は、さまざまな数の予測子(たとえば、5および30)に関係しています。私が最初に考えたのは使用していた Δ R 2 、A D J = R 2 のD J 2 - R 2 次元J 1 推定量として、それをブートストラップが、私は確かに、これは適切であるかどうかではなかったです。Δρ2Δradj2=radj(2)2radj(1)2

ご質問

  • されたの合理的な推定量Δは、ρ 2をΔradj2Δρ2
  • どのように自信が(すなわち、人口R-平方変更のために取得することができ間隔)?Δρ2
  • うブートストラップ信頼区間の計算のためのBE適切なの?Δρ2

シミュレーションや出版された文献への言及も大歓迎です。

コード例

それが役立つ場合、私は答えを示すために使用できる小さなシミュレーションデータセットをRで作成しました。

n <- 100
x <- data.frame(matrix(rnorm(n *5), ncol=5))
names(x) <- c('x1a', 'x1b', 'x1c', 'x2a', 'x2b')
beta <- c(1,2,3,1,2)
model2_rho_square <- .7
error_rho_square <- 1 - model2_rho_square
error_sd <- sqrt(error_rho_square / model2_rho_square* sum(beta^2))
model1_rho_square <- sum(beta[1:3]^2) / (sum(beta^2) + error_sd^2)
delta_rho_square <- model2_rho_square - model1_rho_square

x$y <- rnorm(n, beta[1] * x$x1a + beta[2] * x$x1b + beta[3] * x$x1c +
               beta[4] * x$x2a + beta[5] * x$x2b, error_sd)

c(delta_rho_square, model1_rho_square, model2_rho_square)
summary(lm(y~., data=x))$adj.r.square - 
        summary(lm(y~x1a + x1b + x1c, data=x))$adj.r.square

ブートストラップに関する懸念の理由

私は、約300ケースのいくつかのデータでブートストラップを実行し、シンプルモデルでは5つの予測子、フルモデルでは30の予測子を実行しました。調整されたr二乗差を使用したサンプル推定はでしたが0.116、ブーストラップされた信頼区間は、主にCI95%(0.095〜0.214)大きく、ブートストラップの平均はサンプル推定の近くにありませんでした。むしろ、ブーストラップされたサンプルの平均は、サンプル内のr二乗間の差のサンプル推定値に中心があるように見えました。これは、差を推定するためにサンプル調整済みr二乗を使用していたという事実にもかかわらずです。

Δρ2

  1. サンプルのr二乗変化を計算する
  2. 標準の調整済みr二乗式を使用して、サンプルのr二乗変化を調整する

Δρ2.082

概して、ブートストラップはサンプルが母集団であることを前提としているため、オーバーフィットの削減が適切に機能しない可能性があると推定しています。


「しかし、私はそのような人口調整された値のブートストラップが問題になるかもしれないことを心配しています。」 - なぜ?
1

@January質問を編集して、調整されたr-squareでのブートストラップに関する懸念を明確にしようとしました。
Jeromy Anglim 2013年

σy2yi

@StéphaneLaurentこれは、母集団回帰式によって母集団で説明される分散のパーセンテージです。または、サンプルサイズが無限に近づくにつれて、サンプルで説明される分散の割合として漸近的に定義することもできます。人口r-squareの公平な推定に関するこの回答も参照してください。これは、実際の推定予測式を実際に適用するのではなく、真の関係に関心があることが多い心理学に特に関連しています。
Jeromy Anglim 2013年

3
Δρ2=0

回答:


3

R2

まず、R二乗人口の定義を理解しようとしています。

あなたのコメントを引用する:

または、サンプルサイズが無限に近づくにつれて、サンプルで説明される分散の割合として漸近的に定義することもできます。

R2

R²Y=μ+σG
R2popR2:=λn+λY=μ+σG

例として:

> ## design of the simple regression model lm(y~x0)
> n0 <- 10
> sigma <- 1
> x0 <- rnorm(n0, 1:n0, sigma)
> a <- 1; b <- 2 # intercept and slope
> params <- c(a,b)
> X <- model.matrix(~x0)
> Mu <- (X%*%params)[,1]
> 
> ## replicate this experiment k times 
> k <- 200
> y <- rep(Mu,k) + rnorm(k*n0)
> # the R-squared is:
> summary(lm(y~rep(x0,k)))$r.squared 
[1] 0.971057
> 
> # theoretical asymptotic R-squared:
> lambda0 <- crossprod(Mu-mean(Mu))/sigma^2
> lambda0/(lambda0+n0)
          [,1]
[1,] 0.9722689
> 
> # other approximation of the asymptotic R-squared for simple linear regression:
> 1-sigma^2/var(y)
[1] 0.9721834

R2

Y=μ+σGH1:μW1H0:μW0

R2H1popR12:=λ1n+λ1λ1=PZ1μ2σ2Z1=[1]W1PZ1μ2=(μiμ¯)2

R2 H0R2H0H1


ステファンに感謝します。私はあなたが何を言っているかについて考えなければならないでしょう。あなたの質問に関して。私は、真のデータ生成処理が知られていないと仮定するが、それは両方のモデルFO同じであるが、存在すること分散の真の割合は、モデル1及びモデル2の線形回帰によって説明
Jeromy Anglim

R2

1
@JeromyAnglim この論文の研究は、あなたが探しているものに近いようです(ランダムな予測子を使用)。
ステファン・ローラン

ありがとう。アルギナ、ケセルマン、ペンフィールドの論文は非常に有用に見えます。私はそれについて私の答えにいくつかのコメントを追加しました。
Jeromy Anglim 2013

@JeromyAnglimでは、予測子についての仮定は何ですか?それらは多変量ガウス分布に従って生成されますか?
ステファン・ローラン

1

あなたが尋ねた質問に答えるのではなく、なぜあなたがその質問をするのかを尋ねます。どうか知りたいと思う

mod.small <- lm(y ~ x1a + x1b + x1c, data=x)

少なくともと同じくらい良いです

mod.large <- lm(y ~ ., data=x)

説明するときy。これらのモデルは入れ子になっているので、この質問に答える明白な方法は、2つのGLMの逸脱の分析を実行するのと同じ方法で、モデルを比較する分散分析を実行することです。

anova(mod.small, mod.large)

次に、母集団のR二乗の意味を理解できると常に仮定して、母集団におけるフィットの改善が何であるかを推測するために、モデル間のサンプルR二乗の改善を使用できます。個人的にはどうだかわかりませんが、これならどちらでもかまいません。

より一般的には、母集団の数量に関心がある場合は、おそらく一般化に関心があるため、サンプルフィットメジャーは希望どおりではありませんが、「修正」されます。たとえば、MSEのように、サンプルから発生することが予想される実際のエラーの種類と量を推定するいくつかの量の相互検証は、希望どおりの結果になると思われます。

しかし、ここで何かが欠けている可能性は十分にあります...


私はあなたの答えに感謝します、そしてそれは他の人に良いアドバイスになるでしょう。しかし、私の研究内容は、私が合法的にデルタロー平方に興味があることを意味します。ほとんどの統計学者は、モデルの予測ユーティリティ(たとえば、交差検定されたデルタr二乗)に関心があることが多いですが、私は心理学者であり、特に人口特性に関心があります。さらに、私は改善の統計的有意性には興味がありません。改善の大きさに興味があります。そして、私はdelta-r-squareがそのサイズの改善にインデックスを付けるのに役立つメトリックであることを発見しました。
Jeromy Anglim 2013

MSEに関して、心理学のさまざまな研究では、非常にさまざまな測定基準に基づいて測定値を使用しています。したがって、r-squareなどの標準化された測度には、正しいか間違っているか、魅力があります。
Jeromy Anglim 2013

特にMSEに関しては十分に公平です。ブートストラップとポピュレーション推論への関心は少し混乱していますが、テストへの関心の欠如です。また、サンプルの予測と母集団の推論を厳密に区別することも困難ですが、それはおそらく、事前コーヒーのニージャーベイズ主義(予測は単なる母集団の推論の問題の1つ)が邪魔をしているためです。
共役前の

たぶん私は少し早く話しました。私の研究の文脈では、デルタロー二乗がゼロより大きいという多くの証拠がしばしばあります。関心の問題は、増加の程度は何ですか。つまり、それはささいな増加または理論的に意味のある増加です。したがって、信頼区間または信頼できる区間は、その増加の周りの不確実性の推定を与えます。ベイジアン統計の理解でここで行っていることをまだ調整していませんが、そうしたいと思います。
Jeromy Anglim 2013

1

ρ2

ダブルアジャストr-squareブートストラップ

現時点での私の答えは、2倍に調整されたr-squareブートストラップを実行することです。テクニックを実装しました。以下が含まれます。

  • 現在のデータからブートストラップサンプルのセットを生成します。
  • 各ブートストラップサンプルについて:
    • 2つのモデルの最初の調整済みr二乗を計算する
    • 前のステップからの調整済みr二乗値に基づいて2番目の調整済みr二乗を計算する
    • Δρ2

理論的根拠は、最初に調整されたr二乗がブートストラップによって導入されたバイアスを取り除くことです(つまり、ブートストラップはサンプルr二乗が母集団r二乗であると仮定します)。2番目の調整済みr二乗は、母集団のr二乗を推定するために通常のサンプルに適用される標準の補正を実行します。

この時点で、このアルゴリズムを適用すると、ほぼ正しいと思われる推定値が生成されることがわかります(つまり、ブートストラップの平均theta_hatがサンプルtheta_hatに非常に近い)。標準エラーは私の直感と一致しています。データ生成プロセスが既知である適切な頻度のカバレッジを提供するかどうかはまだテストしていません。また、この時点では、第一原理からどのように議論を正当化できるかについても完全にはわかりません

このアプローチが問題になる理由を誰かが見た場合、私はそれについて聞いていただければ幸いです。

アルジナ他によるシミュレーション

Δρ2

非心度パラメーターの使用に関するSmithson(2001)

R2f2R2

参考文献

  • Algina、J.、Keselman、HJ、およびPenfield、RD二乗された複数の準部分相関係数の信頼区間。PDF
  • Smithson、M.(2001)。さまざまな回帰効果のサイズとパラメーターの正しい信頼区間:区間の計算における非中心分布の重要性。教育的および心理学的測定、61(4)、605-632。

1
ここには(あなたを含めて)誰もR二乗された母集団の定義を知らないようです。したがって、私見これは深刻な問題のあるアプローチです。
ステファン・ローラン

@StéphaneLaurentありがとうございます。この時点まで、私は集団のr-squareを競合の特性と見なしていないことを認めます。たとえば、データ生成プロセスを提案すると、シミュレーションのサンプルサイズが無限に近づくと、r二乗に近づきます。同様に、私のデータにはデータ生成プロセスがあると想定しています。したがって、無限のサンプルを取得することができれば、真の母集団のr二乗を計算できます。
Jeromy Anglim 2013

はい。でも、予測因子の生成プロセスも想定している印象です。これが一般的な線形モデルに対してどのように意味をなすか理解できません。
ステファン・ローラン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.