母集団のR平方の公平な推定とは何ですか?


14

多重線形回帰で不偏推定値を取得することに興味がありますR2

熟考すると、不偏推定値が一致しようとしている2つの異なる値を考えることができます。R2

  1. Out of sample:R2サンプルから得られた回帰方程式(つまり)が、サンプルの外部にある同じデータからの無限量のデータに適用された場合に得られるr平方生成プロセス。β^
  2. 母集団:R2無限サンプルが取得され、モデルがその無限サンプル(つまり、)に適合した場合に取得されるr平方、または既知のデータ生成プロセスによって暗示されるR平方のみ。β

調整されたR2は、サンプル観察された過剰適合を補償するように設計されていることを理解しています。それにもかかわらず、調整後かどうかは明らかではない実際の不偏推定値であり、、それは二定義は上記の不偏推定値である場合、が推定することを目指しています。R2R2R2R2

したがって、私の質問:

  • 上記のサンプルからの偏りのない推定値は何ですか?R2
  • 母集団より上で私が呼ぶものの公平な推定とは何ですか?R2
  • 公平性のシミュレーションまたはその他の証拠を提供する参考文献はありますか?

adjの式は何ですか。R ^ 2の偏りは、たとえばここで上げられています
ttnphns

ありがとう。私は今あなたが言及した参考文献を読んでいます:Yin、P.、&Fan、X.(2001)重回帰における収縮の推定:さまざまな分析方法の比較。Journal of Experimental Education、69(2)、203-224。R2
ジェロミーアングリム

回答:


14

R二乗の分析的調整の評価

@ttnphnsは、を推定するさまざまな分析方法を比較したYin and Fan(2001)の記事を参照しました。私の質問によると、彼らは2種類の推定量を区別しています。次の用語を使用します。R2

  • :二乗人口重相関係数の推定ρ2
  • :乗人口クロス妥当性係数の推定ρc2

結果は要約にまとめられています。

著者らは、収縮を推定するための分析式の有効性を調査するために、モンテカルロ実験を実施しました。細胞。結果は、(SASとSPSSの両方で)最も広く使用されているはしけ式はおそらく推定するための最も効果的な解析式ではないことを示しρ 2。代わりに、プラット式及びブラウン式を推定する際に他の分析式を上回るρ 2及びρ 2 Cそれぞれ。R2ρ2ρ2ρc2

したがって、物品は、プラット式(p.209)を推定するための良い選択であることを意味ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

ここで、Nはサンプルサイズ、pは予測子の数です。

R二乗の調整の経験的推定

Kromrey and Hines(1995)は、経験的推定をレビューします(たとえば、相互検証アプローチ)。彼らは、そのようなアルゴリズムを推定するために不適切であることを示しρ 2を。これは、このようなアルゴリズムは見積もりに設計されているように見えることを考えると理にかなってρ 2 、C。しかし、これを読んだ後、私はまだ適切に経験的推定値を修正するいくつかのフォームがまだ良く推定における分析の推定値よりも行う可能性があるかどうかわからなかったρ 2をR2ρ2ρc2ρ2

参照資料

  • Kromrey、JD、およびHines、CV(1995)。重回帰における収縮の経験的推定の使用:注意。教育的および心理的測定、55(6)、901-925。
  • Yin、P.、&Fan、X.(2001)。重回帰での収縮の推定:さまざまな分析方法の比較。Journal of Experimental Education、69(2)、203-224。PDFR2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.