さまざまな調整済み


15

私は、以下によって提案された調整済みのR 2乗公式を念頭に置いています。

  • エゼキエル(1930)、これは現在SPSSで使用されているものだと思います。

    Radjusted2=1(N1)(Np1)(1R2)
  • オルキンとプラット(1958)

    Runbiased2=1(N3)(1R2)(Np1)2(N3)(1R2)2(Np1)(Np+1)

どのような状況下で(もしあれば)、「調整された」を「バイアスされていない」R 2に優先すべきR2ですか?

参照資料

  1. エゼキエル、M。(1930)。相関分析の方法。ジョン・ワイリーとサンズ、ニューヨーク。
  2. オルキンI.、プラットJW(1958)。特定の相関係数の不偏推定。数理統計学年報、29(1)、201-211。

回答:


5

@ttnphnsの回答を信用したくなかったので、コメントから回答を移動したかった(特に記事へのリンクがなくなったことを考慮して)。マット・クラウスの答えは、R 2 a d jの違いについての有用な議論を提供しますが、どのR 2 a d jの決定については議論しません。R2Radj2Radj2式をどの場合に使用するか。

私は議論としてこの答え、陰とファン(2001)母分散を推定するために、さまざまな式の優れた概要を提供するには、説明、潜在的調整の種類標識することができすべては、R 2をρ2R2

彼らは、異なるサンプルサイズのための最良の不偏推定値を提供調整R二乗式の広い範囲のどの評価するためにシミュレーションを行う、及び予測子intercorrelations。彼らは、プラットの処方が良い選択肢かもしれないと示唆しているが、この研究がこの問題について決定的だったとは思わない。ρ2

更新: Raju et al(1997)は、調整された公式は、固定xまたはランダムxの前駆体を想定して調整されたR 2を推定するように設計されているかどうかによって異なることに注意します。具体的には、Ezekial式を推定するために設計されたρ 2を固定Xコンテキストで、及びOlkin・プラットとプラット式を推定するように設計されているρ 2をランダムXコンテキストで。Olkin-Pratt式とPratt式の間に大きな違いはありません。固定xの仮定は、計画された実験と一致し、ランダムxの仮定は、予測変数の値が観察研究で通常そうである可能性のある値のサンプルであると仮定した場合に一致します。見るR2R2ρ2ρ2さらなる議論のために、この答えを。また、サンプルサイズが適度に大きくなるため、2種類の式に大きな違いはありません(違いの大きさについては、こちらを参照してください)。

経験則のまとめ

  • あなたが予測変数のためのあなたの観測が母集団からの無作為標本であると仮定し、あなたが推定したい場合は予測因子と基準(すなわち、ランダム-X仮定)の両方の完全な集団について、その後Olkin・プラット式を使用します(またはプラット式)。ρ2
  • あなたの観測が固定されていることを前提としていたり、予測値のあなたの観察されたレベルを超えて一般化したくない場合は、推定エゼキエル式で。ρ2
  • サンプル回帰式を使用したサンプル外予測について知りたい場合は、何らかの形式の相互検証手順を検討する必要があります。

参照資料

  • Raju、NS、Bilgic、R.、Edwards、JE、&Fleer、PF(1997)。方法論のレビュー:母集団の妥当性と交差妥当性の推定、および予測における等しい重みの使用。応用心理測定、21(4)、291-305。
  • Yin、P.、&Fan、X.(2001)。重回帰における収縮の推定:さまざまな分析方法の比較。Journal of Experimental Education、69(2)、203-224。PDFR2

13

または調整されたR 2の選択は、何をしようとしているかによって異なります。回帰のコンテキストでは、通常のR 2がモデルの適合度の尺度として使用されます。ただし、パラメーターの数が異なる複数のモデルを比較していると想像してください。すべての条件が同じであれば、より多くのパラメーターを持つモデルは、より密接に観測に適合します。限界では、1つを除く各データポイントのパラメーターを持つモデルを作成できます。これにより、観測に完全に適合しますが、基礎となる「信号」と関連するノイズの両方をキャプチャするため、新しい予測には役に立ちません。調整済みR 2は、Rを調整することによりこの問題を解決する試みです。R2R2R2R2モデル内のパラメーターの数に応じた 2つの値。R2

したがって、それらはわずかに異なる目的を持っています。は、さまざまなデータセットがモデルにどの程度適合するかを示します。「上記のモデルは、標準のテスト条件下でウィジェットB(r 2 = 0.05)ではなく、パートA(r 2 = 0.9)のパフォーマンスを正確に予測します。」調整済みR 2は、異なるモデルが同じデータ(または同様のデータ)にどの程度適合するかを示します。たとえば、「短形式および長形式のアンケートの結果は、顧客の年間支出を等しく予測しました(両方で調整済みR 2 = 0.8)。」R2r2r2R2R2


2
おかげで、R-squaredと調整済みR-squaredの違いを非常に明確に説明できることがわかりました。あなたの意見では、偏りのないR 2乗はこの図にどのように適合しますか?
user1205901-モニカの復元12年

5
実際、母集団R ^ 2を推定するためのさまざまな公式があります。例としてstudyforquals.pbworks.com/f/yin.pdfを参照してください。フィッシャー(=ウェリー)の「調整済みR ^ 2」は、わずかに負にバイアスされていると言われています(予測子の数に依存せず、サンプルサイズに依存しています)。
ttnphns

1
@ttnphns、多分それはコメントの代わりに答えになるはずです。私には、この答えよりも元の質問に対処しているようです。
GUNG -復活モニカ

1
R2サンプルから計算された値は、「真の」母集団の値よりもわずかに小さくなります。uv.es/psicologica/articulos1.03/9.ZUMBO.pdfの6/138ページのプロットは、サンプルサイズとR2値。Olkin-Pratt式は、このサンプルサイズバイアスを補正します。Olkin-Pratt式には2つのバージョンがあり、そのうちの1つはパラメーターの数を修正しているようです(ttnphnsリンクを参照)。実際、このペーパーには、特定のアプリケーションの修正方法を選択するのに役立ついくつかの表が含まれているため、一見の価値があります。
マットクラウス

1
@ ttnphns、Gungに同意します!あなたは答えを書き上げて、いくらかのクレジットを取るべきです。また、私が書いたものを確認できますか?JStorは今日奇妙な振る舞いをしており、OlkinとPrattのオリジナルの論文を読ませてくれません。
マットクラウス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.