私は、以下によって提案された調整済みのR 2乗公式を念頭に置いています。
エゼキエル(1930)、これは現在SPSSで使用されているものだと思います。
オルキンとプラット(1958)
どのような状況下で(もしあれば)、「調整された」を「バイアスされていない」R 2に優先すべきですか?
参照資料
- エゼキエル、M。(1930)。相関分析の方法。ジョン・ワイリーとサンズ、ニューヨーク。
- オルキンI.、プラットJW(1958)。特定の相関係数の不偏推定。数理統計学年報、29(1)、201-211。
私は、以下によって提案された調整済みのR 2乗公式を念頭に置いています。
エゼキエル(1930)、これは現在SPSSで使用されているものだと思います。
オルキンとプラット(1958)
どのような状況下で(もしあれば)、「調整された」を「バイアスされていない」R 2に優先すべきですか?
参照資料
回答:
@ttnphnsの回答を信用したくなかったので、コメントから回答を移動したかった(特に記事へのリンクがなくなったことを考慮して)。マット・クラウスの答えは、とR 2 a d jの違いについての有用な議論を提供しますが、どのR 2 a d jの決定については議論しません。式をどの場合に使用するか。
私は議論としてこの答え、陰とファン(2001)母分散を推定するために、さまざまな式の優れた概要を提供するには、説明、潜在的調整の種類標識することができすべては、R 2を。
彼らは、異なるサンプルサイズのための最良の不偏推定値を提供調整R二乗式の広い範囲のどの評価するためにシミュレーションを行う、及び予測子intercorrelations。彼らは、プラットの処方が良い選択肢かもしれないと示唆しているが、この研究がこの問題について決定的だったとは思わない。
更新: Raju et al(1997)は、調整された公式は、固定xまたはランダムxの前駆体を想定して調整されたR 2を推定するように設計されているかどうかによって異なることに注意します。具体的には、Ezekial式を推定するために設計されたρ 2を固定Xコンテキストで、及びOlkin・プラットとプラット式を推定するように設計されているρ 2をランダムXコンテキストで。Olkin-Pratt式とPratt式の間に大きな違いはありません。固定xの仮定は、計画された実験と一致し、ランダムxの仮定は、予測変数の値が観察研究で通常そうである可能性のある値のサンプルであると仮定した場合に一致します。見るさらなる議論のために、この答えを。また、サンプルサイズが適度に大きくなるため、2種類の式に大きな違いはありません(違いの大きさについては、こちらを参照してください)。
または調整されたR 2の選択は、何をしようとしているかによって異なります。回帰のコンテキストでは、通常のR 2がモデルの適合度の尺度として使用されます。ただし、パラメーターの数が異なる複数のモデルを比較していると想像してください。すべての条件が同じであれば、より多くのパラメーターを持つモデルは、より密接に観測に適合します。限界では、1つを除く各データポイントのパラメーターを持つモデルを作成できます。これにより、観測に完全に適合しますが、基礎となる「信号」と関連するノイズの両方をキャプチャするため、新しい予測には役に立ちません。調整済みR 2は、Rを調整することによりこの問題を解決する試みです。モデル内のパラメーターの数に応じた 2つの値。
したがって、それらはわずかに異なる目的を持っています。は、さまざまなデータセットがモデルにどの程度適合するかを示します。「上記のモデルは、標準のテスト条件下でウィジェットB(r 2 = 0.05)ではなく、パートA(r 2 = 0.9)のパフォーマンスを正確に予測します。」調整済みR 2は、異なるモデルが同じデータ(または同様のデータ)にどの程度適合するかを示します。たとえば、「短形式および長形式のアンケートの結果は、顧客の年間支出を等しく予測しました(両方で調整済みR 2 = 0.8)。」