母集団の二乗は、固定スコアまたはランダムスコアを想定して定義できます。
固定スコア:予測子のサンプルサイズと特定の値は固定されます。したがって、は、予測子の値が一定に保たれているときに、母集団回帰式によって結果で説明される分散の割合です。
ランダムスコア:予測子の特定の値は、分布から抽出されます。したがって、は、予測子の値が予測子の母集団分布に対応する母集団の結果で説明される分散の割合を指します。
この区別が\ rho ^ 2の推定に大きな違いをもたらすかどうかについては、以前尋ねました。また、\ rho ^ 2の公平な見積もりを計算する方法 についても一般的に質問しました。
サンプルサイズが大きくなると、固定スコアとランダムスコアの区別が重要でなくなることがわかります。ただし、調整済みが固定スコアまたはランダムスコア\ rho ^ 2を推定するように設計されているかどうかを確認しようとしています。
ご質問
- 調整済み は、固定スコアまたはランダムスコア\ rho ^ 2を推定するように設計されていますか?
- 調整済みr二乗の式が\ rho ^ 2の 1つまたは他の形式にどのように関係するかについての原理的な説明はありますか?
私の混乱の背景
Yin and Fan(2001、p.206)を読んだとき、彼らはこう書いている:
重回帰モデルの基本的な前提の1つは、独立変数の値が既知の定数であり、実験前に研究者によって固定されることです。従属変数のみがサンプルごとに自由に変化します。その回帰モデルは、固定線形回帰モデルと呼ばれます。
ただし、社会科学および行動科学では、独立変数の値が研究者によって固定されることはほとんどなく、ランダムなエラーの影響も受けます。したがって、アプリケーションの2番目の回帰モデルが提案されており、従属変数と独立変数の両方を変化させることができます(Binder、1959; Park&Dudycha、1974)。そのモデルは、ランダムモデル(または修正モデル)と呼ばれます。ランダムモデルと固定モデルから取得した回帰係数の最尤推定値は正規性の仮定の下では同じですが、それらの分布は大きく異なります。ランダムモデルは非常に複雑であるため、一般的に使用される固定線形回帰モデルの代わりに、それを受け入れる前にさらに調査が必要です。したがって、通常は固定モデルが適用され、仮定が完全に満たされていなくても(Claudy、1978)。仮定に違反した固定回帰モデルをこのように適用すると、「オーバーフィッティング」が発生します。これは、不完全なサンプルデータから導入されたランダムエラーがプロセスで大文字にされる傾向があるためです。その結果、そのようにして得られたサンプルの多重相関係数は、真の母集団多重相関を過大評価する傾向があります(Claudy、1978; Cohen&Cohen、1983; Cummings、1982)。
したがって、上記のステートメントが、調整されたがランダムモデルによって導入されたエラーを補償することを言っているのか、またはこれがランダムモデルの存在を示すペーパーの単なる警告であったのかは不明でしたが、固定モデルに焦点を当てます。
参考文献
- Yin、P.&&Fan、X.(2001)。重回帰における収縮の推定:さまざまな分析方法の比較。Journal of Experimental Education、69(2)、203-224。PDF