調整済みRの2乗のR で使用される正確な式は何lm()
ですか?どうすれば解釈できますか?
調整されたr-2乗式
調整されたR-2乗を計算するためのいくつかの式が存在するようです。
- ウェリーの式:
- マクネマーの式:
- 主の公式:
- スタインの式:
教科書の説明
- Fieldの教科書によると、Rを使用した統計の発見(2012、p。273)Rは、Wherryの方程式を使用します。彼は、Wherryの公式を示していません。彼は、Steinの式を(手で)使用して、モデルがどのように交差検証されるかを確認することを推奨します。
- Kleiber / Zeileis、Applied Econometrics with R(2008、p。59)は、「Theilの調整済みR 2乗」であると主張し、その解釈が複数のR 2乗からどのように変化するかを正確に述べていません。
- Dalgaard、Introductory Statistics with R(2008、p。113)は、「[調整されたRの2乗]を100%掛けると、「%分散の減少」と解釈できる」と書いています。彼は、これがどの式に対応するかについては述べていません。
私は以前、R乗がモデルに追加の変数を追加するとペナルティを与えると考え、広く読んでいました。現在、これらの異なる式の使用は、異なる解釈を必要とするようです。また、スタックオーバーフロー(単一変量最小二乗回帰における複数R 2乗と調整R 2乗の違いは何ですか?)、およびUPennにあるウォートンスクールの統計辞書に関する関連する質問も調べました。
ご質問
- Rによって調整されたr平方に使用される式はどれ
lm()
ですか? - どうすれば解釈できますか?
ここでは、「どのようなR ^ 2 ...」ではない実際の問題に対する答えを提供します。あなた(および他の多くの人)に欠けている情報はこれです。すべてのRパッケージ(コアを含む)がソースコードを利用可能にします。ディストリビューションでコンパイルされたものでさえ、CRANまたは他のリポジトリの{packagenames} .tar.gzで利用可能です。
—
カール・ウィットフト
ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)
、ここでans $ r.squared = R ^ 2; n = n、rdf =残差df、df.int = dfのインターセプト(0または1)。