Rのlmで調整されたR-2乗式とは何ですか?


35

調整済みRの2乗のR 使用される正確な式は何lm() ですか?どうすれば解釈できますか?

調整されたr-2乗式

調整されたR-2乗を計算するためのいくつかの式が存在するようです。

  • ウェリーの式:1(1R2)(n1)(nv)
  • マクネマーの式:1(1R2)(n1)(nv1)
  • 主の公式:1(1R2)(n+v1)(nv1)
  • スタインの式:1[(n1)(nk1)(n2)(nk2)(n+1)n](1R2)

教科書の説明

  • Fieldの教科書によると、Rを使用した統計の発見(2012、p。273)Rは、Wherryの方程式を使用します。彼は、Wherryの公式を示していません。彼は、Steinの式を(手で)使用して、モデルがどのように交差検証されるかを確認することを推奨します。
  • Kleiber / Zeileis、Applied Econometrics with R(2008、p。59)は、「Theilの調整済みR 2乗」であると主張し、その解釈が複数のR 2乗からどのように変化するかを正確に述べていません。
  • Dalgaard、Introductory Statistics with R(2008、p。113)は、「[調整されたRの2乗]を100%掛けると、「%分散の減少」と解釈できる」と書いています。彼は、これがどの式に対応するかについては述べていません。

私は以前、R乗がモデルに追加の変数を追加するとペナルティを与えると考え、広く読んでいました。現在、これらの異なる式の使用は、異なる解釈を必要とするようです。また、スタックオーバーフロー(単一変量最小二乗回帰における複数R 2乗と調整R 2乗の違いは何ですか?)、およびUPennにあるウォートンスクールの統計辞書に関する関連する質問も調べました。

ご質問

  • Rによって調整されたr平方に使用される式はどれ lm()ですか?
  • どうすれば解釈できますか?

8
summary.lm()から: ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)、ここでans $ r.squared = R ^ 2; n = n、rdf =残差df、df.int = dfのインターセプト(0または1)。
-EDi

ここでは、「どのようなR ^ 2 ...」ではない実際の問題に対する答えを提供します。あなた(および他の多くの人)に欠けている情報はこれです。すべてのRパッケージ(コアを含む)がソースコードを利用可能にします。ディストリビューションでコンパイルされたものでさえ、CRANまたは他のリポジトリの{pac​​kagenames} .tar.gzで利用可能です。
カール・ウィットフト

OP:このすばらしい情報をありがとうございます。2番目の質問:どうすれば解釈できますか?Adjのさまざまな解釈を読みました。ときどきWherryの式ではない式に基づいているように見えるR 2乗?

回答:


29

1. lmR のどの式が調整されたr平方に使用しますか?

既に述べたように、入力summary.lmすると、Rが調整済みR平方を計算するために使用するコードが得られます。最も関連する行を抽出する:

ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)

数学表記では次のように対応します。

Radj2=1(1R2)n1np1

df.int=1nprdfn-p-1

npnp1

2.調整されたr平方の式が多数あるのはなぜですか?

Radj2ρ2ρ2

R2Radj2

Radj2

Radj2ρ2ρ2R2

参照資料

  • R2

9

最初の質問について:計算方法がわからない場合は、コードを見てください!あなたが入力した場合summary.lm、あなたのコンソールでは、この関数のコードを取得します。コードをざっと目を通すと、次の行が見つかりますans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)。この行の上にいくつかの行を見ると、次のことがわかります。

  • ans$r.squaredR2
  • n 残差の数=観測値の数
  • df.int 0または1(切片があるかどうかによります)
  • rdf あなたの残留dfです

R2R2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.