回帰におけるR二乗とp値の関係は何ですか?


17

tl; dr-OLS回帰の場合、Rの2乗が大きいほどP値も高いことを意味しますか?特に単一の説明変数(Y = a + bX + e)についてですが、n個の複数の説明変数(Y = a + b1X + ... bnX + e)についても知りたいと思います。

コンテキスト-変数の範囲でOLS回帰を実行し、線形、対数など、各説明(独立)変数の変換の間のR 2乗値を含むテーブルを作成することにより、最適な説明関数形式を開発しようとしています。および応答(従属)変数。これは少し似ています:

変数名--linear form-- --ln(variable)--exp(variable)-... etc

変数1 ------- R-squared ---- R-squared ---- R-squared-...
など...

Rの2乗が適切か、またはP値の方が良いかどうか疑問に思っています。より重要な関係はより高い説明力を意味するが、それが厳密な方法で真実であるかどうかはわからないため、おそらく何らかの関係があります。


5
また興味深いもの:R ^ 2は便利ですか、危険ですか?
whuber

回答:


15

答えはノーですは独立変数の分散に大きく依存するため、と全体の回帰p値の間にそのような規則的な関係はありません。は反比例です)、任意の量で独立変数の分散を自由に変更できます。R2R2

例として、多変量データのセット考えます私はケースをインデックスと仮定し、その最初の独立変数の値の集合、 { X I 1 }、一意の最大有する X *正の量によって、2番目に高い値から分離 εを。以下のすべての値を送信する最初の変数の非線形変換を適用します((xi1,xi2,,xip,yi))i{xi1}xϵ範囲 [ 0 1 ]と送る Xは*いくつかの大きな値にそれ自体を M » 1。このようなために M、これは適切な(スケーリング)のBox-Cox変換によって行うことができる X X - X 0 λ - 1 /λ - 1 、例えば、私たちが話していないので奇妙なまたは「病的」なもの。次に、 Mxϵ/2[0,1]xM1Mxa((xx0)λ1)/(λ1))M任意の大きさに成長、近づくと1を、密接にあなたのようにしてくださいかかわらず、最初の独立変数の分散は漸近的に比例している間、残差の分散が制限されますので、フィット感があり、どのように悪いのM 2R21M2


代わりに、適合度テスト(他の手法の中でも)を使用して、探索で適切なモデルを選択する必要があります。適合度と残差の等分散考慮する必要があります。また、信頼に関する結果の回帰からp値を取得しないでください。この演習を行った後、それらは最終的にほとんど意味がなくなります。なぜなら、それらの解釈は、独立変数の表現の選択が従属変数はまったくありませんが、ここではほとんどありません。


10

この答えは中心的な質問を直接扱っていません。コメントには長すぎる追加情報にすぎません。

私はこれを指摘します、なぜなら計量統計の質問は間違いなくこの情報、またはある時点でそれに似たものに遭遇し(R 2関連していると述べて)、ここの他の回答で与えられた情報が間違っているかどうか疑問に思う-それは間違っていない-と思う何が起こっているのかを明確にすることは有益です。FR2

特定の状況下では関係があります。与えられたモデルに対して固定された観測数と予測子の数を保持する場合、は実際にはR 2で単調です。FR2

F=R2/(k1)(1R2)/(Nk)

(分子と分母をで除算し、kの定数を引き出した場合、Nkの定数を保持すると1 / F 1 / R 21になることがわかります。)R2k1/F1/R21Nk

固定df とp値は単調に関連しているため、R 2p値も単調に関連しています。FR2p

しかし、モデルについてはほとんど何も変更せず、その関係は、変更された環境全体に当てはまりません。

(Nk)/(k1)R2FR2 (Nk)/(k1)R2R2F

R2p


pR2

別の質問に答えています。そして、私はあなたの意味の解釈が正しいと信じています。説明しなければ、私が提起したような問題が混乱を招くのではないかと心配しました。私の理解では、あなたのすべてのポイントが保持されます。(実際、私は、私が望んでいたように、おそらく私の答えが明確にするのに役立たず、問題を混乱させるだけではないかと心配しています。それを助ける適切な修正があると思いますか?
Glen_b -Reinstateモニカ

グレン、削除されたくない。変更する場合は、この問題のどの側面について書いているかを明確に指摘することを検討してください(たとえば、「与えられたモデル」とはどういう意味か、「異なる特性」を持つモデルについて何を考えているか)。これが私が意見を述べた精神(共同的であり、批判的ではない)でした。
whuber

私はあなたに批判されたとは感じませんでした-あなたは明らかにしているようで、それ以上何もありません-それの必要性は、あなたがコメントする前に私が心配していた答えの不十分さを強調しています。「異なる特性」の曖昧さは、それが非常に一般的なものであるためです-多くのことを変化させます蒸発する。これから私が言いたいことを考えます。
Glen_b -Reinstateモニカ

F

3

「OLS回帰の場合、Rの2乗が大きいとPの値も高くなりますか?特に単一の説明変数(Y = a + bX + e)の場合」

R2FtR2ptR2

|t|=R2(1R2)(n2)

nR2t

「しかし、n個の複数の説明変数(Y = a + b1X + ... bnX + e)についても知りたいと思います。」

Fn

コンテキスト-さまざまな変数でOLS回帰を実行しており、最適な説明的な関数形式を開発しようとしています(...)

R2

R2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.