重回帰では、部分的なを合計して合計にする必要がありますか?


12

以下は、mtcarsデータセットから作成されたモデルです。

> ols(mpg~wt+am+qsec, mtcars)

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

合計が0.85 のモデルは良いようです。ただし、次のプロットで見られる部分的な値は、この値に加算されません。合計すると約0.28になります。R 2R2R2

> plot(anova(mod), what='partial R2')

ここに画像の説明を入力してください

すべての部分合計と合計間に関係はありますか?分析はパッケージで行われます。R 2R2R2rms


1
(アメーバによる非常に良い答えに加えて)標準化された回帰係数と偏相関stats.stackexchange.com/q/76815/3277に関する密接な質問。
ttnphns 2015年

回答:


11

番号。

特定の予測子の部分的なを理解する1つの方法は、他のすべての予測子で独立変数を最初に回帰し、残差を取り、残りの予測子でそれらを回帰した場合に得られる等しいことです。R 2R2R2

たとえば、すべての予測子が完全に同一(共線)である場合、まともな持つことができますが、すべての予測子の部分的なは正確にゼロになります。R2R2

一緒にすべての予測子は、完全すなわち従属変数を説明する一方、、次に部分各予測のためになります何が他のすべての予測子によって原因不明されているので、あまりにも完全に残っていることによって説明することができます1。R 2 1R2=1R21

したがって、すべての部分的なの合計は、合計下回ったり上回ったりする可能性があります。すべての予測子が直交していても、一致する必要はありません。部分的なは少し奇妙な尺度です。R 2 R 2R2R2R2

詳細については、この長いスレッドを参照してください。重回帰における予測子の重要性:部分的なと標準化された係数R2


非常に明確な説明をありがとう。これは、この質問の状況でも発生している可能性があります:stats.stackexchange.com/questions/155447/…。次に、部分R ^ 2は個々の予測子の重要性または貢献度の妥当な指標ですか?または、「プロポーションR ^ 2」または「残りのR ^ 2」または「チスク」または「チスクマイナスDF」または「プロポーションチスク」または「aic」のような何かを提案しますか?これらはすべてrmsパッケージで入手できます。または標準化された係数?
rnso

はい、なぜその質問が不明確なまま保留されたのかはわかりません。私はそれは明らかだと思います(そしてこれのほぼ複製ですが、間違いなく完全ではありません)。予測因子の重要性の合理的な指標について:私は強く私は私の答え、中にリンクされているスレッド読むためにあなたを招待し、正確にこの質問についてを。そこにも私自身の答えがあります。そこでは、いくつかのさまざまな指標の概要を説明します。それらにはすべてさまざまな欠点があります。この問題に対する完全な解決策はないようです(そうすることはできません)。
アメーバはモニカを復活

2つのモデルがどのように異なっているかについてはまったく説明されていなかったので、不明確なものとして保留にした。おそらく私は、その特定の状況に対する答えが求められていると考えるのは間違っていました。この回答を踏まえ、どちらかが再オープンが必要だと思いますか?
Scortchi-モニカを回復

したがって、部分的なR2は1つのグラフ内で比較可能であり、2つのグラフ間では比較できません。また、「部分的なR2」は、実際の合計R2への寄与を示しているわけではないため、それは誤称です。私はここで答えを得たので、今、他の質問の必要はありません。
rnso

私はすべての回答に賛成しています。それでも私は私の質問の大部分を受け入れました。
rnso
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.