残留標準誤差とは何ですか?


35

Rで重回帰モデルを実行する場合、出力の1つは自由度95,161で0.0589の残留標準誤差です。95,161の自由度は、サンプルの観測数とモデルの変数の数の差によって与えられることを知っています。残留標準誤差とは何ですか?


2
この質問とその回答が役立つ可能性があります。なぜ残留標準誤差を言うのですか?
アントワーヌヴェルネ

簡単な質問:「残留標準誤差」は「残留標準偏差」と同じですか?GelmanとHill(p.41、2007)は、それらを同じ意味で使用しているようです。
JetLag

回答:


26

近似回帰モデルは、パラメータを使用してポイント推定予測を生成します。これは、同じ値を使用してスタディを無限回数複製する場合(および線形モデルがtrueの場合)、観測応答の平均です。これらの予測値とモデルの近似に使用される予測値との差は「残差」と呼ばれ、データ収集プロセスを複製するときに、平均が0のランダム変数のプロパティを持ちます。バツ

その後、観測された残差を使用して、これらの値の変動性を推定し、パラメーターのサンプリング分布を推定します。残差標準誤差が正確に0の場合、モデルはデータに完全に適合します(過剰適合の可能性が高いため)。残留標準誤差が無条件応答の変動性と大きく異なることを示すことができない場合、線形モデルに予測能力があることを示唆する証拠はほとんどありません。


3
これは以前に回答された可能性があります。この質問が必要な答えを提供しているかどうかを確認してください。[1] [1]〜[RのLM()出力の解釈]:stats.stackexchange.com/questions/5135/...は
doug.numbers

26

次のANOVAテーブル(Rのexample(aov)コマンドから適応)があるとします。

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

任意の変動源(モデルまたは残差)の平方和をそれぞれの自由度で除算すると、平均平方が得られます。特に残差について:

306.34=76.57576.57

したがって、76.57は残差の平均二乗、つまり応答変数の残差(モデルを適用した後)の変化量です。

残留標準誤差について、あなたは求めてきましたが以外の何ものでもありません平均二乗誤差の正の平方根。私の例では、残留標準誤差はに等しくなります76.57


1
@AdamOからの回答をアップ投票しました。なぜなら、回帰を最も頻繁に直接使用する人として、その答えは私にとって最も簡単だったからです。ただし、ANOVAと線形回帰の間の表記法/概念/方法論の関係を示しているため、この回答に感謝します。
スヴァンノイ

12

Y=β0+β1バツ+ϵ
ϵバツ

β0β1ϵϵ

RSEについては、「統計学習の概要」でかなり明確に説明されています。


2
ϵRSE=RSSn2

1
ISLのepubを読んでいる人は誰でも、ctrl-f「残余標準エラー」で「66ページ」を見つけることができます。(Epubファイルには実際のページ番号はありません)。
user2426679
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.