「残留標準誤差」と言うのはなぜですか?


14

標準誤差は、推定された標準偏差であるσθ推定器のθパラメータのためのθσ^(θ^)θ^θ

なぜ残差の推定標準偏差は「残差標準誤差」と呼ばれ(例えば、Rのsummary.lm関数の出力)、「残差標準偏差」ではないのですか?ここで、どのパラメータ推定値に標準誤差を装備しますか?

各残差を「その」誤差項の推定量と見なし、これらすべての推定量の「プールされた」標準誤差を推定しますか?


6
それはRだと思う。他のソフトウェアが必ずしもそのフレージングを使用しているとは思わない。「残留標準偏差」は教科書では一般的だ 答えはありませんが、Rがそのフレーズを使用しているのはおかしいといつも思っていました。
GUNG -復活モニカ

@gung:それが説明かもしれません!引用符で囲まれた「残留標準誤差を」グーグルとき、私は引用符よりも、ヒットのわずか0.1%を取得...
マイケル・M

あなたが望むなら、それを(非)答えとして置くことができます。
GUNG -復活モニカ

1
@gung特定のソフトウェアを使用してあなたの思考を形作る方法は面白いです。私はそれを「残余SD」と呼ぶことはありません-残差はデータではなくエラーなので、残差エラーは適切な名前のようです。しかし、あなたがそれについて考えるならば、それは本当にR-物のようです。
ティム

2
@Tim、それは誤差の標準偏差の推定と正しく考えられるかもしれませんが、残差は技術的には誤差そのものではありません。また、エラーSDの標準エラーでもありません。
GUNG -復活モニカ

回答:


12

フレージングは​​Rのsummary.lm()出力に固有のものだと思います。基になる値は実際には「シグマ」(summary.lm()$sigma)と呼ばれることに注意してください。他のソフトウェアが必ずしも残差の標準偏差にその名前を使用するとは思わない。さらに、「残差標準偏差」という言い回しは、たとえば教科書では一般的です。それがどのようにRのsummary.lm()出力で使用されるフレージングになったのかはわかりませんが、それはいつも奇妙だと思っていました。


とはどうsummary.lm(reg)$sigma違いsd(reg$residuals)ますか?
空爆

3
@AndréTerra、正しい自由度はn-pです。これは、サマリーが使用するものです。sdは、n-1自由度を使用するvarを使用します。n-pで除算した残差の標準偏差を手動で計算すると、サマリーが提供するものと同じ答えが得られます。
-Jdub

3
gungを裏付けるために、私はRのドキュメントから引用しますstats::sigma誤った「残余標準エラー」は、あまりにも多くのR(およびS)出力の一部であり、そこで簡単に変更できません。
NRH

2

私の計量経済学のトレーニングでは、実際の「残留標準偏差」の推定値であるため、「残留標準誤差」と呼ばれています。この用語を裏付けるこの関連する質問参照してください

残差標準誤差という用語のGoogle検索でも多くのヒットが表示されるため、決してR奇数ではありません。両方の用語を引用符で試してみましたが、どちらも約60,000回表示されます。


面白い。しかし、なぜランダム変数の標準偏差の推定値(エラー項のような、特定の推定量ではない)を「標準誤差」と呼ぶのでしょうか?
マイケルM

私の考えでは(実際の値と区別するために)見積もりの​​名前が必要です。どんな名前でも別のものと同じくらい良いです。しかし、確かに語源についてより多くの知識を持っている人がより良い理由を提供できます。係数の標準誤差とは必ず一致することに注意してください。これは、係数推定値の標準偏差の推定値です。
ハイゼンベルク

0

簡単に言えば、サンプルの標準誤差は、サンプル平均が母平均からどれだけ離れているかの推定値であり、サンプルの標準偏差は、サンプル内の個体がサンプル平均とどの程度異なるかです。

標準エラー-ウィキペディア、無料​​の百科事典


6
これは本当ですが、実際には質問に答えていません。Rが「残留標準誤差」と呼ぶものは、「標本平均が母平均からどれだけ離れている可能性が高いかの推定値」ではありません。
GUNG -復活モニカ

0

近似回帰モデルは、パラメーターを使用してポイント推定予測を生成します。これは、同じXX値を使用してスタディを無限回数複製する場合線形モデルがtrueの場合)、観測応答の平均です。

これらの予測値とモデルの適合に使用される予測値の違いは「残差」と呼ばれ、データ収集プロセスをレプリケートするときに、平均が0のランダム変数のプロパティを持ちます。次に、観測された残差を使用して、これらの値の変動性を推定し、パラメーターのサンプリング分布を推定します。

注意:

残差標準誤差が正確に0の場合、モデルはデータに完全に適合します(過剰適合の可能性が高いため)。

残留標準誤差が無条件応答の変動性と大きく異なることを示すことができない場合、線形モデルに予測能力があることを示唆する証拠はほとんどありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.