標準誤差は、推定された標準偏差であるσ(θ)推定器のθパラメータのためのθ。
なぜ残差の推定標準偏差は「残差標準誤差」と呼ばれ(例えば、Rのsummary.lm
関数の出力)、「残差標準偏差」ではないのですか?ここで、どのパラメータ推定値に標準誤差を装備しますか?
各残差を「その」誤差項の推定量と見なし、これらすべての推定量の「プールされた」標準誤差を推定しますか?
標準誤差は、推定された標準偏差であるσ(θ)推定器のθパラメータのためのθ。
なぜ残差の推定標準偏差は「残差標準誤差」と呼ばれ(例えば、Rのsummary.lm
関数の出力)、「残差標準偏差」ではないのですか?ここで、どのパラメータ推定値に標準誤差を装備しますか?
各残差を「その」誤差項の推定量と見なし、これらすべての推定量の「プールされた」標準誤差を推定しますか?
回答:
フレージングはRのsummary.lm()
出力に固有のものだと思います。基になる値は実際には「シグマ」(summary.lm()$sigma
)と呼ばれることに注意してください。他のソフトウェアが必ずしも残差の標準偏差にその名前を使用するとは思わない。さらに、「残差標準偏差」という言い回しは、たとえば教科書では一般的です。それがどのようにRのsummary.lm()
出力で使用されるフレージングになったのかはわかりませんが、それはいつも奇妙だと思っていました。
summary.lm(reg)$sigma
違いsd(reg$residuals)
ますか?
stats::sigma
:誤った「残余標準エラー」は、あまりにも多くのR(およびS)出力の一部であり、そこで簡単に変更できません。
私の計量経済学のトレーニングでは、実際の「残留標準偏差」の推定値であるため、「残留標準誤差」と呼ばれています。この用語を裏付けるこの関連する質問を参照してください。
残差標準誤差という用語のGoogle検索でも多くのヒットが表示されるため、決してR奇数ではありません。両方の用語を引用符で試してみましたが、どちらも約60,000回表示されます。
簡単に言えば、サンプルの標準誤差は、サンプル平均が母平均からどれだけ離れているかの推定値であり、サンプルの標準偏差は、サンプル内の個体がサンプル平均とどの程度異なるかです。
近似回帰モデルは、パラメーターを使用してポイント推定予測を生成します。これは、同じXX値を使用してスタディを無限回数複製する場合(線形モデルがtrueの場合)、観測応答の平均です。
これらの予測値とモデルの適合に使用される予測値の違いは「残差」と呼ばれ、データ収集プロセスをレプリケートするときに、平均が0のランダム変数のプロパティを持ちます。次に、観測された残差を使用して、これらの値の変動性を推定し、パラメーターのサンプリング分布を推定します。
残差標準誤差が正確に0の場合、モデルはデータに完全に適合します(過剰適合の可能性が高いため)。
残留標準誤差が無条件応答の変動性と大きく異なることを示すことができない場合、線形モデルに予測能力があることを示唆する証拠はほとんどありません。