線形回帰係数の標準誤差を導き出す方法


20

この単変量線形回帰モデル データセット場合、係数推定は ここで私の質問によれば、 bookおよびWikipedia、の標準エラーは 方法と理由 D = { X 1Y 1X NY N} β 1 = Σ I X I 、Y I - N ˉ X ˉ Y

y=β0+β1バツ+ϵ
D={バツ1y1バツnyn} β 0= ˉ Y - β 1 ˉ X
β^1=バツynバツ¯y¯nバツ¯2バツ2
β^0=y¯β^1バツ¯
、S β 1=β^1
sβ^1=ϵ^2n2バツバツ¯2


@ocram、ありがとう、しかし、私はマトリックスのようなものを扱う能力があまりないので、試してみます。
アボカド14

1
@ocram、私はすでにそれがどのように来るかを理解しています。しかし、まだ質問:私の投稿では、標準エラーにはn2がありますが、あなたの答えによれば、そうではないのはなぜですか?
アボカド14

回答:


15

上記の3番目のコメント:それがどのように発生するかは既に理解しています。しかし、まだ質問:私の投稿では、標準エラーには(n-2)がありますが、あなたの答えによれば、そうではないのはなぜですか?


私のポストは、その発見された

se^b^=nσ^2nバツ2バツ2
分母は n \ sum_i(x_i-\ bar {x})^ 2 と書くことができます。
nバツバツ¯2
したがって、
se^b^=σ^2バツバツ¯2

σ^2=1n2ϵ^2
ANOVAテーブルのすなわち平均二乗誤差(MSE)、私たちはあなたの表現で終わります用se^b^n2という用語は、切片と傾きの推定における2自由度の損失を占めます。

1
私は他のすべてが最後の部分を期待していると思う。なぜかを段階的に示すことができますか?私もそれが自由度に関係していることを知っていますが、数学はわかりません。σ^2=1n2ϵ^2
-Mappi

2

n-2 dfのもう1つの考え方は、2つの手段を使用して勾配係数(YとXの平均)を推定するためです。

Wikipediaのdf: "...一般に、パラメータの推定の自由度は、推定に入る独立スコアの数から、パラメータ自体の推定の中間ステップとして使用されるパラメータの数を引いたものに等しい」


2
これは直感そのものですが、実際にはそのような派生物ではありません。ただし、これに関連する微妙な点については、自由度を理解する方法を
シルバーフィッシュ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.