線形回帰モデルですべてのサンプル観測を繰り返し、回帰を再実行すると、結果にどのような影響がありますか?


15

N個の観測値、おそらく複数の因子があり、各観測値を2回(またはM回)繰り返すと、このサイズNMの新しいセットの回帰は元の観測値の回帰と比較してどうですか?

回答:


13

概念的には、「新しい」情報を追加することはありませんが、その情報をより正確に「知る」ことができます。

したがって、これにより、標準誤差が小さくなり、同じ回帰係数が得られます。

たとえば、Stataでは、expand x関数は各観測値をx回複製します。

sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515    .001586    -2.43   0.018    -.0070138   -.0006891
      length |  -.0795935   .0553577    -1.44   0.155    -.1899736    .0307867
       _cons |   47.88487    6.08787     7.87   0.000       35.746    60.02374
------------------------------------------------------------------------------

expand 5

regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515   .0006976    -5.52   0.000    -.0052232   -.0024797
      length |  -.0795935   .0243486    -3.27   0.001    -.1274738   -.0317131
       _cons |   47.88487   2.677698    17.88   0.000     42.61932    53.15043
------------------------------------------------------------------------------

ご覧のとおり、以前は取るに足らない係数(長さ)が拡張モデルで統計的に重要になり、知っていることを「知っている」精度を表します。


はい、標準エラーは実際にダウンします。このために重み付き線形回帰を推奨する人もいます。これを修正する方法はありますか?
BBDynSys

3

w=argminw||バツwy||2
バツyMM

同意しましたが、NからNMに変更された場合、t統計と標準エラーは変更されると思いますか
パレスチャン

MNPNPM
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.