等分散誤差項に直面したときに、Quantile Regressionと比較したOLSの勾配係数について質問があります。人口モデルは次のようになります。
と iidエラー条件であること。推定された勾配係数は 同じ値に収束する OLSとQRの異なる分位点?サンプル推定 お互いに異なるかもしれません。
QR推定量の収束を考えると、等分散性が存在する場合、異なる分位点回帰のすべての勾配パラメーターが同じ値に収束することがわかります(Koenker 2005:12に示されているように)。しかし、OLS係数の収束がどのように QR(LAD)係数の中央値と比較します 例えば。両方が同じ値に収束するという証拠はありますか?私の直感は、これが事実であるべきだと私に告げています。
その答えは、おそらくOLSとQRの損失関数にあります。OLSは二乗残差を最小化し、QR(中央値)は絶対偏差を最小化します。したがって、誤差は二乗されるため、OLSはQRではなく外れ値により大きな重みを付けます。しかし、等分散性の場合、正のエラーは負のエラーと同じくらい可能性が高く、OLSと中央値のQRスロープ係数は等価(少なくとも収束に関して)であるため、外れ値は互いに打ち消し合いませんか?
更新等
分散性の場合、異なる分位点の勾配係数は同等であるという予測をテストするために、スタタでテストを実行しました。これは、前述のKoenker(2005)の結果を確認するためだけに行われます。元の質問は、QRと比較したOLSの収束に関するものです。Stataでn = 2000の観測を作成しました。
set obs 2000
set seed 98034
generate u = rnormal(0,8)
generate x = runiform(0,50)
generate y = 1 + x + u
このサンプルでは、分位点(0.10、0.50、0.90)に対してQR回帰を実行し、3つの分位点の勾配係数が同一であるという共同仮説をテストしました。
これは対応するstataコードです:
sqreg y x, quantile(.1, .5, .9) reps(400)
test [q10=q50=q90]: x
証拠は圧倒的でした、H0は非常に強く拒否することができませんでした。Waldテストの出力:
F( 2, 1998) = 0.79
Prob > F = 0.4524
これは私の考えを再確認しましたが、これが常に期待されるべきかどうかについての理論的なガイダンスは提供していません。