通常の線形モデルの「真の勾配」は、xの 1ポイントの増加により平均応答がどの程度変化するかを示します。正規性と等分散性を仮定することにより、応答の条件付き分布のすべての分位数はそれに沿って移動します。時には、これらの仮定は、非常に非現実的です:条件付分布の分散や歪度は依存Xと増加したときので、その分位は、自分の速度で移動のxをバツバツバツ。QRでは、非常に異なる勾配推定からこれがすぐにわかります。OLSは平均(つまり、平均分位点)のみを考慮するため、各分位点を個別にモデル化することはできません。そこでは、分位数についてステートメントを作成するときに、条件付き分布の固定形状の仮定に完全に依存しています。
編集:コメントを埋め込み、説明する
条件付き平均と固定分散を介して条件付き分位数を常に計算できるため、そのような強い仮定をしたい場合は、QRを実行してもあまり意味がありません。すべての変位値の「真の」勾配は、平均の真の勾配と等しくなります。もちろん、特定のサンプルでは、ランダムな変動があります。または、あなたの厳密な仮定が間違っていたことに気付くかもしれません...
y= X + X ε 、ε 〜N(0 、1 )IID 、
yバツ
- 対称的な条件付き分布のため、平均と中央値の回帰直線は本質的に同じです。勾配は1です。
- 80%分位点の回帰直線はより急勾配(勾配1.9)ですが、20%分位点の回帰線はほぼ一定(勾配0.3)です。これは、極端に不平等な分散に適しています。
- バツ
画像を生成するコード:
library(quantreg)
set.seed(3249)
n <- 1000
x <- seq(0, 1, length.out = n)
y <- rnorm(n, mean = x, sd = x)
plot(y~x)
(fit_lm <- lm(y~x)) # intercept: 0.02445, slope: 1.04858
abline(fit_lm, lwd = 3)
# quantile cuts
taus <- c(0.2, 0.5, 0.8)
(fit_rq <- rq(y~x, tau = taus))
# tau= 0.2 tau= 0.5 tau= 0.8
# (Intercept) 0.00108228 -0.0005110046 0.001089583
# x 0.29960652 1.0954521888 1.918622442
lapply(seq_along(taus), function(i) abline(coef(fit_rq)[, i], lwd = 2, lty = 2, col = "red"))