OLS線形回帰に関連付けられた曲線の信頼帯の形の起源と、回帰パラメーター(勾配と切片)の信頼区間との関係を理解しようとしています。たとえば(Rを使用):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
バンドは、2.5%インターセプト、97.5%勾配、および97.5%インターセプト、2.5%勾配(完全ではありませんが)で計算された線の限界に関連しているようです。
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
私が理解していないのは2つのことです:
- 2.5%の勾配と2.5%の切片、および97.5%の勾配と97.5%の切片の組み合わせはどうですか?これらは、明らかにプロットされたバンドの外側にある線を与えます。信頼区間の意味が理解できないかもしれませんが、95%のケースで私の推定が信頼区間内にある場合、これらは可能な結果のように見えますか?
- 上限と下限の間の最小距離(つまり、2本の線が交差する点の近く)を決定するものは何ですか?
これらのバンドが実際にどのように計算されるかわからないので、両方の疑問が生じると思います。
回帰パラメーターの信頼区間を使用して(predict()または同様の関数に手作業で依存せずに)上限と下限を計算するにはどうすればよいですか?Rのpredict.lm関数を解読しようとしましたが、コーディングは私を超えています。関連する文献や統計の初心者に適した説明へのポインタをいただければ幸いです。
ありがとう。