多項式回帰が非線形関係をモデル化する場合、多重線形回帰の特殊なケースとはどのように考えられますか?
ウィキペディアは、「多項式回帰は非線形モデルをデータに適合させますが、統計的推定問題として線形ですが、推定される未知のパラメーターでは回帰関数は線形です。データから。」
パラメーターが次数 2の項の係数である場合、未知のパラメーターで多項式回帰はどのように線形になりますか?
多項式回帰が非線形関係をモデル化する場合、多重線形回帰の特殊なケースとはどのように考えられますか?
ウィキペディアは、「多項式回帰は非線形モデルをデータに適合させますが、統計的推定問題として線形ですが、推定される未知のパラメーターでは回帰関数は線形です。データから。」
パラメーターが次数 2の項の係数である場合、未知のパラメーターで多項式回帰はどのように線形になりますか?
回答:
などの回帰モデルを近似すると、モデルとOLS推定器はが単に、それは別の変数であると単に「考える」。もちろん、ある程度の共線性があり、それはフィットに組み込まれます(たとえば、標準誤差は他の場合よりも大きくなります)が、変数のペアの多くは、一方が他方の関数になることなく、ある程度共線性になります。 xは 2をI X、I
は、最終的にと間の曲線関係をキャプチャするために変換して含めたと同じ変数であることがわかっているため、モデルに実際に2つの別個の変数があることを認識しません。と間に曲線関係があるという信念と相まって、真の性質に関する知識は、モデルの観点からまだ線形である方法を理解することを難しくしています。さらに、とを視覚化し x i x i y i x 2 i x i y i x i x 2 i x 、y一緒に、2D平面への3D関数の周辺投影を見てください。
としかない場合は、完全な3D空間でそれらを視覚化してみることができます(実際に何が起こっているかを見るのはまだかなり難しいですが)。完全な3D空間で近似関数を見た場合、近似関数は2D平面であり、さらに平面であることがわかります。私が言うように、データはその3D空間を通る曲線に沿ってのみ存在するため、よく見るのは困難です(その事実はそれらの共線性の視覚的表現です)。ここでそれを試みることができます。これが適合モデルだと想像してください: x 2 i x i、x 2 i
x = seq(from=0, to=10, by=.5)
x2 = x**2
y = 3 + x - .05*x2
d.mat = data.frame(X1=x, X2=x2, Y=y)
# 2D plot
plot(x, y, pch=1, ylim=c(0,11), col="red",
main="Marginal projection onto the 2D X,Y plane")
lines(x, y, col="lightblue")
# 3D plot
library(scatterplot3d)
s = scatterplot3d(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, color="gray", pch=1,
xlab="X1", ylab="X2", zlab="Y", xlim=c(0, 11), ylim=c(0,101),
zlim=c(0, 11), type="h", main="In pseudo-3D space")
s$points(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, col="red", pch=1)
s$plane3d(Intercept=3, x.coef=1, y.coef=-.05, col="lightblue")
これらの画像では、rgl
パッケージを使用して同じデータで作成された回転3Dフィギュアのスクリーンショットが見やすくなる場合があります。
「パラメーターが線形」であるモデルが実際に線形であると言うとき、これは単なる数学的so弁ではありません。変数は、フィッティングされにおける次元の超平面(この例では、3D空間における2D平面)次元超空間を。その超平面は本当に「平坦」/「線形」です。それは単なる隠phorではありません。 p p