与えられたのデータ点(X I、Y I)、iが= 1 、2 、... nは、平面内に、私たちは直線描画せ
Y = A X + bは。我々は予測した場合、X I + Bの値としてY IのY iが、その後エラーがある(Y I - Y I)= (Yn(xi,yi),i=1,2,…ny=ax+baxi+by^iyi、二乗誤差は
(y i − a x i − b )2、総二乗誤差 ∑ n i = 1(y i − a x i − b )2です。お願いします(yi−y^i)=(yi−axi−b)(yi−axi−b)2 ∑ni=1(yi−axi−b)2
と bのどの選択がS = n ∑ i = 1(y i − a x i − b )2を最小化する
か?abS=∑i=1n(yi−axi−b)2
以来の垂直距離である(X I、Y I)直線から、我々はこのような点からの垂直距離の二乗の和そのラインを求めています行は可能な限り小さい。今Sは 両方の二次関数であり、AとBとするとき、その最小値に達すると、bはそのようなものである
∂ S(yi−axi−b)(xi,yi)Sabab
2番目の式から、b=1が得られます
∂S∂a∂S∂b=2∑i=1n(yi−axi−b)(−xi)=2∑i=1n(yi−axi−b)(−1)=0=0
μY=1b=1n∑i=1n(yi−axi)=μy−aμx
は、それぞれ
yiと
xiの算術平均値です。最初の式に代入すると、
a=( 1μy=1n∑i=1nyi, μx=1n∑i=1nxiyixi
したがって、最小にする線
Sをとして表すことができ
、Y=AX+B=μY+((1a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x.
Sy=ax+b=μy+((1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x)(x−μx),
SSmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1x2i)−μ2x.
我々はの役割交換した場合と、ライン描画
、との値を求める
と最小
つまり、からの点の水平距離の二乗和が行が可能な限り小さい場合、次のようになりますxyx=a^y+b^a^b^
T=∑i=1n(xi−a^yi−b^)2,
x=a^y+b^=μx+((1n∑ni=1xiyi)−μxμy(1n∑ni=1y2i)−μ2y)(y−μy)
および最小値は
TTmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1y2i)−μ2y.
両方の線がポイント
が、勾配は
は一般的に異なります。実際、@ whuberがコメントで指摘しているように、すべてのポイントが同じ直線上にある場合、傾きは同じです。これを確認するには、
(μx,μy)
a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x, a^−1=(1n∑ni=1y2i)−μ2y(1n∑ni=1xiyi)−μxμy
(xi,yi)a^−1−a=Smin(1n∑ni=1xiyi)−μxμy=0⇒Smin=0⇒yi=axi+b,i=1,2,…,n.