モデルの定数項が存在する場合、の列空間にあるX(そうであるようˉ Y 1 N後で有用に来ます)。フィットYは観察さの正射影であるYその列空間によって形成された平坦な上。この手段残差のベクトルE = Y - yはフラットに垂直であり、したがってに1個のN。内積を考慮すると、∑ n i = 1 e i = 0であることがわかるので、1nXY¯1nY^Ye=y−y^1n∑ni=1ei=0は合計がゼロでなければなりません。以来、 Y iが = ^ Y I + E iが、我々は、と結論 Σ N iは= 1 Yをiが = Σ N iは= 1 ^ Yをiは両嵌合観測された応答は、平均有すること ˉ Yを。eYi=Yi^+ei∑ni=1Yi=∑ni=1Yi^Y¯
図中の破線は表し及びY - ˉ Y 1 、Nであり、中心に観察し、フィット応答のベクター。角度の余弦θこれらのベクトルの間の故の相関になりY及びYの定義により、複数の相関係数である、R。これらのベクターは、残差のベクトルと三角形を形成するので直角れるY - ˉ Y 1 Nフラットにあるものの Y−Y¯1nY^−Y¯1nθYY^RY^−Y¯1nはそれに直交します。したがって:e
R=cos(θ)=adjhyp=∥Y^−Y¯1n∥∥Y−Y¯1n∥
ピタゴラスを三角形に適用することもできます。
∥Y−Y¯1n∥2=∥Y−Y^∥2+∥Y^−Y¯1n∥2
これは次のようによく知られています:
∑i=1n(Yi−Y¯)2=∑i=1n(Yi−Y^i)2+∑i=1n(Y^i−Y¯)2
これは二乗和の分解、です。SStotal=SSresidual+SSregression
決定係数の標準定義は次のとおりです。
R2=1−SSresidualSStotal=1−∑ni=1(yi−y^i)2∑ni=1(yi−y¯)2=1−∥Y−Y^∥2∥Y−Y¯1n∥2
When the sums of squares can be partitioned, it takes some straightforward algebra to show this is equivalent to the "proportion of variance explained" formulation,
R2=SSregressionSStotal=∑ni=1(y^i−y¯)2∑ni=1(yi−y¯)2=∥Y^−Y¯1n∥2∥Y−Y¯1n∥2
There is a geometric way of seeing this from the triangle, with minimal algebra. The definitional formula gives R2=1−sin2(θ) and with basic trigonometry we can simplify this to cos2(θ). This is the link between R2 and R.
Note how vital it was for this analysis to have fitted an intercept term, so that 1n was in the column space. Without this, the residuals would not have summed to zero, and the mean of the fitted values would not have coincided with the mean of Y. In that case we couldn't have drawn the triangle; the sums of squares would not have decomposed in a Pythagorean manner; R2 would not have had the frequently-quoted form SSreg/SStotal nor be the square of R. In this situation, some software (including R
) uses a different formula for R2 altogether.