R二乗の興味深い導出

数年前、私はデータと変換を試す実験を通してこのアイデンティティを発見しました。それを私の統計学の教授に説明した後、彼は次のクラスに来て、ベクトルと行列表記を使用した1ページの証明を行いました。残念ながら私は彼がくれた紙をなくしました。（これは2007年に戻ったものです）

誰かが証明を再構築できますか？

してみましょう元のデータポイントも。元のセットを角度だけ回転して、新しいデータポイントのセットを定義します。これらの点をます。 $(x_i,y_i)$ $\theta$ $(x'_i,y'_i)$

元の点のセットのR二乗値は、新しい点のセットの各座標の標準偏差の自然対数のに関する導関数の負の積に等しく、それぞれ評価され $\theta$ $\theta=0$

$r^2= - \left(\left.\frac{d}{d\theta}\ln(\sigma_{x'})\right|_{\theta=0} \right) \left(\left.\frac{d}{d\theta}\ln(\sigma_{y'})\right|_{\theta=0} \right)$

regression r-squared

— シェッパ28
ソース

派生は、記号操作の特に興味深い演習ではありません。以来、、

\begin{aligned} {\frac{d x^{'}}{d θ} |}_{θ = 0} & = - y, \\ {\frac{d y^{'}}{d θ} |}_{θ = 0} & = x, \end{aligned}

$\begin{align} \left.\frac{dx'}{d\theta}\right|_{\theta=0}&=-y,\\ \left.\frac{dy'}{d\theta}\right|_{\theta=0}&=x, \end{align}$

s_{x}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}

$s_x^2=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2$

{\frac{d s_{x^{'}}^{2}}{d θ} |}_{θ = 0} = - 2 s_{x y}

$\left.\frac{ds_{x'}^2}{d\theta}\right|_{\theta=0}=-2s_{xy}$

{\frac{d s_{y^{'}}^{2}}{d θ} |}_{θ = 0} = 2 s_{x y}

$\left.\frac{ds_{y'}^2}{d\theta}\right|_{\theta=0}=2s_{xy}$

{\frac{d}{d θ} \ln (s_{x^{'}}) |}_{θ = 0} = - \frac{s_{x y}}{s_{x}^{2}}, {\frac{d}{d θ} \ln (s_{y^{'}}) |}_{θ = 0} = \frac{s_{x y}}{s_{y}^{2}}

$\left.\frac{d}{d\theta}\ln(s_{x'})\right|_{\theta=0} = -\frac{s_{xy}}{s_x^2},\quad \left.\frac{d}{d\theta}\ln(s_{y'})\right|_{\theta=0} = \frac{s_{xy}}{s_y^2}$ あり、結果は次のとおりです。

どのようにしてそのような方程式を思いついたのか、特に特定の実験がそのようなアイデンティティを明らかにしたことを知りたいです。

— カシャア
ソース

ありがとう！これは実際、私が覚えている彼の証明よりもはるかに単純です。アイデンティティは、何年も前にデータを操作することで生まれました。キックの場合は、回転、標準偏差、導関数、対数、加算、乗算などを行います。元のr ^ 2を水平線にして、作成された関数をシータの関数としてグラフ化しました。彼らは時々交差したが、「奇数」の角度で; 時々交差しなかった。次に、どういうわけか、theta = zeroで交差しました。面白かったと思いました。他のランダムデータでテストしましたが、まだ保持されています。どのように機能するかはわかりませんでしたが、すっきりとしたアイデンティティを考えました。

— sheppa28 2014