スケールの等分散性の正式な定義はありませんが、統計学習の概要でこれについてp。217:
標準的な最小二乗係数...であるスケールequivariant:乗算定数倍最小二乗係数推定値のスケーリングに単にリード。
簡略化のため、の一般線形モデル仮定する、ここで、、である行列(のすべてのエントリを持つ)、、及びあると実数値の確率変数の次元ベクトル。
OLS推定から、我々は知っているならばフル(列)ランク持っている β X = (X T X )- 1 X T Yを。
スケールの等分散性の正式な定義はありませんが、統計学習の概要でこれについてp。217:
標準的な最小二乗係数...であるスケールequivariant:乗算定数倍最小二乗係数推定値のスケーリングに単にリード。
簡略化のため、の一般線形モデル仮定する、ここで、、である行列(のすべてのエントリを持つ)、、及びあると実数値の確率変数の次元ベクトル。
OLS推定から、我々は知っているならばフル(列)ランク持っている β X = (X T X )- 1 X T Yを。
回答:
引用のアサーションはXの列の再スケーリングに関するステートメントのコレクションであるため、一度にすべてを証明することもできます。実際、アサーションの一般化を証明するためにこれ以上の作業は必要ありません。
場合正則行列の右乗算されるA、新しい係数推定値β Aは、に等しいβにより左乗算A - 1。
必要な唯一の代数的事実は、(容易に証明され、よく知られている)であり、任意の行列A Bに対しておよび可逆行列に対して(A B )− 1 = B − 1 A − 1 AとB。(一般化された逆行列を使用する場合は、後者の微妙なバージョンが必要です:可逆AとBおよび任意のXの場合(A X B ))
代数によって証明:β A = ((X A )'((X A ))- (X A )'、Y = A - 1(X ' X )- (A ' )- 1 A ' Y = A - 1 β、
QED。 (この証明は十分一般的であるためには、-上付き文字は、一般逆のことをいいます。)
ジオメトリによる証明:
R nおよびR pの基底およびE nがそれぞれ与えられた場合、XはR pからR nへの線形変換を表します。XとAの右乗算は、この変換を固定したまま、E pをA E pに(つまり、Aの列に)変更することと見なすことができます。基礎のその変化の表現の下で任意のベクトルβ ∈ Rは、 A - 1、QEDによる左乗算を介して変更する必要があります。
(この証明作品は、変更されていない、場合でも、可逆ではありません。)
引用は、具体的に対角行列の場合を指すとA iがiは = 1のためのI ≠ JとA J 、J = C。
ここでの目的は、結果を取得するための最初の原則を使用することです。原則は最小二乗の原則です。残差の二乗の合計を最小化する係数を推定します。
証明: QED。
証明するものは何もありません!
この新しいスケーリングされた推定器を定義します。つまり、すべてのに対してとなります。定義すると、上記の表示された不等式をとしてすべての。したがって、であり、最小二乗推定量 スケーリング行列可逆性のため
質問を投稿した後、私はこれを理解しました。しかし、私の仕事が正しければ、主張を誤って解釈しました。のみスケーリングの一の成分で発生の列に対応によって乗算される。
上記の表記法のは、対角の対称行列であり、逆(対角であるため)であることに 注意してください なお、は行列です。と仮定しましょう
次の線形方程式から始めます ここで、リグレッサのスケールを変更します。おそらく、メートル法からインペリアルに変換します。キログラムからポンド、メートルからヤードなどです。したがって、変換行列ここで、各は、計画行列変数(列)変換係数です。
方程式を書き直してみましょう:
これで、スケーリングが方程式の線形性のプロパティであり、係数のOLS推定方法ではないことが明確になりました。線形方程式を使用した推定方法に関係なく、リグレッサがとしてスケーリングされる場合、新しい係数はとしてスケーリングされる必要があります。
スケーリングは次のとおりです ここで、各変数(列)のスケールファクター、はスケールバージョンです。対角スケール行列呼び出しましょう。あなたのOLS推定量は です代わりに スケーリングされた行列接続し、いくつかの行列代数を使用しましょう: これで、新しい係数が期待どおりに単純に古い係数に縮小されたことがわかります。
この結果を得る簡単な方法は、がの列空間でのの射影であることを覚えておくことですは、が線形として表現される場合の係数のベクトルですの列の組み合わせ。一部の列が係数でスケーリングされている場合、線形結合の対応する係数をスケーリングする必要があることは明らかです。
ましょうの値で及び一つの列をによってスケーリングされるときOLS溶液の値である
の列が線形独立であると仮定すると、およびである意味します。 j ≠ i b i = a i c X