加重二乗和を行列形式に変換する手順は何ですか?


8

数式をマトリックス形式に変換するのは初めてです。しかし、これは効率的な機械学習コードに必要です。だから私は「正しい」方法を理解したいのですが、私がするカウボーイのものではありません。

さて、これで、重み付き二乗和を以下の形式から行列形式に変換しようとしています。私はよくマトリックス形式を以下のものと同等であると見なし、それがどのように導出されるかについての説明はありません。

J(w)=i=1mui(wTxiyi)2

ここで、は各サンプル誤差重みです。また、、、、、。は、重みベクトルに特徴ベクトルを乗算した結果である予測値です。I X 、IR N W R N Y R U IR iは= 1 m w T x iuiixiRnwRnyRuiRi=1,...,mwTxi

これが私の考えです、そして私は創造的になります。接線で行く場合は、最後までスキップしてください。

してみましょう非二乗誤差を表し関数の列ベクトルで。をとして表すことができwがTはxはI - Y I 2 iが= 1 mr(wTxiyi)2i=1,...,m

(1)r2=[r1r2rm][r1r2rm]

ベクトルにベクトルを掛けた結果は、行列(スカラー)です。m × 1 1 × 11×mm×11×1

してみましょう、各サンプルのエラーの重重みのベクトルです。二乗誤差を比較する必要があるため、スカラーを取得する前に、式にを組み込む必要があります。最初のをベクトルとして残したいので、をからの対角項を持つ対角行列として定義します。私たちは今持っています:u 1 r 1 × m U uuu1r1×mUu

(2)J(w)=[r1r2rm][u1000u2000um][r1r2rm]

これを簡略化できます

(3)J(w)=rTUr

次に、を展開します。我々が持っていたを乗じ米国与える Xは今マトリックス及びある列ベクトル。y を、ラベル表す列のベクトル。ここで、です。これを数式に代入すると、最終的な重み付き二乗和が行列形式で得られます X IR N W R nは X W 、M × N W N × 1 メートル× 1 、Y = 1 m r = X w y 3 J w = X w y T U X w y rxiRnwRnXwm×nwn×1m×1y=1,...,mr=(Xwy)3

(4)J(w)=(Xwy)TU(Xwy)

まず、これは理にかなっていますか?第二に、そして最も重要なことは、これは実際にあなたがそれを行うことになっている方法ですか?

ありがとう


1
これ: math.stackexchange.com/questions/198257/… が役立つかもしれません!
kjetil b halvorsen 2016

+1:「カウボーイのもの」をやっているとおもしろい。これはまさにそれを行う方法ですが、これを包括的に書き留めることは決してしません(とても良い仕事です!)。これは私の計量経済学の研究中に私の計量経済学1コースの本の章です。120ページは、(簡単な)関数を行列表記に書き換える方法を説明しています。121ページは、重みなしの例です(ただし、表記は少し異なります)。私の記憶が正しければ、別の章でもWLS見積もりを扱います(これは基本的にあなたの表現です)。
Marcel10 2016

は、私にはよく見えますよ。
Matthew Gunn 2016

回答:


1

私はこの質問への答えに挑戦します:あなたが提示したすべてが正しいです。

基本的に導き出したのはガウス・マルコフの定理です。加重最小二乗推定量は、加重データの最良の線形不偏推定量です。この推定量は、加重二乗和(最初の表示)を最小化し、次の式で与えられます:。ここで、は、最初の列がのベクトル(これは切片の項です)に設定された計画行列です。X1、N×1β^WLS=(XTWX)(XTWY)X1n×1

この結果は、任意の共分散行列に適用されます。ただし、重み付けされた独立データは、重み行列の対角線に沿った重みのベクトルで表されます。(表記では、回帰係数として、重みとしてを使用しているため、混乱を避けるために、設計行列はおよび。u X = [ x ] W = diag u β = [ w ]wuX=[x],W=diag(u),β=[w]

ガウスマルコフの定理の証明は矛盾しています。こちらをご覧ください。つまり、損失関数から直接このような推定量を導出することはありません。線形およびロジスティック回帰推定式の導出で使用されるこのようなアプローチを見たことがあるかもしれません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.