不確定な方程式系にリッジ回帰を適用しますか?


9

場合、球状制限を課す最小二乗問題の値にのように書くことができる for the overdetermined system。\ | \ cdot \ | _2は、ベクトルのユークリッドノルムです。y=Xβ+eδβ

min yXβ22s.t.  β22δ2
2

\ betaの対応する解βは、\ begin {equation} \ hat {\ beta} = \ left(X ^ TX + \ lambda I \ right)^ {-1} X ^ T y \、\ end {equation}によって与えられ ます

β^=(XTX+λI)1XTy ,
これは、ラグランジュ乗数の方法から導出できます(λは乗数です):
L(β,λ)=yXβ22+λ(β22δ2)

\ begin {equation} \ left(X ^ TX + \ lambda I \ right)^ {-1} X ^ T = X ^ T \ left(XX ^ T + \ lambda I \ rightというプロパティがあることを理解しています )^ {-1} \。\ end {equation}

(XTX+λI)1XT=XT(XXT+λI)1 .
右側は、劣決定の場合の回帰行列Xの疑似逆行列に似ていXます(追加の正則化パラメーターλ)。これは、同じ式を使用して、未決定の場合の\ betaを概算できることを意味しβますか?球制約制約は目的関数(\ betaの最小ノルムβ)と重複しているため、未決定の場合に対応する式の個別の派生はありますか?

min. β2s.t. Xβ=y .

回答:


12

リッジ回帰問題の定式化から始める

minXβy22+λx22

あなたは問題を次のように書くことができます

minAβb22

どこ

A=[XλI]

そして

b=[y0].

部分があるため、行列は完全な列ランクを持っています。したがって、ユニークなソリューションとしての最小二乗問題AλI

β^=(ATA)1ATb

と観点からこれを書き出し、多くの0を簡略化すると、Xy

β^=(XTX+λI)1XTy

この派生には、に行または列があるかどうか、またはにフルランクがあるかどうかに依存するものはありません。したがって、この式は未確定のケースに適用できます。 XX

それは、そのための代数的事実である、λ>0

(XTX+λI)1XT=XT(XXT+λI)1

したがって、使用するオプションもあります

β^=XT(XXT+λI)1y

特定の質問に答えるには:

  1. はい、どちらの式も、未確定のケースと、過剰決定のケースで機能します。彼らも仕事場合以下の行と列の数の最小値以上である。その場合、はよりも小さいため、2番目のバージョンは、未確定の問題に対してより効率的です。 rank(X)XXXTXTX

  2. 他の減衰最小二乗問題から始まり、正規方程式を使用する式の代替バージョンの派生については知りません。いずれの場合も、少しの代数を使用して簡単な方法でそれを導出できます。

リッジ回帰問題を次の形式で考えている可能性があります

minβ22

従う

Xβy22ϵ.

ただし、このバージョンのリッジ回帰問題は、同じ最小二乗問題つながるだけです。minXβy22+λβ22


2
が完全な行ランクまたは完全な列ランクを持つ場合、は0になるので、制限内で何が発生するかは注目に値します。に完全な列ランクがある場合、制限内では、疑似逆ます。同様に、に完全な行ランクがある場合、制限内で擬似逆ます。したがって、これは予想どおりに機能します。λXX(XTX)1XTXXT(XXT)1
ブライアンボーチャーズ2014年

これは驚くほど包括的な答えであり、拡張配列(および私が見逃した代数)からの導出は非常に満足のいくものです。最後に提示した形の尾根回帰問題については考えていませんでしたが、同じ目的関数につながることは興味深いです。どうもありがとう!
Hatmatrix 2014年

1
ありがとう。恥知らずなプラグをここに挿入します。これ(および関連資料の多く)は、Rick AsterとCliff Thurberと共著したパラメーター推定と逆問題に関するテキストに記載されています。
Brian Borchers、2014年

1
また、実際にこの行列の逆を計算することは、通常、この式を使用する最良の方法ではないことも付け加えておきます。サイズと可能なスパース性に応じて、反復スキームを使用するか、単純に行列のコレスキー分解を使用する方がはるかに良い場合があります。XXTX+λI
Brian Borchers、2014年

あなたの提案をありがとう!この資料のtexbookを見つけるのに苦労したので、あなたの本への参照に感謝します。私たちのデータサイズは実際にはそれほど大きくないので(データセットを個別に適用する必要がある場合のみ)、正逆の影響を受けやすいかもしれませんが、追加のポインターに感謝します!
Hatmatrix 2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.