Tikhonov正則化はRidge Regressionと同じですか?


回答:


47

Tikhonov正則化は、リッジ回帰より大きいセットです。これらがどのように異なるかを正確に説明しようとしています。

既知の行列Aとベクトルb、次のようなベクトルを見つけたいと仮定しますx

Ax=b

標準的なアプローチは、通常の最小二乗線形回帰です。しかし、ない場合xを満たす方程式または複数のxない、そのソリューションがユニークではありません問題が悪条件であると言われています。通常の最小二乗は、二乗残差の合計を最小化しようとします。これは、次のようにコンパクトに記述できます。

Axb2

ここでユークリッドノルムです。溶液表記マトリックス中に、で表される X、次式で与えられます。x^

バツ^=ATA1ATb

チホノフ正則化は最小化

Aバツb2+Γバツ2

いくつかの適切に選択されたTikhonov行列。で示される明示的なマトリックス状溶液、Xは、次式で与えられます。Γバツ^

バツ^=ATA+ΓTΓ1ATb

正則化の効果は、行列スケールによって変化します。ためΓ = 0これはunregularized最小二乗解に帰着(Aことを提供T A)-1が存在します。ΓΓ=0

通常、リッジ回帰では、Tikhonov正則化からの2つの逸脱が説明されています。最初に、Tikhonov行列が単位行列の倍数に置き換えられます

Γ=α

より小さいノルム、すなわちノルムの解を優先します。そして、 Γ T Γはなりα 2 IにつながりますL2ΓTΓα2

バツ^=ATA+α21ATb

最後に、リッジ回帰のために、典型的には、と仮定される変数は、その結果、スケーリングさX T Xは、相関行列の形態を有しています。及びX のT Bが相関ベクトルであり、Xの変数およびBにつながりますAバツTバツバツTbバツb

バツ^=バツTバツ+α21バツTb

このフォームラグランジュ乗数で注通常で置き換えられているKλ、またはいくつかの他のシンボルが、特性を保持λ 0α2kλλ0

この答えを定式化する際に、私はウィキペディア伝達関数の重みのリッジ推定から自由に借りることを認めます


10
(+1)完全性のために、それは実用的なアプリケーションで正規化システムは、通常の形で書き込まれることを言及する価値あるその後、最小二乗問題(上の例を介して、QR / SVD線形標準として解くことができ、 A明示的に正規方程式を形成することなく、)。[AαΓ]x[b0]A^xb^A^
GeoMatt22

いい視点ね。後で追加します。
カール

平滑化スプラインおよび同様の基底拡張法は、チホノフ正則化のサブセットですか?
Sycoraxが復活モニカ言う

@Sycorax私はそうは思わない。たとえば、Bスプラインは、終点で導関数をゼロに設定し、終点と終点の間のデータにスプラインの導関数と大きさを一致させます。Tikhonov正則化は、近似の勾配を変更することで、パラメーターエラーを最小限に抑えます。だから、異なること。
カール

また、ティコノフ正則化には、(分離可能?)ヒルベルト空間の任意の次元の定式化があります
AIM_BLB

23

カールは、ティホノフ正則化とリッジ回帰の数学的な違いをうまく説明する完全な答えを与えました。ここでの歴史的な議論に触発されて、より一般的なTikhonovフレームワークがどのように役立つかを示す短い例を追加すると便利だと思いました。

まず、コンテキストに関する簡単なメモ。リッジ回帰は統計で発生し、統計と機械学習で正則化が普及しましたが、Tikhonovのアプローチは元々、モデルベースのデータ同化(特に地球物理学)で発生する逆問題によって動機付けられました。以下の簡略化された例は、このカテゴリに属します(古気候復元にはより複雑なバージョンが使用されます)。


現在の測定値u [ x t = T ]に基づいて、過去の温度を再構築したいと想像してください。我々の単純化したモデルでは、に従ってその温度進化をとるであろう熱式U T = U 、X 、X 1(D)に周期的境界条件を有する U [ X + L T ] = U [ X T ] Aの簡単な(明示的)u[x,t=0]u[x,t=T]

ut=uxx
u[x+L,t]=u[x,t]
有限差分離散モデルへのアプローチリード 数学的には、進化行列 Aは可逆であるため、 u t = A 1 u t + 1となります。 ただし、数値的には、時間間隔Tが長すぎると問題が発生します。
ΔuΔt=LuΔx2ut+1=Aut
A
ut=A1ut+1
T

Tikhonov正則化は、A u tを解くことでこの問題を解決できます。

Autut+1ωLut0
ω21uxx

以下は、結果の比較です。

チホノフvs.チェッカーボード

u0ufwdu0uinvuregu0

uut0


この例のMatlabコードは次のとおりです(ここでオンライン実行できます)。

% Tikhonov Regularization Example: Inverse Heat Equation
n=15; t=2e1; w=1e-2; % grid size, # time steps, regularization
L=toeplitz(sparse([-2,1,zeros(1,n-3),1]/2)); % laplacian (periodic BCs)
A=(speye(n)+L)^t; % forward operator (diffusion)
x=(0:n-1)'; u0=sin(2*pi*x/n); % initial condition (periodic & smooth)
ufwd=A*u0; % forward model
uinv=A\ufwd; % inverse model
ureg=[A;w*L]\[ufwd;zeros(n,1)]; % regularized inverse
plot(x,u0,'k.-',x,ufwd,'k:',x,uinv,'r.:',x,ureg,'ro');
set(legend('u_0','u_{fwd}','u_{inv}','u_{reg}'),'box','off');

すべての賛辞は温かく受け取った。トピックから少し外れていても、Tikhonov正則化とリッジ回帰の両方を物理回帰ターゲットのターゲティングに使用できることに言及する価値があります。(+1)
カール

2
@Carlこれは確かに真実です。ここで変数を切り替えて使用することもできますv=Lあなたは!(一般に、可逆Tikhonov行列を使用するTikhonov問題は、リッジ回帰に変換できます。)
GeoMatt22 16
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.