Jed Brownが述べたように、非線形最適化における勾配降下と動的システムの時間ステップとの関係は、ある程度の周波数で再発見されます(2つの外見上異なるフィールドをリンクするため、数学的な心と非常に満足のいく接続であるため、理解できることです)。ただし、特に説明するコンテキストでは、有用な接続になることはほとんどありません。
逆問題では、人々は、の範囲内にない、(不適切な)演算子方程式を解くことに興味があります。(最適な制御問題は、および 1つのインスタンスとして見ることができます。)いくつかの正則化戦略(TikhonovやLandweberなど)は、単一の擬似時間として解釈できます。特定のクラスのステップ。その考えは、正則化パラメーターの解釈をステップ長として使用して、パラメーターのいくつかの(適応的、事後)選択ルール(逆問題の基本的な問題)を取得し、場合によっては複数の擬似時間ステップを作成することです真の非正規化ソリューションにアプローチする(同様にY δ F F = A - 1つの Y δ = Y 0F(u)=yδyδFF=A−1yδ=y0数値の継続)。これは連続正則化と呼ばれることもあり、通常はレベルセットメソッドのコンテキストで説明されています。たとえば、ノイバウアーのシュルツァーのカルテンバッハーの6.1章:非線形不良問題の反復正則化法(de Gruyter、2008)を参照してください。
このアイデアが繰り返し登場する2番目のコンテキストは、非線形最適化です。勾配降下ステップを見ると、
これを動的システムの前方オイラーステップとして解釈できます
Jed Brownが指摘したように、疑似時間ステップが十分に小さい場合、一見すると、この方法が収束するという驚くべきことではありません。興味深いのは、動的システムを見て、いわゆる勾配流の連続解の特性を自問するときです。minxf(x)
xk+1=xk−γk∇f(xk),
x˙(t)=−∇f(x(t)),x(0)=x0.
γkx(t)勾配降下とは関係なく、また、それが標準オイラーよりも適切な時間ステッピング(したがって最適化)メソッドにつながらないかどうか。私の頭の上のいくつかの例:
勾配流が存在する自然な関数空間はありますか?その場合、勾配ステップは同じ空間から取得する必要があります(つまり、離散化は適合している必要があります)。これにより、たとえば、異なる内積に関する勾配のリース表現(ソボレフ勾配と呼ばれることもあります)が計算され、実際には、はるかに速く収束する事前条件付き反復が行われます。
たぶん、ベクトル空間にない属している必要がありますが、マニホールド(例えば、対称正定値行列)に、または勾配の流れは、特定の規範節約すべきである。この場合、構造を保持する時間ステップスキームを適用しようとすることができます(たとえば、適切なリーグループまたは幾何学的積分器に関するプルバックを含む)。xx
場合微分可能ではなく、凸起因ステップサイズの制限のために非常に遅くなることが劣勾配降下法に前進オイラーステップ相当します。一方、暗黙のオイラーステップは、そのような制限が適用されない(したがって、たとえば画像処理で非常に一般的になった)基点法に対応します。f
同様に、このような方法は外挿ステップによって大幅に加速できます。これらの動機付けの1つの方法は、勾配の方向が「振動」するため、標準の1次法は最小化子に近い多くの小さなステップを作成する必要があることに注意することです(共役勾配が最急降下よりも優れている理由の標準的な図を考えてください)。これを改善するには、1次の動的システムではなく、減衰した2次システムを解くことにより、反復を「減衰」できます
適切に選択された。適切な離散化により、これは次の形式の反復(Polyakのヘビーボール法)に
つながります。
a1x¨(t)+a2x˙(t)=−∇f(x(t))
a1,a2xk+1=xk−γk∇f(xk)+αk(xk−xk−1)
(応じて使用))。基点法についても同様の考え方があります。たとえば、Dirk LorenzとThomas Pockによる論文http://arxiv.org/pdf/1403.3522.pdfを参照してください。γk,αka1,a2
(これを私の知識に追加する必要があります。これらの場合のほとんどでは、動的システムとしての解釈はアルゴリズムの導出または収束証明に厳密に必要ではありません。「暗黙的vs明示的」またはリー微分実際には、動的システムや勾配降下法よりも基本的です。それでも、問題を見るために別の視点を持つことは決して痛いことはありません。)
編集:私はちょうど2番目のコンテキストから優れた例を見つけました。そこでは、ODE解釈がNesterovの超勾配法の特性を推測し、改善を提案するために使用されています:http :
//arxiv.org/pdf/1503.01243.pdf
(これもまた著者が明らかにポリアックのアルゴリズムに気付かないうちに上記のポイント4を本質的に再発見するという点で、Jed Brownのポイントの例。
編集2:そして、あなたがこれをどこまで取ることができるかの目安として、http://arxiv.org/pdf/1509.03616v1.pdfの 5ページを参照してください。