特定の関数の極小値(最大値)を検出できる勾配降下アルゴリズムに精通しています。
関数がいくつかの極値を持っている絶対最小値(最大値)を見つけることができる勾配降下の変更はありますか?
絶対的な極値を見つけるために、局所的な極値を見つけることができるアルゴリズムを強化する一般的な手法はありますか?
特定の関数の極小値(最大値)を検出できる勾配降下アルゴリズムに精通しています。
関数がいくつかの極値を持っている絶対最小値(最大値)を見つけることができる勾配降下の変更はありますか?
絶対的な極値を見つけるために、局所的な極値を見つけることができるアルゴリズムを強化する一般的な手法はありますか?
回答:
制約のない最小化について話していると思います。特定の問題構造を検討している場合は、質問で指定する必要があります。そうでなければ、答えはノーです。
最初に神話を払拭すべきです。古典的な勾配降下法(最急降下法とも呼ばれます)では、局所的な最小化を見つけることさえ保証されていません。一次の臨界点、すなわち勾配が消える点を見つけると停止します。最小化される特定の機能と開始点に応じて、サドルポイントまたはグローバルマキシマイザーに到達する可能性があります。
インスタンスのために検討及び初期点(X 0、Y 0):= (1 、0 )。最急降下方向である- ∇ F (1 、0 )= (- 2 、0 )。正確なライン探索と方法の一つのステップがであなたを残します(0 、0 )グラデーションが消える場所。悲しいかな、それは点です。2次の最適条件を調べることで実現できます。しかし、関数がと想像してください。ここでは、(0 、0 )まだサドルポイントですが、数値的に、二階の条件は、あなたを教えてくれないかもしれません。一般的に、あなたはヘッセと判断言う∇ 2 F (X *、Y *は)固有値に等しい有する- 10 -。どう読むの?負の曲率または数値誤差ですか?どの程度+ 10 - 16?
今のような機能を考える
現在、事実上すべての勾配ベースの最適化手法は、設計上この問題を抱えています。あなたの質問は本当にグローバルな最適化に関するものです。繰り返しになりますが、答えはノーです。グローバルミニマイザーが確実に識別されるようにメソッドを変更する一般的なレシピはありません。自問してください:アルゴリズムが値を返し、それがグローバルミニマイザーであると言った場合、どのようにそれが真実であるかを確認しますか?
グローバル最適化にはメソッドのクラスがあります。ランダム化を導入するものもあります。いくつかはマルチスタート戦略を使用します。問題の構造を悪用するものもありますが、これらは特別な場合のためのものです。グローバル最適化に関する本を入手してください。あなたはそれを楽しむでしょう。
あなたの質問に対する万能の答えはおそらくないでしょう。ただし、シミュレーテッドアニーリングアルゴリズム、またはマルコフ連鎖モンテカルロ法(MCMC)に依存する他のアプローチを検討することをお勧めします。これらは、勾配降下などのローカルメソッドと組み合わせることもできます。
「ニューラルネットワークのグローバルな最適化」に関する多くの参考文献があります。この手法は、シミュレーテッドアニーリングに似ています[他の回答を参照]。基本的なアイデアは、ランダムにまたは体系的にサンプリングされた多くの異なる重みの開始点から開始してネットワーク勾配降下を再開することです。勾配降下の各結果は、「サンプル」のようになります。より多くのサンプルが取られるほど、特にターゲット関数が連続的、微分可能などの意味で「適切に動作する」場合、サンプルの1つがグローバル最適である可能性が高くなります。
オンライン参照
[1] Hamm et alによるニューラルネットワークの重みのグローバル最適化
[2] Voglis / Lagarisをトレーニングするニューラルネットワークへのグローバル最適化アプローチ
[3] グローバル最適化ピンターによる人工ニューラルネットワークの調整
[4] 決定論的ハイブリッドアプローチ Beliakov を使用したニューラルネットワークのグローバル最適化
[5] ニューラルネットワークトレーニング Shang / Wahのグローバル最適化
一般に、多変量の非凸関数を最適化することは計算上困難です。硬度にはさまざまなフレーバーがあります(暗号、NPハード)。これを確認する1つの方法は、混合モデル(GuassianやHMMの混合など)を学習するのは難しいが、尤度を効率的に最大化することができれば簡単(*)になることです。HMMの学習の難しさに関する結果については、http://alex.smola.org/journalclub/AbeWar92.pdf http://link.springer.com/chapter/10.1007%2F3-540-45678-3_36 http://を参照して ください 。 www.math.ru.nl/~terwijn/publications/icgiFinal.pdf
(*)非縮退性と識別可能性の通常の条件を法として
私はドミニクに反対しなければなりません。それは一定の厳格な条件の下で非凸問題をアニールすると、グローバルな最小値に到達することが保証されていることを1980年代半ばにhajekによって示された。http://dx.doi.org/10.1287/moor.13.2.311