凸問題が最適化しやすいのはなぜですか?


8

質問に対するこのトップアンサーに動機付けられた:最適化において、凸性凸性よりもなぜ重要なのですか?、私は今、なぜ問題が最適化しやすい(または少なくとも問題より簡単である)かを理解したいと思っています。

凸最適化の最も効率的なアルゴリズムにはどのようなものがありますか?それらは準凸問題で効果的に使用できないのはなぜですか?


1
非常に優れた特性の1つは、凸関数のグラフに接する線/平面/超平面接線を描くと、グラフ全体が線の片側にあり、準凸関数では機能しないことです。
キリル

回答:


5

大規模な最適化のための最新の最良の方法のほとんどは、目的関数を局所二次近似し、その近似の臨界点に向かって移動してから繰り返すことを含みます。これには、ニュートン法、L-BFGSなどが含まれます。

現在の点でのヘッセ行列が正定である場合、関数は局所的に最小値をもつ2次関数で近似できます。ヘッセ行列が不定の場合、どちらか

  1. 局所二次近似は目的関数の優れた局所近似であるため、サドルサーフェスです。次に、この2次近似を使用すると、間違った方向にある可能性が高い鞍点に向かって移動することが提案されます。

  2. 局所的な二次近似は、構造上最小値を強制されます。その場合、それは元の目的関数への不十分な近似である可能性があります。

(ヘッセ行列が負定である場合、同じ種類の問題が発生します。その場合、局所的に逆さまのボウルのように見えます)

したがって、これらの方法は、ヘッセ行列がどこでも正定である場合に最適に機能します。これは、滑らかな関数の凸性に相当します。


もちろん、すべての優れた最新の方法には、ヘッセ行列が不明確な領域を通過するときに収束を確実にするための保護手段があります。このような不明確な領域では、目的関数に関する完全な曲率情報を使用できないため、収束は一般にはるかに遅くなります。


1
同意しない。信頼領域は、不定二次関数を処理できます。直線探索法でも、負の曲率の方向で直線探索を見つけて実行することで可能です。一方、アルゴリズムがネイキッドで、トラストリージョンや適切なラインサーチがないために保護できない場合、問題が発生します。しかし、厳密に凸の関数であっても、そのような無謀さに悩むこともできます。
マークL.ストーン

3
@ MarkL.Stoneもちろんこれは真実であり、私は投稿を書くときにそれについて言及することについて議論しました。ただし、要点は、はい(最新の優れたコードと同様に)特別な処理を行うことでメソッドを収束させることができますが、収束はかなり遅くなります。たとえば、信頼領域が小さい場合、信頼領域法は勾配降下法に相当します。
Nick Alger、2016

7

非凸最適化問題に凸最適化アルゴリズムを適用することを試みることができます、そしてそれは極小値にさえ収束するかもしれませんが、関数に関する局所情報しか持っていないので、あなたが実際にそうであると結論することは決してできません。グローバルミニマムが見つかりました。凸最適化問題の最も重要な理論的特性は、ローカル最小値(実際には任意の静止点)もグローバル最小値であることです。

非凸問題の大域的最適化のアルゴリズムは、解が大域的最小であることを証明するために、ある種の大域的情報(例えば、関数のリプシッツ連続性)を持たなければなりません。

凸最適化アルゴリズムが準凸問題で失敗する理由に関する特定の質問に答えるために、凸最適化アルゴリズムが目的関数のグラフの「フラットスポット」で偶然に開始されたとします。グラデーションには、次に進むべき場所を示すローカル情報はありません。凸状の問題の場合は、ローカル(したがってグローバル)の最小点にすでに達していることを知って、単純に停止できます。


これが凸性と準凸性の問題に答えるとは思いません。問題が単に平坦な勾配を回避している場合は、効率的な凸法が厳密に準凸関数に対しても同様に機能すると想定できます。
Amelio Vazquez-Reina

興味深い例の1つは、です。 x = 0y=バツバツ=0バツ=0

1
Armijo条件を満たすライン探索で降下法を使用すると、局所的な最小値への大域的な収束が得られるという標準的な定理があります。(ここでは、いくつかの技術的な仮説を省略しました。)はい、最適ではない臨界点なしで、準凸関数のクラスのグローバル収束を最小限に抑えることができます。たとえば、NocedalとWrightによるテキストの第2版の定理3.2を参照してください。
ブライアンボーチャーズ2016年

1
「最適化が容易」に関しては、グローバル収束の問題を超えて最小化し、収束率を考慮する必要があります。凸最適化の多くの方法の分析(たとえば、ニュートン法の二次収束または凸最適化の最近のいくつかの加速された一次法の高速収束)は、凸性に依存しているため、これらのメソッドは準凸関数のクラスで失敗する可能性があります。たとえば、準凸関数には一意の臨界点がありますが、ヘッセ行列が特異である点があり、これはニュートンの方法を壊す可能性があります。
ブライアンボーチャーズ2016年

2
また、コンベックス最適化問題を「解決が容易」であると話す人々に共通していることを覚えておいてください。彼らは一般に、多項式について、いくつかのクラスのコンベックス最適化問題(LP、Convex QP、SOCP、SDPなど)について話しています。時間アルゴリズムが存在し、実際には簡単に解決できます。より一般的な凸最適化問題は、実際に解決するのがはるかに難しい場合があります。
ブライアンボーチャーズ2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.