初期ヘッセ近似に対するBFGSの感度


9

関数の最小値を見つけるために、Broyden-Fletcher-Goldfarb-Shannoメソッドを実装しようとしています。2つの初期推定x1x0と初期ヘッセ行列近似B0です。について私が見つける唯一の要件B0は、ヘッセ行列が対称正定値である場合、もそうであることB0です。ウィキペディアを見ると、典型的な初期近似はB0=I(単位行列)であることがわかります。これは常に良い初期B0ですか?自分以外選びたいと思う理由はありますかI?同じ行列特性を満たすBの他の選択は、メソッドの収束に大きな影響を与えるでしょうか?

回答:


6

正当化されたヘッセ近似がある場合は、任意のではなく、それを使用することをお勧めします。B0=I

xr>0r+1r+1q=B01f(x)G<1rG単位行列の。したがって、これを小さくしようとすることは非常に価値があります。(これはシステムの事前条件付けと同等です。)収束係数は時間とともに改善し、最終的にはゼロ(超線形収束)に近づきますが、多くの実際の問題(特に高次元の問題)では、超線形領域に到達するのに十分な反復を行うことはありません。したがって、初速度は非常に重要です。

1つの重要なケースは、非線形最小二乗問題を解決するとき(最小化です。初期ヘッシアンのガウスニュートン近似は次のようになります。 2次導関数を必要とせずに計算されます。これを使用すると、BFGSメソッドは不変式、つまりニュートン法のように線形変換の下で不変式になります。これは通常非常に有益です。F(x)22B0=F(x0)TF(x0)x

別の重要なケースは、関連する一連の問題を解決する場合です。多くの場合、前の問題の最終的なヘッセ近似でソルバーを再起動すると、必要な反復回数が大幅に減少します。


ヘッセ行列が対称正定行列であると予想される場合、対称正定行列は収束につながりますが、収束の速度はがヘッセ行列にどの似ているかに依存しますか?B0B0
ポール

いいえ、結局のところ、BFGSは開始行列を忘れるので、収束は常に同じ次数になります。しかし、無制限に多くのステップを実行することはないため、それはもちろん興味深いことではありません。k
Wolfgang Bangerth 2012

@Paul:私の編集を参照してください。
Arnold Neumaier 2012
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.