Barrodale-Roberts-algorithmを使用した最小絶対偏差の解決:早期終了?


9

長めの質問は申し訳ありませんが、実際の問題にたどり着くには説明が必要です。前述のアルゴリズムに精通している人は、おそらく最初のシンプレックスタブラウに直接ジャンプするでしょう。


最小絶対偏差の問題(別名解決する -optimization)を、Barrodale -ロバーツアルゴリズムは、はるかに少ないストレージと適切な最小値を見つけるために計算努力を必要とする特殊目的シンプレックス法です。L1

アルゴリズムの実装は、適切な最小値に達する前に、単純な例で終了します。しかし、おそらく最初に、より詳細な方法で問題を述べさせてください。

データ与えられると、 -optimizationはを最小化する を見つけようとします ここで、は、何らかの方法で依存する行列です。この問題は線形プログラムとして説明できるため、特にシンプレックスのような方法を使用して解決できます。L 1 C M N Σは iが= 1 | y if x i|(xi,yi)L1cmA 、X、N × M個のX

i=1n|yif(xi)|withf(x):=Axϕ
Axn×mx

BarrodaleとRobertsは、問題の特別な構造を使用してシンプレックス法を根本的に簡素化するシンプレックス法の(明らかに広く使用されている)変更を提案しました。最も注目すべきは、これは、最適なソリューションが、指定されたデータポイントの少なくともを補間することです。Jstorアクセス​​権を持つユーザーは、対応する記事をここで見つけることができますr a n kA L1rank(A)

LeiとAndersonは、2002年に数値の安定性を向上させ、シンプレックスアルゴリズムの既知の問題を克服するための小さな変更を提案しました。

基本的に、このアルゴリズムは、補間する必要のある特定のポイントセットから開始し、特定の手順を使用してシンプレックスタブローを作成し、BarrodaleとRobertsのルールを使用して、変更する基底変数を決定し、したがって近似されるデータポイントのセット。

バロデールとロバーツは私が再現しようとした小さな例を挙げています。関数によって点を近似しようとします。次の圧縮されたシンプレックスタブローでアルゴリズムを終了します。1 + 2 X{(1,1),(2,1),(3,2),(4,3),(5,2)}a1+a2x

BasisRu1u3b11/23/21/2v21/21/21/2b21/21/21/2u41/21/23/2v5112Marginal cost210

最も重要なのは、最初と3番目の点が補間され、全体的な誤差が等しいこと です。彼らはそれを結論付けます2

すべての非基本ベクトルには非正の限界コストがあるため[...]

反復が終了し、最適に達した。

レイとアンダーソンのアルゴリズムを使用すると、予想どおり、補間セット{1,3}のシンプレックスタブローを再現できます。ただし、セット(明らかに最適ではない)でアルゴリズムを開始すると、次のシンプレックスタブローが表示されます。{2,5}

BasisRu2u5u11/34/31/3b11/35/32/3u32/32/31/3u44/31/32/3b21/31/31/3Marginal cost7/310/35/3

しかし、この結果は私を困惑させています。上記の見積もりを正しく理解していれば、限界費用がプラスにならないということは、最適に達していることを示しています。ただし、関数値2.33は確かに最適ではありません。をと交換と、BarrodaleとRobertsのソリューションと同等の結果が得られ、したがって最適です。u2u1

追加情報:バロデールとロバーツから与えられた最初のタブローから始めれば、上記のタブローを通常のシンプレックスステップで再現することもできるので、実際の数値が正しいことと、ピボット選択ルールの解釈にかなり自信があります。不良です。

これについて何か考えはありますか?

質問自体はかなり複雑で、おそらく少なくとも十分に答えられるには、Barrodale and Robertsアルゴリズムの知識が必要であることを理解しています。全体としてのアルゴリズムは、ここでそれを詳細に繰り返すことを望んでいます。ただし、私が取った手順や不足している情報について追加の質問がある場合は、遠慮なく質問してください。喜んで質問を補足します。


十分な評判のある人が「最小絶対偏差」または「L1近似」の線に沿ってタグを作成できたら、感謝します。
Thilo

最適条件は、基本的な解決策は(その非負制約に関して)実行可能でなければならないことである 、すべてのベットはオフになっているあなたの基本的なソリューションが実現不可能である場合にはコスト削減が0に等しいか、またはより小さくなるように持っていること。
Brian Borchers 2013年

基本的な解決策は、構築によって実現可能です。したがって、問題はないはずです。しかし、私は問題がどこにあるのかについての最初の考えを持っています。私が正しい場合は、対応する回答を追加します。
Thilo

回答:


4

解決しました。実際、バロデールとロバーツはそれを解決し、私は注意深く読みませんでした。

私の質問では、というラベルの付いた変数BarrodaleとRoberts が、現在の近似に関連して番目のデータポイントの正の残差を表すことを理解するように、読者に任せました。残差が負の場合、およびは対応する値を取ります。それらの1つだけが基底内にある可能性があり、シンプレックスタブローの係数は互いの負の値にすぎないため、シンプレックスタブローでそれらを明示的に述べる必要はありません。バロデールとロバーツは彼らの記事で言及しています:あなたあなた=0vi

[...]そして、との限界(または削減)コストのはゼロであり、とコストは-2です。bjcjuiv

したがって、上記のシンプレックスタブローは次のように考える必要があります。

基礎Rあなた2あなた5v2v5あなた11/4/1/4/1/b11/5/2/5/2/あなた2/2/1/2/1/あなた44/1/2/1/2/b21/1/1/1/1/限界費用7/10/5/4/1/

ここで、より良い結果をアーカイブするためにをベースにことができることが明確にわかります。これを行うと、全体の誤差が2の最初と5番目のデータポイントを補間している間にアルゴリズムが終了します。これが最良のソリューションです。v2

私の問題を読み書きする場所を教えてくれてありがとう。これは通常、解決策を大幅に絞り込むのに役立ちます。うまくいけば、この答えは、Barrodale&Robertsを実装しようとしている他の人にとって役立つ場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.