オンライン凸最適化の内部後悔


19

Zinkevichの「オンライン凸最適化」(http://www.cs.cmu.edu/~maz/publications/ICML03.pdf)は、線形設定から凸設定までの「後悔最小化」学習アルゴリズムを一般化し、優れた「外部後悔」を提供します。 。内部の後悔についても同様の一般化がありますか?(正確にそれが何を意味するのかさえ完全にはわかりません。)


質問に内部的な後悔の短い説明を追加することは可能ですか?
モリッツ

通常の「専門家」の設定では、内部的な後悔は、振り返ってみると、履歴全体にわたって一貫してアクションを切り替える必要がないことを意味します。Blum-Mansourの論文は、おそらく内部と外部の後悔の最良の参考文献です:jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Noam

回答:



0

このAvrim Blumの論文は、外部と内部の遺betweenのつながりを指摘しています。その抽象によれば、外部後悔はアルゴリズムが最良の固定アクションと比較してどれだけ悪いかを示す尺度であり、内部後悔はそのメソッドの最良のバリエーションと比較します(元のアルゴリズムが報告するたびに、クラスAクラスB)。


1
Blum-Mansour論文は「オンライン凸最適化」設定ではなく、線形「専門家」設定にあります。私の質問は、似たような何か、または他の何らかの直接的な内部後悔アルゴリズムを凸面設定に適用できるかどうかです。
ノアム
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.