勾配降下法のような勾配ブースティングはどうですか?


9

私は勾配ブースティングに関する有用なWikipediaエントリ(https://en.wikipedia.org/wiki/Gradient_boosting)を読んでおり、最急降下ステップ(疑似勾配とも呼ばれる)によって残差を近似できる方法/理由を理解しようとしています)。誰かが私に最も急な降下が残差にリンクされている/類似している方法の直感を教えてもらえますか?どうぞよろしくお願いいたします。

ここに画像の説明を入力してください

回答:


11

次のような状況にあるとします。いくつかのデータがあり、各は数値またはベクトルにすることができます。最小二乗という意味で、関係を近似する関数を決定しますエラー:{xi,yi}xiff(xi)yi

12i(yif(xi))2

小さいです。

ここで、の領域をどのようにしたいかという質問に入ります。ドメインの縮退した選択は、トレーニングデータの単なるポイントです。この場合、目的のドメイン全体をカバーする定義し、終了することができます。この答えに到達するためのラウンドアラウンド方法は、この離散空間をドメインとして勾配降下を行うことです。これには、視点の変更が少し必要です。損失を点trueと予測関数として考えてみましょう(現時点では、は関数ではなく、予測の値です)ff(xi)=yy ff

L(f;y)=12(yf)2

そして、予測に関して勾配をとります

fL(f;y)=fy

次に、勾配の更新は、初期値からます。y0

y1=y0f(y0,y)=y0(y0y)=y

したがって、この設定を使用して、勾配ステップで完璧な予測を回復します。

もちろん、ここでの欠点は、トレーニングデータポイントだけでなく、をはるかに多く定義することです。これを行うには、トレーニングデータセット以外のポイントで損失関数またはその勾配を評価できないため、いくつかの譲歩を行う必要があります。 f

大きなアイデアは、弱く近似することです。 L

Startでの初期推定、ほとんど常に単純な定数関数、これはどこでも定義されます。次に、初期推定値を使用して、トレーニングデータでの損失関数の勾配を評価することにより、新しい作業データセットを生成します。ff(x)=f0f

W={xi,f0y}

Now approximate L弱学習器を当てはめ。近似を取得するとします。小規模な学習者に当てはまるため、トレーニングポイントでの精度は失われましたが、ドメイン全体で形式でデータ拡張を得ました。WFLWF(X)

Finally、ドメイン全体のの勾配更新で代わりにを使用します。FLf0

f1(x)=f0(x)F(x)

私たちは出、新たな近似より少し良く、。から始めて、満足するまで繰り返します。f1ff0f1

うまくいけば、本当に重要なのは損失の勾配を近似することです。最小二乗最小化の場合、これは生の残差の形をとりますが、より洗練された場合はそうではありません。機械はまだ適用されます。トレーニングデータでの損失と損失の勾配を計算するアルゴリズムを構築できる限り、このアルゴリズムを使用して、その損失を最小化する関数を近似できます。


ええ、それは良いことだと思います。注意すべき唯一のことは、たとえば、二項損失を最小化するためにブーストしたい場合、場合、拡張する勾配はもはや自然な方法で残差に関連しています。
iyilog(pi)+(1yi)log(1pi)
Matthew Drury

マシューに感謝します。頭を動かそうとしていることの1つ。文献では、モデルの更新はF(m + 1)= F(m)+であるとよく言われます。ここで、h(m)は弱学習器です。ツリーベースのモデルを考えている場合、それは、回帰と分類の両方で、2つのモデルの結果を単純に追加することによって、特定のデータポイントの予測を実際に実際に更新することを意味しますか?これをバイナリ分類しようとすると、それも機能しますか?または、+記号を文字どおりに解釈しないでください。αmh(m)
Wouter 2015

プラス記号は文字通りです。しかし、ツリーベースの弱学習器の場合、モデル予測は、ツリーが二項データに適合している場合でも、葉の加重平均として解釈されるべきです。後押しで、我々は通常、二項データにフィットしていないことに注意してくださいしかし、我々はされません前段階の予測で評価可能性の勾配にフィットしている高く評価しました。0,1
Matthew Drury、2015

1
@MatthewDrury私たちは、直接更新はありませんが、多くの文献に考えるとが、と、 0から1までは学習率です。f1f0F(x)f0αF(x)α
Haitao Du

@ hxd1011はい、それは完全に正しいことであり、勾配ブースティングを正常に使用するために重要です。
Matthew Drury
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.