本番環境の機械学習モデル


8

利用可能なラベル付きデータを使用して、モデルが日付にトレーニングされ、トレーニングとテストに分割されたとしましょう。すなわち、t r a i n d t 1t e s t d t 1です。次に、このモデルが本番環境にデプロイされ、新しい受信データを予測します。一部のX日通過との間に収集された標識されたデータの束が存在するD 、T 1及びD T 1 + X日は、それを呼び出すことができますD A T A Xdt1traindt1testdt1Xdt1dt1+XDatax。私の現在のアプローチでは、私は外のランダムなサンプルを取る (80/20スプリットを例えばのために取ります)、DATAx

したがって、 D A T A x = t r a i n xd t 1でトレーニングされた既存のモデルを微調整するために使用される新しいデータ) 20 D A T A x = t e s t x(新しいt e s t d t 1に追加されたデータ)80%DATAxtrainxdt120%DATAxtestxtestdt1

この微調整のプロセスは、時間の経過とともに繰り返されます。

これを行うことで、テストセットを拡大し、モデル全体の再トレーニングを回避します(基本的に、モデルが学習した古いデータを破棄できます)。生成された新しいモデルは、古いモデルを微調整したバージョンです。

このアプローチに関して、いくつか質問があります。

  1. これを行うことには明らかな欠点がありますか?
  2. しばらくすると、モデルを完全に再トレーニングする必要がありますか(以前に学習したことをすべて無視し、新しいトレーニング/テストスプリットでモデルをトレーニングします)、または上記のアプローチを無期限に継続できますか?
  3. 既存のデプロイ済みモデルを新しく微調整したモデルと交換するための条件は何ですか?

初心者、すみません。ラベルを付けるには、非常に特別なデータセットが必要です、そうですか?監視付きラベル付けは、本質的にコストがかかり、時間がかかります。
xtian

@xtian監視付きラベリングのコストとそれにかかる時間は、問題に大きく依存します。誰かがディーラーを歩いたときに彼が車を買うかどうかを予測するMLモデルがあるとしましょう(与えられた人の属性)。この場合、ラベル付きデータの収集は比較的高速です。1日で、100以上のラベル付きサンプルを取得できます。
Trailblazer 2016

回答:


5

これは一般的に良いアプローチだと思います。しかしながら:

  • モデルの微調整(オンライン学習)は、アルゴリズムとモデルがどれほどうまく機能するかに大きく依存します。アルゴリズムによっては、全体を再トレーニングするのが賢明かもしれません

  • サンプルスペースは時間の経過とともに変化する可能性があります。十分なデータがある場合は、数年/週/月ごとに、昨年のデータのみを再トレーニングする方がよいでしょう。古いサンプルが現在の状況を表していない場合、それらを含めると、追加のサンプルよりもパフォーマンスが低下する可能性があります

  • 最大の条件は、テストした場合とそれに伴うダウンタイムの程度ですが、一般的にはスワッピングの回数が多いほどよく、これは自動化できます。


返信いただきありがとうございます !私は現在、ランダムフォレストやグラデーションブーストツリーなどのアンサンブルメソッドを使用しています。アルゴリズムの種類にとらわれないアプローチがどれほど優れているか知りたいので、それらについては触れませんでした。
Trailblazer 2016

標本空間については、観測に重みをつければ対応できると思いませんか?ある種の時間概念を構築します。
Trailblazer 2016

@trailblazerは、あなたの森に木を追加するのはまともなアプローチだと思います。試したことはありませんが、それに関する文献があるはずです。オンライン学習を探します。一部のアルゴリズムはセット全体でしか学習できないため、アルゴリズムにとらわれないことはできません。
Jan van der Vegt 2016

サンプル空間の質問に関して@trailblazerは、一部のアルゴリズムでは機能しますが、他のアルゴリズムでは機能しません。これも、オンライン学習の可能性に依存しますが、重みを増やし続けるか、すべてを再トレーニングする必要があります。遡って重みを減らすことはできません。再トレーニングなしの古いサンプル
Jan van der Vegt

0

それは主に、mlアルゴリズムが行う学習の種類に依存します。オフライン学習の場合:一部のアルゴリズムでは、より良い仮定を生成するために完全なデータが必要になるため、全体を再トレーニングするのが賢明です。オンライン学習:データが到着したときにモデルを更新することで、最新または最新のデータにモデルを微調整できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.