オンライン学習とオフライン学習?


回答:


26

オンライン学習とは、データが入ってくるときにそれを実行していることを意味します。オフラインとは、静的データセットがあることを意味します。

そのため、オンライン学習では、(通常)より多くのデータがありますが、時間の制約があります。オンライン学習に影響を与える可能性がある別のしわは、概念が時間とともに変化する可能性があることです。

スパムを認識する分類器を作成するとします。電子メールの大規模なコーパスを取得し、ラベルを付け、分類子をトレーニングできます。これはオフライン学習になります。または、システムに入ってくるすべての電子メールを受け取り、分類子を継続的に更新することができます(ラベルには少し注意が必要な場合があります)。これはオンライン学習になります。


7
はい、そして、少なくとも機械学習で研究されているように、オンライン学習アルゴリズムは、ほとんどの場合、サンプルを保存する能力がデータセットのサイズに比べて非常に制限されていると仮定しているということです。最も限定的なケースでは、一度に1つのサンプルしか見ることができず、分類器を更新するために使用した後は、それを忘れなければなりません。
ハーラン

8

「オンライン」という用語は過負荷であるため、機械学習の領域で混乱を引き起こします。

「オンライン」の反対はバッチ学習です。バッチ学習では、学習アルゴリズムはバッチ全体を消費した後にパラメーターを更新しますが、オンライン学習では、アルゴリズムは1つのトレーニングインスタンスから学習した後にパラメーターを更新します。ミニバッチ学習は、一方のバッチ学習ともう一方の極端なオンライン学習の中間点です。

また、データが「いつ」到着するか、またはデータを保存できるかどうかは、オンライン学習またはバッチ学習と直交しています。

オンライン学習は、バッチ学習と比較すると、最小値への収束が遅いと見なされます。ただし、データセット全体がメモリに収まらない場合、オンライン学習を使用することは許容できるトレードオフです。


私はこれが真実だとは思わない。説明するのは、オンラインまたはオフラインの両方の問題設定に使用できる確率的(またはオンライン)勾配降下法である最適化アルゴリズムです。
ダニジャー

私は、オンラインとオフラインのアルゴリズムを指し、「データが入るよう」信じるen.wikipedia.org/wiki/Online_algorithmオプスオンライン学習のためDEFNことを私の感触は明らかにこの区別を行います。オンラインアルゴ->データが入力されたら処理します。オンライン学習->トレーニング中に基礎となるモデルを徐々に更新します。
gokul_uf

4

オンライン学習インクリメンタル学習とも呼ばれます):例の単一のプレゼンテーションを検討します。この場合、各例は学習アルゴリズムで規定された方法で順番に使用され、その後破棄されます。特定の段階で行われる重みの変更は、具体的には提示されている(現在の)例にのみ依存し、おそらくモデルの現在の状態に依存します。これは、サンプルが一度に利用できない場合がある時変ルールの自然な手順です。

オフライン学習:重みの変化は(トレーニング)データセット全体に依存し、グローバルコスト関数を定義します。このコスト関数の最小化が達成されるまで、例は繰り返し使用されます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.