タグ付けされた質問 「online-learning」

1
単一の決定木を追加することによるオンラインランダムフォレスト
ランダムフォレスト(RF)は、ディシジョンツリー(DT)のアンサンブルによって作成されます。バギングを使用することにより、各DTは異なるデータサブセットでトレーニングされます。したがって、新しいデータにさらに決定的な要素を追加して、オンラインランダムフォレストを実装する方法はありますか? たとえば、10,000個のサンプルがあり、10個のDTをトレーニングします。その後、1Kサンプルを取得し、完全なRFを再度トレーニングする代わりに、新しいDTを追加します。予測は、10 + 1 DTのベイジアン平均によって行われます。 さらに、以前のデータをすべて保持する場合、新しいDTは主に新しいデータでトレーニングできます。この場合、サンプルが選択される確率は、既に選択された回数に応じて重み付けされます。

2
オンライン機械学習用のライブラリ
株式データを予測するオンライン学習を実行するためのパッケージ(python、R、またはスタンドアロンパッケージ)を探しています。 私はVowpal Wabbit(https://github.com/JohnLangford/vowpal_wabbit/wiki)を見つけて読みました。これは非常に有望であるようですが、他にパッケージがあるかどうか疑問に思っています。 前もって感謝します。

4
SGDClassifier:以前は未知のラベルを使用したオンライン学習/ partial_fit
私のトレーニングセットには、約5万のエントリが含まれています。毎週、5,000エントリが追加されます。しかし、同じ量が「消えます」(しばらくしてから削除する必要のあるユーザーデータであるため)。 したがって、後で完全なデータセットにアクセスできないため、オンライン学習を使用します。現在は機能するを使用してSGDClassifierいますが、大きな問題があります。新しいカテゴリが表示され、最初のモデルにはなかったため、モデルを使用できなくなりましたfit。 SGDClassifierまたは他のモデルで方法はありますか?ディープラーニング? 今からゼロから始めなければならないかどうか(つまりSGDClassifier、以外のものを使用するかどうか)は関係ありませんが、新しいラベルでオンライン学習を可能にするものが必要です。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.