分類のための半教師あり学習、能動学習、および深層学習


19

すべてのリソースが更新された最終編集:

プロジェクトでは、機械学習アルゴリズムを分類に適用しています。

課題: 非常に限られたラベル付きデータと、より多くのラベルなしデータ。

目標:

  1. 半教師付き分類を適用する
  2. 何らかの方法で半教師付きのラベル付けプロセスを適用します(アクティブラーニングとして知られています)

EM、Transductive SVM、S3VM(Semi Supervised SVM)の適用、またはLDAの使用など、研究論文から多くの情報を見つけました。このトピックに関する本はほとんどありません。

質問: 実装と実際のソースはどこにありますか?


最終更新(mpiktas、bayer、およびDikran Marsupialが提供するヘルプに基づく)

半教師付き学習:

能動的学習:

  • Dualist:テキスト分類に関するソースコードを使用した能動学習の実装
  • このWebページは、アクティブラーニングの素晴らしい概要を提供しています。
  • 実験的なデザインワークショップ:ここ

深層学習:


RパッケージRTextToolsがあります。私が間違っていない場合、それはあなたが言及したいくつかの方法を実装しています。
mpiktas

こんにちはmpiktas、あなたの親切な助けに感謝します。興味深いツールキットです。ただし、「TextToolsは自動テキスト分類用の無料のオープンソース機械学習パッケージで、初心者と上級ユーザーの両方が教師付き学習を簡単に開始できるようになっています。パッケージには、アンサンブル分類のための9つのアルゴリズム(svm、slda、ブースティング、バギング、ランダムフォレスト、glmnet、決定木、ニューラルネットワーク、最大エントロピー)」
フレーク

わかりました、別の試み:Wekaです。著者は本を書いており、その目次は半教師あり学習に言及しています。この章が「...残念ながら、これらのアルゴリズムはいずれもWekaに実装されていません」で終わっていないことを心から願っています:)
mpiktas

ドラット、古いバージョンの本を手に入れた!このソースを指摘してくれてありがとう!
フレーク

回答:


8

ディープラーニングはあなたにとって非常に興味深いかもしれません。これは、教師なしの方法で事前にトレーニングされ、後で監督によって微調整された、ディープコネクショニストモデルのごく最近の分野です。微調整では、事前トレーニングよりも必要なサンプルがはるかに少なくなります。

舌を濡らすには、[Semantig Hashing Salakhutdinov 、Hintonをお勧めします。ロイターコーパスの個別のドキュメントについて見つけたコードを見てください:(監視なし!)

ここに画像の説明を入力してください

コードを実装する必要がある場合は、deeplearning.netをチェックしてください。しかし、すぐに使えるソリューションがあるとは思いません。


これは私にとって非常に興味深い新しい情報です。もちろん、すぐに使える実装の方が良いでしょうが、これは私が欲しいものに近い何かを知るのに本当に役立ちます。ありがとう。
フレーク

5

Isabelle Guyon(および同僚)は、しばらく前にアクティブラーニングに関する課題を組織しました。手順はここに公開されています(オープンアクセス)。これには非常に実用的であるという利点があり、公平な(口語的な意味で)プロトコルの下でさまざまなアプローチのパフォーマンスを直接比較できます(パターンのランダムな選択は驚くほど難しいです)。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.