トピックモデルとLDAに関するチュートリアル


8

トピックモデルとLDAに関する優れたチュートリアル(高速で簡単)があり、直感的にいくつかのパラメーターの設定方法、それらの意味、そして可能であれば実際の例を教えているかどうかを知りたいと思います。


直接的な回答でもチュートリアルでもありませんが、階層モデルに興味がある場合は、トピックに関する私の最近の回答が役立つかもしれません(研究論文のコレクション)。
Aleksandr Blekh、2015年

2
一般に、オフサイトのリソースを要求するだけの質問はトピック外と見なされます。たぶん、チュートリアルで探しているものを絞り込むことができます。何を知っているか、何を知りたいか、特定の言語のコードが欲しいかなど
Sean Owen

回答:


9

Rで作業している場合、LDAを使用して映画レビューのトピックをモデル化することに関するカーソンシーバートのチュートリアルは、優れた出発点です。

http://cpsievert.github.io/LDAvis/reviews/reviews.html

このチュートリアルでは、LDAvisを使用します。LDAvisは、トピックと単語の分布をインタラクティブに視覚化して、直感を助けます。

また、短くはありませんが、David M. Bleiのトピックモデルに関する講義は、パラメータの背後にある意味を理解するための優れたリソースです。http//videolectures.net/mlss09uk_blei_tm/


7

このチュートリアルを強くお勧めします:トピックモデリングとマレット入門

ここにあなたが始めるのに役立ついくつかの追加リンクがあります...

優れた入門資料(研究論文へのリンクを含む):http : //www.cs.princeton.edu/~blei/topicmodeling.html

ソフトウェア:

  • マレット(Java):http ://mallet.cs.umass.edu/topics.php
  • gensim(Python):http ://radimrehurek.com/gensim/
  • topicmodels(R):http ://cran.r-project.org/web/packages/topicmodels/index.html
  • Stanford Topic Modeling Toolbox(社会科学者向けに設計されています):http : //www-nlp.stanford.edu/software/tmt/tmt-0.4/
  • Mr.LDA(MapReduceを使用したスケーラブルなトピックモデリング):http ://lintool.github.io/Mr.LDA/
    • あなたが作業している場合、大規模な入力テキストの量は、あなたのトピックモデルを構築するためにMr.LDAを使用して検討する必要があります-大量のデータを扱うときにそのMapReduceのベースのアプローチは、より効率的かもしれません。

さらに、バイアス見積もりの​​ブログ:トピックモデル閲覧リスト




弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.