トピックモデルとLDAに関する優れたチュートリアル(高速で簡単)があり、直感的にいくつかのパラメーターの設定方法、それらの意味、そして可能であれば実際の例を教えているかどうかを知りたいと思います。
トピックモデルとLDAに関する優れたチュートリアル(高速で簡単)があり、直感的にいくつかのパラメーターの設定方法、それらの意味、そして可能であれば実際の例を教えているかどうかを知りたいと思います。
回答:
Rで作業している場合、LDAを使用して映画レビューのトピックをモデル化することに関するカーソンシーバートのチュートリアルは、優れた出発点です。
http://cpsievert.github.io/LDAvis/reviews/reviews.html
このチュートリアルでは、LDAvisを使用します。LDAvisは、トピックと単語の分布をインタラクティブに視覚化して、直感を助けます。
また、短くはありませんが、David M. Bleiのトピックモデルに関する講義は、パラメータの背後にある意味を理解するための優れたリソースです。http://videolectures.net/mlss09uk_blei_tm/
このチュートリアルを強くお勧めします:トピックモデリングとマレット入門
ここにあなたが始めるのに役立ついくつかの追加リンクがあります...
優れた入門資料(研究論文へのリンクを含む):http : //www.cs.princeton.edu/~blei/topicmodeling.html
ソフトウェア:
さらに、バイアス見積もりのブログ:トピックモデル閲覧リスト
CLARIN-Dプロジェクトは、サールランデ大学 CLARINセンターが主催するTeaching ans Learning Materials Collection(TeLeMaCo)サイトで、トピックモデリングとLDAのチュートリアルへの良い指針を集めました。
Machine Learning Pluの Gensimチュートリアルを試すことをお勧めします。NLPとLDAに関する全体的な概要を説明します。データの前処理、機能エンジニアリング、LDAの適用方法などです。