ドキュメントのコーパスでLDAを使用し、いくつかのトピックを見つけました。コードの出力は、確率を含む2つの行列です。1つのdoc-topic確率と他のword-topic確率。しかし、実際には、これらの結果を使用して新しいドキュメントのトピックを予測する方法がわかりません。ギブスサンプリングを使用しています。誰もが方法を知っていますか?ありがとう
1
「新しいドキュメントのトピックを予測する」とはどういう意味ですか?このドキュメントが生成されたトピックを1つ見つけたいですか?ドキュメントのトピックの混合物を見つけたいですか?新しいドキュメントの各単語に、その単語が由来するトピックごとにラベルを付けますか?
—
シェルドンクーパー
このドキュメントが生成されたトピックを1つ見つけたいですか?ドキュメントのトピックの混合物を見つけたいですか?-これらの質問の両方に実際に答えたい...しかし、私のコーパスは本当に大きいので、新しいドキュメントを作成するたびにすべてのモデルを再トレーニングする余裕はありませんが検査される
—
ホセイン