Java Weka APIでカスタムストップワードフィルターを使用するにはどうすればよいですか?


8

Java Weka APIを使用して分類モデルを構築しています。組み込みのストップワードフィルターを使用できます。ただし、問題にはカスタムフィルターを使用する必要があります。Java Weka APIでカスタムストップワードフィルターを使用する方法がわかりません。

回答:


7

次のコードを試すことができます。

import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.unsupervised.attribute.StringToWordVector;
import weka.core.Instances;

Instances data = DataSource.read(".../document.txt"); //Your document .
filter.setInputFormat(data);
StringToWordVector filter = new StringToWordVector();
filter.setStopwords(new File(".../stopwords.txt")); //stop words file.
Instances data = Filter.useFilter(data,filter);

Weka API for Javaの理解を深めるには、次のドキュメントもお読みください。 http://weka.sourceforge.net/doc.stable/


私はあなたの支援に感謝します。どうもありがとう。あなたのコードとドキュメントのリンクは本当に私を助けてくれます。
Radia Karim

7

まず、カスタムストップワード用のテキストファイルを準備する必要があります。その後、次のコードを使用できます。

import weka.filters.unsupervised.attribute.StringToWordVector;

StringToWordVector filter = new StringToWordVector(10000);
filter.setStopwords(new File(".../stopwords.txt"));

それがあなたを助けることを願っています。


私はあなたの支援に感謝します。
Radia Karim

Java weka-apiプログラミングは非常に新しいです。はっきりわかりません。どなたか、もう少し複雑な答えを教えてください。よろしくお願いします。
Radia Karim

わからないところを教えてください。
Rejaul Karim
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.