私の会社は、過去11年間のクライアントのWordpress 2ブログ投稿のPivotViewer視覚化を作成することを目指しています。ただし、これを行うには、並べ替え可能なカテゴリとして使用するために、やや無計画で不完全な、一般に不十分なタグを編集する必要があります。私たちは彼らのブログのエントリを分析し、単語カウントを実行して、私たちが何を扱っているかを理解するためのツールを探しています。
理想的には、これらの機能をすべて備えています。
- 単語のブラックリスト化(無視)
- 単語ステミング
- カスタム同義語のマージ
- すべての用途を数える
- 単語が表示される投稿の数を数えます。
この種のテキスト分析は非常に一般的だと思っていたでしょうが、この種のことを行うソフトウェアをブログ全体で見つけることはできませんでした。これを行うためのソフトウェアはありますか?