言語学者や他の多くの科学者にとって、テキストに現れる単語の頻度を分析することは素晴らしいツールです。一部の商用テキストエディタと一部のWebサイトは、このツールを提供しています。
単語の頻度分析。単語を頻度の降順で並べ替えます。このテキストの例
Emacs Stack Exchange is a question and answer site for those using, extending, or developing the emacs text editor. It's built and run by you as part of the Stack Exchange network of Q&A sites. With your help, we're working together to build a library of detailed answers to every question about emacs.
我々は持っています:
56 words
9: punctuation marks
3: ,
3: .
3: a
3: emacs
3: of
2: '
2: and
2: exchange
2: question
2: stack
2: the
2: to
1: &
1: about
1: answer
1: answers
1: as
1: build
1: built
1: by
1: detailed
1: developing
1: editor
1: every
1: extending
1: for
1: help
1: is
1: it
1: library
1: network
1: or
1: part
1: q
1: re
1: run
1: s
1: site
1: sites
1: text
1: those
1: together
1: using
1: we
1: with
1: working
1: you
1: your
そのような統計を提供するために使用できるパッケージがすでに存在するかどうか疑問に思っています。
PS私はすでに同じエスプリで別の質問をしてきましたが、すばらしい答え が得られました(できればもっと賛成したいと思います)。
さらに一歩進んで逆インデックスを作成するのが望ましいでしょうか?(逆インデックスを指定して単語の頻度を評価することは簡単ですが、インデックスを使用して、2つの単語がドキュメント内で接近して表示されるかどうかなど、他の興味深いものを見つけることができます)。私は最近Sphinxで遊んでいるので、Emacsに接続すると検索オプションが増えるでしょうか?
—
wvxvw
@wvxvwはい、それは素晴らしいアイデアでしょう。私はSphinxの経験はありませんが、emacsで使用する方法を知っている場合は、それについて知っていただければ幸いです。
—
名前