15
Pythonのnグラム、4、5、6グラム?
テキストをNグラムに分割する方法を探しています。通常、私は次のようなことをします: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams nltkはバイグラムとトライグラムしか提供していないことを知っていますが、テキストを4グラム、5グラム、さらには100グラムに分割する方法はありますか? ありがとう!