2
Pythonでの高性能ファジー文字列比較、Levenshteinまたはdifflibを使用[終了]
休業。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善してみませんか?この投稿を編集して、事実と引用で回答できるように質問を更新してください。 4年前休業。 この質問を改善する 私は、臨床メッセージの正規化(スペルチェック)を行っています。このチェックでは、指定された各単語を900,000単語の医学辞書と照合します。時間の複雑さ/パフォーマンスについてもっと心配しています。 あいまいな文字列比較を行いたいのですが、どのライブラリを使用するかわかりません。 オプション1: import Levenshtein Levenshtein.ratio('hello world', 'hello') Result: 0.625 オプション2: import difflib difflib.SequenceMatcher(None, 'hello world', 'hello').ratio() Result: 0.625 この例では、どちらも同じ答えを出します。この場合、どちらも同じように機能すると思いますか?