1
Jaro-WinklerとLevenshteinの距離の違いは?[閉まっている]
クローズ。この質問はもっと焦点を合わせる必要があります。現在、回答を受け付けていません。 この質問を改善したいですか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てるようにします。 6年前に閉鎖されました。 この質問を改善する 複数のファイルからの何百万ものレコードのあいまいマッチングを行う必要があるユースケースがあります。そのための2つのアルゴリズムを特定しました。Jaro-WinklerとLevenshteinの編集距離です。 両方を調べ始めたとき、2つの正確な違いが何であるかを理解することができませんでした。Levenshteinは2つの文字列間の編集数を示し、Jaro-Winklerは0.0から1.0の間の正規化されたスコアを提供しているようです。アルゴリズムがわかりませんでした。 どちらかのアルゴリズムを使用する必要があるため、この2つのアルゴリズムの根本的な違いを知る必要があります。 次に、この2つのアルゴリズムのパフォーマンスの違いについて知りたいと思います。