Excel 2013のあいまい検索を使用して、ほぼ同じテキストを検索する


4

私は多数のほぼ重複しているキャプションのリストを持っています。例えば:

  • 彼女の誕生日
  • 彼女の誕生日に
  • 誕生日 - 彼女のために
  • 彼女/誕生日のために

これらのほぼ重複する部分を強調する方法として、私はあいまい参照を検討していました。

回答:


3

これらのほぼ重複する部分を強調する方法として、私はあいまい参照を検討していました。

Excelのあいまい参照アドインは、Excelのテキストデータのあいまい一致を実行します。


Excel用ファジールックアップアドイン

Excelのあいまい参照アドインは、Microsoft Researchによって開発されました。   Microsoft Excelでテキストデータのあいまい一致を実行します。

単一のテーブル内であいまいな重複行を識別するために使用できます。   あるいは、2つの異なるテーブル間で同様の行をあいまい結合します。の   照合はスペルを含むさまざまなエラーに対して堅牢です。   間違い、略語、同義語、追加/欠落データ。

たとえば、行が「Mr.」であることを検出する可能性があります。 Andrew Hill」、「Hill、   「Andrew R.」と「Andy Hill」はすべて同じ基本的実体を参照しています、   各一致とともに類似性スコアを返します。

デフォルトの設定はさまざまなものに適していますが   製品名や顧客の住所などのテキストデータ   マッチングは特定のドメインや言語に合わせてカスタマイズすることもできます。

ソース Excel用ファジールックアップアドイン


類似度しきい値の設定に関する提案はありますか?

Excelであいまい参照を実行する Similarity Threshold設定に関するヒントがいくつかあります。


私のキャプション表はアルファベット順の単一の列です。それで、テーブルをそれ自身と比較して、近い重複を見つけたいと思います。私がオンラインで見た例のほとんどは、2つの異なるテーブルを使用しています。単一のテーブルをそれ自体と比較するようにLookupを設定する方法の例はありますか?
Tim

私の知っていることではない。 2列目の表を複製してから、元の複製と複製を比較しましたか。
DavidPostill

それがトリックかもしれません!私はそれを試してみて、あなたに知らせます。類似度しきい値の設定に関する提案はありますか?ありがとうございます。
Tim

「Excel用のあいまい参照アドインの例」を検索すると、調査できるリンクがいくつかあります。
DavidPostill

k2e.com/tech-update/tips/431-tip-fuzzy-lookups-in-excel Similarity Threshold設定に関するヒントがいくつかあります。
DavidPostill
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.