タグ付けされた質問 「transliteration」

12
Unicode文字から発音区別符号(charǹňñṅņṇṋṉ̈ɲƞᶇɳȵ)を削除する
分音記号付きの文字(チルダ、サーカムフレックス、キャレット、ウムラウト、キャロン)とその「単純な」文字との間でマッピングできるアルゴリズムを探しています。 例えば: ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n á --> a ä --> a ấ --> a ṏ --> o 等。 私はこれをJavaで実行したいのですが、Unicodeのようなもので、どの言語でも簡単に実行できるはずです。 目的:分音記号付きの単語を簡単に検索できるようにします。たとえば、テニスプレーヤーのデータベースがあり、Björn_Borgが入力されている場合は、Bjorn_Borgも保持するので、誰かがBjörnではなくBjornに入った場合にそれを見つけることができます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.