ジオコーディングアルゴリズムに関する優れたリソース


19

ジオコーディングアルゴリズムに関する優れたリソースを知っていますか?

クエリの一部の照合と重み付け、スペルミスやバリエーションの処理、物理データストレージの詳細(直接リレーショナルデータベースクエリのスキーマ、データインデックスへのアプローチなど)を含むアドレスクエリ解析に特に興味があります。 。

ArcGIS 10ジオコーディングに関するいくつかのドキュメントを調べましたが、実際の実装の詳細については少し触れています。他の高品質の実稼働実装の詳細なドキュメントも役立つ場合があります。技術的であればあるほど良い。理論的なアルゴリズムの論文も素晴らしいです。

ありがとう。

回答:


14

テキストから地理座標へ:ジオコーディングの現状

ダニエル・W・ゴールドバーグ、ジョン・P・ウィルソン、クレイグ・A・ノブロック 進化するジオコーディングの概念と、プロセスの基本的なコンポーネントを探ります。頻繁に発生するエラーと不確実性の原因、およびそれらを定量化するために使用される既存の対策について説明します。ジオコーディングプロセスの一般的な落とし穴と永続的な課題の調査が提示され、それらを克服するための従来の方法が説明されています。

10.1.1.119.714.pdf

PDF(34ページ以降) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.714&rep=rep1&type=pdf


間違ったリンクを持っていると思います、citeseerx.ist.psu.edu / viewdoc /…
アンディW

@thanks 10.1.1.119.714.pdfは、更新された正しい投稿です-別の命名規則が良いでしょう。
マッパーズ

6

Mapperzにリンクされている論文は非常に優れており、おそらく興味のある引用がたくさんありますが、文字列の一致とジオコーディングのプロセスに対するその重要性を説明するのに非常に良い仕事をしているとは思いません。彼らは簡単にSoundexに言及しましたが、Soundexが唯一のオプションではなく、IMOのアドレスに最適なオプションでさえありません。彼らはトピックに関連するかなりの数の引用をリストアップしたので、それらの論文はあなたの興味を引くでしょう。

Stats Exchangeサイトのこのスレッドは、2組の文字列のあいまい一致について説明しています。アドレスを一致させる場合、同じ手法がすべて適用されます。特に、Soundexよりも編集距離を使用する方が理にかなっていると思います。特にSoundexアナログを持たない住所の詳細の場合はそうです。2つの文字列間のレーベンシュタイン距離の計算はそれほど複雑ではなく、インターネット上に浮かぶたくさんの例があります(こちらはPython の例です)。

過去1時間、ESRIがどのようにスペルの感度と異なる候補と一致スコアを実装するかを見つけようとしていました。簡単な説明だけを見つけました(このPDFと9.3のオンラインヘルプセクションで見つけた最高の説明)。だから誰かが私にいくつかのより詳細なドキュメントを教えてくれたら、私はOPと同様に感謝するでしょう。




弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.