ジオコーディング/ Gazetteer Webサービスを作成していますか?


14

Javaの系譜用のジオコーディングWebサービスを作成したいと思います。それは系図のためであるので、私は通りのレベルに行く必要はありません。郡に行くだけです。

系図データを見ると、名前のつづりの間違いは非常に一般的です。また、人々は多くの非標準の略語を使用します。たとえば、ボルチモア郡の場合は次のようになります。

  1. ボルチモア
  2. ボルチモア郡
  3. ボルチモア
  4. ボルチモア市

回答:


10

名前にのみ興味があるので、この質問は明確に地理的なものではないと思います。したがって、Stack Overflowで質問したいと思うかもしれません。質問には、州と修正された郡名の2つの情報で答えることができます。修正を実行するには、レーベンシュタイン距離例とjava実装)を使用して、ファジーデータを修正された値に一致させます。


+1それはおそらく本当です。レーベンシュタインは開始するのに適した場所のように見え、Postgresでもサポートしているようです。ありがとう。
ジェイアスクレン

レーベンシュタイン距離とGeonamesgeonames.org)のデータを組み合わせることでうまくいくと思います。ありがとう。
ジェイアスクレン

5

ジオコーディングサービスには、地理的ジオメトリデータ、関連付けられた地名辞典(名前付けと名前の代替を処理するため)、およびユーザーインターフェイス(検索を仲介するため)が必要です。リバースジオコーダーの場合は、トポロジバリデーターを追加する必要があります。Javaの場合、オープンソースのJTS Topology Suiteは自然な選択です。http//www.vividsolutions.com/jts/jtshome.htm

アメリカ合衆国の郡の形状は、国勢調査で見つけることができます:http : //www.census.gov/geo/www/cob/co2000.html

地名辞典を開始するために、米国地名委員会にはデータベースがあります:http : //geonames.usgs.gov/

堅実な地名辞典データベースを作成し、おおよその検索一致を許容するアルゴリズムを編むことは難しい部分です。


アルゴリズムは私が探しているものです。
ジェイ

セマンティック類似性アルゴリズムに関する問い合わせには、メインのStackoverflowサイトでより多くの回答者がいる可能性があります。
グレノン


1

Googleには、利用規約に従うことができれば、ジオコーディング用の優れたAPIがあります。基本的なデモはこちらにあります

サービスの使用にはいくつかの制限がありますが、結果はほとんどのユーザーにとって直感的で、高速で、正確であり、使い慣れています。これにより、サービスの系譜部分の開発に集中できます。


私は本当に外部のAPIに依存せず、すべてを家でホストしたいと思っています。
ジェイアスクレン

それでは、オープンソースライセンスのジオコーディングDBをお探しですか?
アダムマタン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.