ジオコードの品質:Nominatim対PostGIS Geocoder対Geocoder :: US 2.0


14

時々、ジオコーディングする必要がある>> 500,000米国の住所(フィーチャまたは交差点なし)。これらのバルクジオコードを処理するために、ジオコーディングサービスをローカルに設定したいと思います。

過去にTigerベースのGeocoder :: US 2.0をローカルで使用しました。特にRubyパーサーに依存せず、住所要素を明示的にジオコーダーに渡す場合、初期ベンチマークはGoogleでジオコーディングされた住所に対して妥当な精度を提供します。

PostGIS Geocoderについてもよく読んでいます。私のデータはすでにPostGISにあるので魅力的ですが、試してみるためにローカルに設定していません。

また、誰かがNominatimをローカルで試すことを勧めました。私が知る限り、Tigerベースではないことを除いて、私はそれについてあまり知りません。そして、より信頼できる結果が得られるかどうか疑問に思っています。

上記のソリューションの経験がある人への私の質問:3つの精度はどのように比較されますか?具体的には、米国の番地に最も一貫して信頼できるジオコードを提供するのはどれですか?私は、速度やセットアップの複雑さを過度に心配していません。

回答:


14

NominatimおよびGeocoder USジオコーダーをテストする機会がありませんでした。しかし、私の理解では、GeocoderとNominatimはデータベースで直接実行することはできません。これは、トリガーやデータベースでのバッチ更新などでの使用が困難になるため、私にとって大きな欠点です。

PostGISジオコーダーは、plpgsql関数の純粋なPostGIS / postgresqlセットであり、データベースで完全に実行されます。Geocoder USおよびPostGISジオコーダーの結果は同等であり、Webを使用してテストした結果と同じであると予想されます。グーグルは地名を利用しているため、少し優れています。

NominatumはOSMデータを使用するので、OSMが米国向けにインポートするため、間接的にtigerデータを使用するため、その多くはユーザーが修正したTIGERからのものだと思います。Tiger OSMのヴィンテージ(年)が現在何になっているのかわかりません。Webインターフェースをオンラインでプレイすることで、場所名も利用し、必要なズーム精度を設定することでジオコーディングの高速化を可能にするジオコーディングのズームレベルを指定できるという興味深いねじれがあります。

完全な開示-PostGIS Geocoderで多くの作業を行っており、オンラインマニュアルを作成しました。私が取り組んでいるバグは、それが補間するポイントの位置が通りの反対側にあると思うということです。私はそれを修正することに取り組んでいます。道路のどちら側に気を配ることができない場合(少なくとも時には)、それはあなたにとって問題ではないかもしれません。

いくつかの住所の結果を比較するオンラインバージョンでテストする場合、おそらく価値があります。たとえば、ここでテストできるnominatim:http : //open.mapquestapi.com/nominatim/v1/search.php

私の使用例では、ノミナタムのファジーチェックはPostGIS Geocoderほど優れていません。たとえば、私のバニティストリートアドレス(住所)は、マサチューセッツ州ボストンのデボンシャープレイス1です。PostGISは、私が覚えている限り近い答えを返します。Googleは答えを返しますが、Nominatimに答えを返すことはできません。公平を期すために、ボストンの小包記録でさえ、これがどこにあるのか、そしてワシントン通りとして小包記録に記載される手掛かりがありません。PostGISは、さまざまなレベルのチェックや交差点の交差点などを行うため、それを見つけることができます。意図的に間違ったzipを入力したり、PostGISが正確なオプションセットで戻ってくる他のケースをテストしました。Googleも同じです。


additonalコメント:いくつかのアドレス結果を比較するオンライン版でテストしながら、おそらく価値がある:例えばnominatimあなたはここでテストすることができます。 open.mapquestapi.com/nominatim/v1/search.php
LR1234567

回答ありがとうございます!来週かそこらでベンチマークを行いますが、これまでPostGIS Tigerのコーダーに感銘を受けました。
ダンペロタ

もちろん、初心者のたまにハングアップすることを除けば、postgis.refractions.net
pipermail

tigergeocoder.comは TIGER 2013データを使用して、Amazon EC2クラウドで独自のサーバーインスタンスを実行し、1日あたり1,000,000以上のジオコードを実行する準備ができています。あなたが述べたように、PostGISはZillow Neighborhoodsもロードし、住所部分のFIPSコードを返します。Googleに似ていますが、独自のサーバーのREST API。クォータは不要です。
ビバ

Nominatimは高速で実行され、2019年の新しいトラデータより正確になる傾向があります。エリアを推定するわけではなく、アドレスの推測は優れています。
アンドリュースコットエヴァンス

-1

技術的には、TigerとOSMデータベースを1つの巨大なサーバーにスタックし、Nominatum OSM内で構築できます。Tigerは簡単にインポートでき、OSMサーバーを補完します。

だれでも、取り戻すデータの品質は屋上にはなりません。OSMは、米国の住所の正確性に欠けています。場合によっては、元のターゲットから90マイルも離れていることがあります。

また、Tigerデータベースは、番地の位置を予測するために割り当てられた補間アルゴリズムのために正確ではありません。一般に、彼らは実際の目標を300フィートから数マイルにオフセットします。

独自のジオコーダーを構築する場合と商用のものを使用する場合は、時間とホスティングリソースを評価する必要があると思います。商用のものを使用すると、屋上の場所を取得し、何も心配することはありません。500kの価格は、さまざまなベンダーで約600〜800ドルです。


2
あなたの答えはあなたの会社と何の関係がありますか?この例では不必要な免責事項を装って、あなたのウェブサイトへのリンクを含む署名を含めているように見えるので、私はそれを編集しています。いかなる場合でも、免責事項にリンクを含めないでください。
PolyGeo
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.