ああ、この質問。まず、住所検証会社のSmartyStreetsで働いているとしましょう。
米国のジオコードデータは通常、無料と高価の2つの基本的なソースから取得されます。少し行きましょう。
無料のジオコードデータは米国国勢調査局から提供されています。USGSから、あるいはUSPSからのものであると言う人もいますが、根源は米国国勢調査局です。それらには、TIGERデータと呼ばれる、ストリートセグメント座標のやや包括的なデータセットがあります。TIGERデータは無料でダウンロードできます(ただし、使用できるようにするためには多くの操作が必要です)。USPSは、TIGERデータに結び付け、それを郵便番号(地政学的な境界ではなく、USPS配信エリアに基づく)にマップしようとしました。このTIGERデータを地理座標のソースとして利用するさまざまなサービスがあります。さまざまなアルゴリズムを使用して、ストリートセグメントに沿った住所の位置を決定し、そのアルゴリズムに基づいてジオコードを補間します。ソースデータ(無料)のデータコストとライセンスコストが低いため、多くのサービスで、クライアントは出力データの一部であるジオコードデータを保存できます。SmartyStreetsは、データを使って好きなことができると信じている人の1人です。
無料のジオコードデータは、多くの高価なソースから取得されます。これらのソースは通常、独自のデータをコンパイルしますが、他のソースからのライセンスデータでそのデータを補強します。googlemaps、nokia、navteq、bingマップ、yahoo、mapquestなどのソースがあります(そうです、これらの一部は他のユーザーが所有しています)。データの取得ははるかに高価であり、ライセンスは一般的にクライアントを禁止しています応答データの保存から。
したがって、無料のソースデータと高価なソースデータがあります。通常、そのコストは、より制限的なライセンスの形式で渡されます。お役に立てば幸いです。
以下は、出力データの保存を可能にするプロバイダーの短いリストです(確かに他にもあります)。
geocod.io smartystreets.com yaddress.net
ちなみに元の投稿で参考にした表を作ったのは私です。私はSmartyStreetsで一日中住所データを扱います。
--update-- @zsero実際には、米国国勢調査局から入手可能なデータと同様のデータが多くの国から入手可能であると思います。たとえばオーストラリアなどです。ただし、データの取得元は必ずしも国ではなく、正確さのレベルです。たとえば、米国国勢調査局のデータは、ストリートセグメントにはかなり正確な地理座標を提供しますが、住所には提供しません。ストリート形状を指定するシェープファイルに沿ったそのストリートセグメント(ストリートの始点または終点)からのアドレス補間は、アドレスがストリートに沿っている可能性がある場所の「推測」を可能にするものです。これは統計分析に非常に適しています。しかし、精密なスカイダイビングや外科的なミサイル攻撃のようなものでは、それだけでは十分ではありません。屋上レベルのジオコードデータが必要になります。通常それは自由と高価なデータとの間の差です。