与えられた:
- ジオデータベースAという名前の100個のデータセットが含ま1 ... 100
- b 1 .. b 100という名前の100個のデータセットを含むジオデータベースB
プログラムで(*)各データセットのペア(a i、b i)が同じ内容であるかどうかを確認したい。100ペアを比較するので、効率的な比較方法が必要です。理想的には、全体の比較に数秒しかかからないでしょう。
(*) 注:コード例を探しているからではなく(喜んで受け入れます)、「プログラム的」という用語を使用していますが、非常に高速な比較方法を探していることを強調するために、 100のデータセットペアを手動で比較するときに可能です。
私はこの比較方法を自分で実装するつもりなので、基本的に探しているのはアルゴリズムであり、すぐに使えるツールではありません(おそらくオープンソースの場合を除きます)。
データセットの完全な内容を比較する必要があるため(おそらく、データ管理 → データ比較ツールセットのツールを使用するため)、私は不可能を尋ねている可能性が高いことを認識しています。または、少なくともデータセットのハッシュ/ダイジェストを比較しますが、ダイジェストを生成するには、最初にすべてのデータセットのデータを調べる必要があります。
したがって、これまでの私の最善のアプローチは次のとおりです。
(データセットの対た第一判断I、B iは)ことができない可能性が同一の内容を有します。
残りのデータセットのペアに対してのみ、完全なデータ比較を実行します。
私の質問:
ArcGISは、クエリを実行できるある種のデータセットダイジェストを自動計算しますか?もしそうなら、どうですか?
(私はそのようなことを何も知らないので、私は答えが「いいえ」であることを期待します。私を誤解してください。)
2つのデータセットに同一のコンテンツを含めることができないかどうかを判断する、非常に効率的で信頼性の高い方法は何ですか?
(これまでのところ、変更タイムスタンプの比較は信頼性がわかりませんが、データセットのスキーマの比較を検討しました。ArcGISジオデータベースのタイムスタンプの信頼性は?この目的に役立つ他のデータセット特性はありますか?)