現在、一意のStoreKey/ProductKey
組み合わせを含む2つのデータセットを比較しています。
1番目のデータセットには、StoreKey/ProductKey
2012年1月から2014年5月の終わりまでの販売の一意の組み合わせがあります(結果= 45万行)。2番目のデータセットには、StoreKey/ProductKey
2014年6月から今日までの販売の一意の組み合わせがあります(結果= 19万行)。
私はStoreKey/ProductKey
、2番目のセットにはあるが、1番目のセットにはない組み合わせ、つまり6月初旬から販売された新製品を探しています。
これまで、2つのデータセットを一時テーブルにダンプし、両方のキーで両方のテーブルのインデックスを作成し、EXCEPT
ステートメントを使用して一意のアイテムを見つけました。
このような大きなデータセットを比較する最も効率的な方法は何ですか?このタイプの大規模な比較を行うより効率的な方法はありますか?