ユーザーから位置情報(ポイント)を収集するWebサイトを作成しています。ユーザーの位置情報のプライバシーを保護するための手法を検討しています(たとえば、多くの場合、ユーザーは自宅の住所を共有しますが、これは機密情報です)。思いついたオプションの1つは、データベースに保存する前にポイントを難読化または「ハッシュ」することです。これにより、これらの機密データを保存する必要がなくなります。
基本的な要件は次のとおりです。
単一の難読化されたポイントがあると、そのポイントに関連付けられているすべてのメタデータ(つまり、データベース全体が危険にさらされていると仮定した場合)でも、1キロメートル以内に元のポイントを導出することはできません。
同じ元のポイントに対応する難読化されたポイントの任意の大きなセットを考えると、元のポイントを導出することはまだできません。(たとえば、簡単な手法は、元のポイントにランダムなベクトルを追加することですが、これを十分に行うと、難読化されたポイントが元のポイントの周りにクラスター化されます。)
この段階でどのプロパティが重要であるかはわかりませんが、さまざまな統計プロパティが保存されていると便利です。たとえば、難読化されたポイントがグリッドに蓄積されるのではなく、「自然な」方法で分散するようにします。ただし、プライバシーはこれよりも重要です。