したがって、ブルームフィルターは非常にクールです。これらは、偽陰性のないメンバーシップチェックをサポートするセットですが、偽陽性の可能性はわずかです。しかし最近、私は反対を保証する「ブルームフィルター」を望んでいます:偽陽性はなく、潜在的に偽陰性。
私の動機は単純です:処理するアイテムの(大量の)ストリームが大量にある場合、前に見たアイテムの処理を避けたいと思います。複製を処理するのに害はなく、時間の無駄です。しかし、要素の処理を怠ると、壊滅的なものになります。「逆ブルームフィルター」を使用すると、スペースのオーバーヘッドがほとんどないアイテムを保存し、セット内のメンバーシップをテストすることで、重複の処理を高い確率で回避できます。
しかし、私はそのようなものを見つけることができないようです。私が見つけた最も近いものは「レタッチされたブルームフィルター」です。これにより、選択された誤検知をより高い誤検知率と交換することができます。ただし、すべての誤検知を削除したい場合、それらのデータ構造がどれだけうまく機能するかはわかりません。
誰でもこのようなものを見ましたか?:)