セットファミリのセットインクルージョンポーズをどのくらい速く計算できますか?


20

ユニバースサブセットのセットファミリーが与えられます。ましょうし、答えがあると私たちが望む。FUS1,S2FS1S2

私はこれに素早く答えることができるデータ構造を探しています。私のアプリケーションはグラフ理論からのもので、頂点とその近傍を削除すると孤立した頂点が残るかどうかを確認し、各頂点についてはそれが残すすべての孤立した頂点をリストします。

完全なポセットを作成するか、最終的にテーブルを作成して、どのセットが互いのサブセットであるかを正確に伝えます。|F|2

ましょ、および、と仮定するm=SF|S|u=|U|n=|F|u,nm

我々が生成することができるに封じ込めマトリックス(二部グラフ)時間、次いで、全てのテーブルを作成することができにおける比較各セットのために、時間をすべての他のセットのすべての要素を介して、ループのないサブセットとしてセットをマークそれらは要素がでない場合。合計時間。n×uO(un)n2O(nm)SFSSO(nm)

何かもっと速くできますか?特に、時間は可能ですか?O((n+u)2)

関連記事をいくつか見つけました。

アルゴリズム を与えるサブセット部分順序(1995)計算するための単純なサブ2次アルゴリズム。O(m2/log(m))

サブセット半順序:コンピューティングと組み合わせ論はやや上記だけでなく、上記の紙がで問題を解決することを主張向上時間、共通の要素を共有するセットの最大数であるが、私はこの結果を理解することができませんでしたが。O(md)d

BetweenとO(nm)O(nα)の記事で、著者は、行列乗算を使用して頂点の閉じた近傍を削除した後、接続されたコンポーネントをグラフで見つける方法を示しています。これを使用して、ランタイムがであるシングルトンであるすべてのコンポーネントを見つけることで、セットの包含ポーズを計算できます。O((n+u)2.79)

また、このフォーラムのディスカッションは関連しています: セットの包含をチェックする最も速い方法は何ですか? これは下限を意味します。O(n2ϵ)


単なる提案:設定して質問を簡素化できますか?または、アプリケーションで両方のパラメーターが重要ですか?u=n
コリンマッキーラン14

私のアプリケーションでは、があります。ここでは漸近的に小さいことを意味します。u<<n<<2u<<
マーティンヴァットシェル14

回答:


2

ランダム性が範囲内にある場合、1つの大まかなアイデアは、「ランダムな単調な署名」関数の束を生成し、それらを使用してサブセット関係(la Bloomフィルター)を近似することです。残念ながら、私はこれを実用的なアルゴリズムにする方法を知りませんが、考えがすぐに不可能であることを証明しないいくつかの推定があります。これは有用な解決策とはほど遠いですが、それが役立つ場合に備えて書きます。

簡単にするために、セットはすべてほぼ同じサイズであると仮定します、およびその。想定できますが、それ以外は完了です。定義 ことを注意。|S|=s±O(1)s=o(u)1s

q=[s/2]p=[(uq)(sq)]
p1

これは非常に非現実的な部分です。ランダムに選択しサブセット交換、サイズの各々と、および関数定義することにより IFFいくつかのための。固定され、ランダムに変化する、我々は ため、単調であり、意味しますpA1,,ApUqf:2U{0,1}f(S)=1AiSiSAi,f

Pr(f(S)=0)=Pr(i.AiS)=Pr(A1S)p=(1(sq)/(uq))p=eΘ(1)
f(S)STf(S)f(T)。場合は、いくつかの修正。が検出する確率は TStTSfTS
Pr(f(S)=0<1=f(T))=Pr(f(S)=0)Pr(f(T)=1|f(S)=0)=eΘ(1)Pr(i.AiT,AiTS0|f(S)=0)=eΘ(1)Pr(i.tAiT|f(S)=0)eΘ(1)Pr(i.tAiT)eΘ(1)pPr(tA1T)eΘ(1)p(sq1)/(uq)eΘ(1)pqsq(sq)/(uq)=eΘ(1)
これらの手順の一部は非常に不十分ですが、今夜それらを改善する時間はありません。いずれにせよ、それらがすべて成り立つ場合、少なくともサブセットを非サブセットと区別する合理的な可能性のあるシグネチャ関数をランダムに生成することは、少なくとも明らかに不可能ではありません。そのような関数の対数の数は、すべてのペアを正しく区別します。署名関数生成と計算を時間に短縮できる場合、結果は全体のアルゴリズムになります。ff(S)O~(n+u)O~(n2+u2)

上記の計算が正しい場合でも、目的の機能を備えた単調な署名関数を迅速に生成する方法がわかりません。また、この手法が大幅に異なるセットサイズに拡張されない可能性もあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.