セット交差のサイズを近似する通信の複雑さ


8

セット交差問題を検討してください。アリスとボブはそれぞれサブセットを取得し、それらのセットが交差するかどうかを知りたいと考えています。これは通信の複雑さの標準的な問題であり、この問題のランダム化されたプロトコルにはビットの通信が必要であることはよく知られています(こちらの調査を参照)。セットはサイズのものである場合にはのために、ランダム化プロトコルが必要であることが知られているビット(ここでは参照)。{1,,n}Θ(n)kknΘ(k)

次に、アリスとボブがセットの共通部分のサイズを知りたいバリアントについて考えます。明らかに、正確なサイズを計算すると、標準のセット交差問題になり、サイズの乗法近似のみを計算したい場合でもこれは成り立ちます。しかし、交差点のサイズの加法近似を計算したい場合はどうなりますか?この問題について既知の下限または上限はありますか?

小さなセットの設定、つまりセットのサイズがである場合に、この質問に特に興味があります。kn


1
さらに、2つの(n * 2 * c)ビットセットの交差のc近似は、少なくとも2つのnビットセットの交差の計算と同じくらい困難です。各ビットを2c回コピーし、交差サイズを最も近いcの倍数に丸めることにより、後者から前者に削減します。
daniello

1
古典的な集合の素性から -additive近似への次の削減が下限を与えると思います。近似を実現するプロトコルがあるとします。彼らのプレーヤーは元のビットのそれぞれをビットに複製します。したがって、交差がない場合、出力は最大でであり、交差がある場合、出力は少なくともです。これにより、下限が得られます。αα=f(n)n3f(n)f(n)2f(n)Ω(n3f(n))
Sajin Koroth

ありがとう!あなたのコメントを答えに変えれば、私はそれらを受け入れます。
またはMeir

1
サイズのの2つのサブセットを使用しない{1,,n}n常に交差しませんか?
ジェフリーアーヴィング

回答:


4

2つの上限を指定します。しましょうAと、それぞれアリスとボブに与えられたセットであり、Ba=|A|、、。b=|B|c=|AB|

まず、ランダム化されたプロトコルがあり、およびd>0ϵ>0、確率を計算の近似添加エラーまで、使用します1ϵcdO((min{a,b}d)2lognlogϵ1)通信の一部、およびランダム性のビット。O((min{a,b}d)2logmin{a,b}logϵ1)

プロトコルは次のようになります。

  1. もし、それはプロトコルおよび出力終了見ているパーティ推定値として。そうでない場合、アリスとボブはとを互いに通信しどちらが小さいかを判断します。以下ではそのログをと想定します。dmin{a,b}0abab

  2. アリスは独立した一様にランダムなサンプル、描画し、それらをボブに送信します。t=log(2ϵ1)a2/(2d2)aiAi<t

  3. ボブはをとして推定し。cat|{<taB}|

プロトコルはチャーノフ-Hoeffding境界によって正しい:場合、イベントの指標ランダム変数意味、次いで、、平均値とIID変数であり。したがって、 およびも同様です。バツaBバツ<tp=c/a

Pr[aバツ¯cd]=Pr[バツ¯pda]exp2da2tε2
Pr[aバツ¯c+d]

今、これらの境界は多少無駄であるか:また、チャーノフは述べ境界変異体が存在する これにより、サンプル数を約倍小さくすることができます。問題は、が近似する量そのものであるため、先にそれがわからないということです。これは、最初に大まかな見積もりを行うことで修正できます。ca

Pr[X¯pδ]exp(δ22pt),Pr[X¯p+δ]exp(δ23pt),δp,
tpp=c/ac

したがって、改良されたプロトコルはを使用して、確率で加法計算します通信のビット、およびランダム性のビット、それは次のようになります(定数は最適化されていません):1ϵdcO(min{a,b}d(1+cd)lognlogϵ1)O(min{a,b}d(1+cd)logmin{a,b}logϵ1)

  1. 同上。

  2. アリスは、描画からのランダムサンプルを、ボブに送信します。r=10(logϵ1)a/dA

  3. ボブは、これらのサンプルのいくつがに属しているかをカウントし、この数をアリスに送信します。Bs

  4. もし、出力のプロトコル終了。as/rd/20

  5. アリスはランダムサンプル、描画し、それらをボブに送信します。t=10sa/daiAi<t

  6. ボブはをとして推定し。cat|{i<t:aiB}|

詳細には触れませんが、上で引用したチャーノフの境界は、高い確率で値がs/rΘ(c/a)ませんが、であることを意味します。この場合、プロトコルは指定されたコストを超えず、高い確率で計算されますChernoff境界の別のアプリケーションによる適切な推定。c


役立つ回答をありがとう!ただし、セットが比べて小さい場合の方が興味があることを言及し忘れたことに気づきました。この設定でプロトコルを機能させる方法はありますか?申し訳ありませんが、混乱のために...n
あるいは、メイア

このような状況で加法近似とはどういう意味ですか?
EmilJeřábek18年

セットのサイズの定数から線形まで、意味のある任意の加法項までの近似に興味があります。
またはMeir

しかし、セットのサイズの一定の割合までのエラーは、乗法近似と同じですよね?
EmilJeřábek18年

ああ、そうですか、交差点がはるかに小さい場合でも、元の2つのセットのサイズの一部を許可します。
EmilJeřábek18年

3

[このタイプのエラーに関心がある場合は、何らかの理由でプロトコルを確定的にする必要がない限り、Emilの答えは明らかにより簡単です。おっとっと。]

小さな定数に対してタイプ加法近似に関心がある場合、重要なプロトコルがあります。±δnδ>0

たとえば、ここに1つあります。

  1. アリスとボブはそれぞれ、可能なセットアイテムから次のセットアイテムへのいくつかの正準マッピングに同意することにより、それらのセットをノード上のグラフとして解釈しnnnグラフの可能なエッジます。
  2. アリスとボブはそれぞれ、グラフの -regularityパーティションを計算します。パーティション(ビット)に加えて、パーティションセットの各ペア間のグラフの密度(ビット、密度がまで報告される場合(k,ε)O~(n)O~ε(n)n数字の精度でビット)。
  3. AliceとBobは、2つのパーティションのいずれかについて、(a)両方のエンドポイントがいずれかのパーティションセット内にある、(b)両方のエンドポイントが非標準セットペアの間にある、または(c)ペアのクロスするエッジを破棄するセットアリスのパーティションやでようにボブのパーティション内の は異常に小さいです。それらはアイテムの最大で一定の分数を捨て、付加的なエラーを引き起こしますが、(S1A,S2A)(S1B,S2B)
    max{min{|S1AS1B|,|S2AS2B|},min{|S1AS2B|,|S2AS1B|}}
    δ>0±δnδは選択により任意に小さくすることができますk,ε。これらのセット間のグラフは、指定された密度のランダムな2部グラフの統計に従います。

この種の近似が興味深い場合、他のグラフの規則性補題、特にフリーズカンナンからより多くの距離を得ることができます。 こちらが調査です。


ありがとう!規則性パーティションへの接続は興味深いものです。
または、メイア、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.