poset上の単調な述語を学習するために必要な最悪の数の質問


15

検討(X,)上の有限poset nアイテム、およびP上未知単調述語X(いずれかのために、すなわち、xyXあれば、P(x)及びxy次いでP(y))。私は評価できるP一つのノードを提供することにより、xXと場合見つけ出すP(x)成立するかではありません。私の目標は、ノードxのセットを正確に決定することですxXように、P(x)のいくつかの評価として使用して、保持Pできるだけ。(以前のすべてのクエリの回答に応じてクエリを選択できます。すべてのクエリを事前に計画する必要はありません。)

S(X,)PPr(S,P)SPPSwr(S)=maxPr(S,P)Swr(S)=minSwr(S)

私の質問は次のとおりです:入力としてポゼットを指定すると、最適な戦略の最悪の実行時間をどのように決定できますか?(X,)

[空のposetのクエリが必要であり(各単一ノードについて尋ねる必要がある)、クエリの全体の順序が必要であることは明らかです(バイナリ検索を実行して検索しますフロンティア)。より一般的な結果は、次の情報理論的な下限です。述語可能な選択肢の数は、の反の数です単調な述語との最大要素として解釈されるアンチチェーン)。したがって、各クエリは1ビットの情報を提供するため、少なくともが必要になります。nlog2nPNX(X,)Plog2NX前の2つのケースを含むクエリ。これは厳しく制限されているのでしょうか、それとも学習はアンチチェーンの数よりも漸近的に多くのクエリを必要とするような構造のポーズですか?]


2
これは、このトピックに関する前回の質問とどう違うのですか?cstheory.stackexchange.com/questions/14772/...
スレシュヴェンカト

1
同意しましたが、似ていますが、ここでは、完全なラティスのようには見えない幅の狭いポーズを含む一般的なポーズについて興味があります。その上、私はもう少し複雑さや種類のことについては気にせず、ポゼットの選択の機能として必要なクエリの数だけで。この設定では、ブール関数の解釈は適用できず、答えはポゼットの「構造」に依存するように見えます(多分、アンチチェーンの数かもしれません)。うまくいけば、これが別の質問に値することを願っています。間違っていた場合は閉じてください。
a3nm

1
参考までに、複雑さの文献では、定義した戦略は通常「決定木」と呼ばれ、高さ(関心のある尺度)とサイズの標準的な概念があります。
ジョシュアグロチョウ

ありがとう、ジョシュア!私はこれに多かれ少なかれ気づいています、ゲーム理論からの語彙を使用する方が簡単だと思っただけですが、はい、戦略は木として見ることができることを知っています。
a3nm

1
(問題ありません。ちなみに、私はそれが木として見ることができることを指摘しただけではありませんでした。おそらくこのサイトを頻繁に多くの人にすぐになじみのある用語に加えて、を検索することができ乾杯)!
ジョシュアGrochow

回答:


7

これは完全な答えではありませんが、コメントするには長すぎます。

私はバインドされているため例見つけたと思うタイトではありませんが。log2NX

次のポーズを検討してください。接地セットは、及びiがより小さいのB jの全てについてI J { 1 2 }。他のペアは比較できません。(ハッセ図は4サイクルです)。X={a1,a2,b1,b2}aibji,j{1,2}4

単調な特性をポーズのアップセットで特定します。このposetは、7体の不調有する{ B 1 }{ B 2 }{ B 1B 2 }{ 1B 1B 2 }{ 2B 1B 2 }{ Aを1a 2b 1{b1}{b2}{b1,b2}{a1,b1,b2}{a2,b1,b2}、およびこのポーズには7つのアンチチェーンがあります。これは、アンチチェーンがアップセットと1対1で対応しているためです。だから、ログ2 N X= ログイン2 7 = 3をこのposetため。{a1,a2,b1,b2}log2NX=log27=3

さて、敵対的な議論によって、どの戦略も少なくとも4つのクエリが必要であることを示します(したがって、すべての要素をクエリする必要があります)。任意の戦略を修正しましょう。

戦略が最初に照会する場合は1を、そして敵の答えは、「P 1を保持しません。」:次に、我々は、5つの可能性が残されている{ B 1 }{ B 2 }{ B 1B 2 }{ 2B 1B 2 }。したがって、そうであるかを決定するために、我々は、少なくとも必要ログ2 5 = 3a1P(a1){b1}{b2}{b1,b2}{a2,b1,b2}log25=3より多くのクエリ。合計で、4つのクエリが必要です。最初のクエリがある場合は、同じ引数が適用されます2a2

戦略が最初に照会すると、敵は「P b 1が成立します。」と答えます。次に、5つの可能性が残っています:{ b 1 }{ b 1b 2 }{ a 1b 1b 2 }{ a 2b 1b 2 }{ a 1a 2bb1P(b1){b1}{b1,b2}{a1,b1,b2}{a2,b1,b2}。したがって、以前と同じように少なくとも3つのクエリが必要です。合計で、4つのクエリが必要です。最初のクエリが b 2の場合、同じ引数が適用されます。{a1,a2,b1,b2}b2

我々が取る場合このposetの並列コピーを、それが持つ7つのk antichainsを、したがって結合が提案されているログ2 7 K= 3 Kを。ただし、各コピーには4つのクエリが必要なので、少なくとも4 kのクエリが必要です。k7klog27k=3k4k

おそらく、より大きなギャップを持つより大きなポーズがあります。しかし、この引数は係数を改善するだけです。

ここで、問題は、クエリがサーチスペースを均等に分割しない状況であるように見えます。そのような場合、敵は大きな半分を強制的に残すことができます。


1
ああ、面白い。あなたの例を一般化、それは答えがある場合ことは明らかだI ¬ P IおよびI P B Iのすべてまで、私たちは確かにそれを知ることができません2 n個のノードが照会されます。ただし、2 nX={a1,...,an,b1,...,bn}i,¬P(ai)i,P(bi)2nアンチチェーン( 2 n1 a iの空でないサブセット、 b iのidem、および空集合)。したがって、境界は2倍にタイトではありません。この例に感謝します。しかし、ギャップがどのように/どのようにすればギャップが乗法因子よりも大きくなるか、または自明でない上限が見つかる場合、正確な答えのためのアルゴリズムは言うまでもありません。2n+112n1aibi
a3nm

7

彼らの論文では、Every Poset Has a Central Element、LinialおよびSaksは、ポゼット理想的な同定問題を解決するために必要なクエリの数が最大でK 0 log 2 i X であることを示しています(K 0 = 1 /2 - ログ21 + ログ2 5 及びI Xはの理想の数であるX。彼らが「理想」と呼ぶものは、実際には低いセットですXK0log2i(X)K0=1/(2log2(1+log25))i(X)Xそして、単調な述語とそれらが保持しないポイントの下位セットとの間には明らかな1対1の対応があります。「識別問題」は、私の設定のようにノードを照会することで識別することです。私が興味を持っている問題とを扱う。i(X)=NX

そのため、彼らの結果によると、情報理論的下限は比較的小さな乗法定数まで厳密です。したがって、これは基本的に、必要な質問の数の質問を関数として乗法定数まで解決します。log2 N XK 0 log 2 N Xの間です。NXlog2NXK0log2NX

リニアルとサックスは、シアラーによる個人的なコミュニケーションを引用して、K 0のわずかに小さい一部のK 1に対して下限を証明できる既知の順序があると述べています(これは、K 1の値を小さくするためにこのアプローチを試みた岡本義雄の回答。K1log2NXK1K0K1

これは完全に質問の数を計算するの私の質問に答えていないから、必要な以来、しかし、コンピューティングN XをからXは#P完全である私は少し希望があるという感覚を持っています、。(この点についてのコメントは歓迎します。)それでも、LinialとSaksによるこの結果は啓発的です。XNXX


5

For the Boolean n-cube ({0,1}n,) (or, equivalently, for the poset (2S,) of all subsets of an n-element set), the answer is given by Korobkov and Hansel's theorems (from 1963 and 1966, respectively). Hansel's theorem [1] states that an unknown monotone Boolean function (i.e., an unknown monotone predicate on this poset) can be learned by a deterministic algorithm making at most ϕ(n)=(nn/2)+(nn/2+1) queries (that is, asking ϕ(n) questions in the worst case). This algorithm matches the lower bound of Korobkov's theorem [2], which says that ϕ(n)1 queries do not suffice. (So Hansel's algorithm is optimal in the worst-case setting.) An algorithm in both statements is understood as a deterministic decision tree.

The logarithm of the number of antichains in ({0,1}n,) is asymptotically equal to (nn/2)2n/πn/2logNXϕ(n)2(nn/2) for this poset.

Unfortunately, I have not been able to find a good treatment of Hansel's algorithm in English available on the web. It is based on a lemma that partitions the n-cube into ϕ(n) chains with special properties. Some description can be found in [3]. For the lower bound, I don't know any reference to a description in English.

Since I am familiar with these results, I can post a description on arXiv, if the treatment in Kovalerchuk's paper does not suffice.

If am not much mistaken, there have been attempts to generalize Hansel's approach, at least to the poset (Ekn,), where (Ek,) is a chain 0<1<<k1, although I cannot give any reference straight away. For the Boolean case, people have also investigated notions of complexity other than worst-case for this problem.

[1] G. Hansel, Sur le nombre des fonctions booléennes monotones de n variables. C. R. Acad. Sci. Paris, 262(20), 1088-1090 (1966)

[2] V. K. Korobkov. Estimation of the number of monotonic functions of the algebra of logic and of the complexity of the algorithm for finding the resolvent set for an arbitrary monotonic function of the algebra of logic. Soviet Math. Doklady 4, 753-756 (1963) (translation from Russian)

[3] B. Kovalerchuk, E. Triantaphyllou, A. S. Deshpande, E. Vityaev. Interactive learning of monotone Boolean functions. Information Sciences 94(1), 87-118 (1996) (link)


Thanks a lot for this detailed answer! For the Boolean n-cube, cf <cstheory.stackexchange.com/q/14772>. I can read French but couldn't find Hansel's paper (should have been available on Gallica but this issue seems to be missing), I found relevant info in Sokolov, N.A. (1982), "On the Optimal Evaluation of Monotonic Boolean Functions", USSR Comput Math Math Phys, Vol 22, No 2, 207-220 (English translation exists). I'm interested about generalizations to other DAGs if you can find refs. Don't hesitate to reply by email (a3nm AT a3nm DOT net) if length limit is a problem. Thanks again!
a3nm

You are welcome! Unfortunately, I do not know how to bound the algorithm running time in terms of output size. Korobkov's proof of the lower bound, for instance, does not give an answer to that question. However, I feel there may be a reference that is slightly relevant. I'll try to find some time time over the weekend and look for generalizations as well. At the same time, I'm not sure whether a closed English description of the Boolean case (these two theorems) is worth writing...
dd1

@a3nm maybe the DAG case hasnt been considered in the literature? could it be harder than the boolean n-cube ordered by inclusion?
vzn

@vzn I guess that at least some of the questions here are bound to be open. Even for a chain, it is not immediately clear how to generalize Hansel's algorithm.
dd1

@a3nm it all seems to be similar to finding lower bounds/minimal monotone circuits (sizes) but havent seen it clearly linked so far...
vzn

0

[ 注:次の引数は機能しないようですが、誰かが修正できるように、他の人が同じ間違いをしないようにここに残しています。問題は、以下のように単調関数の学習/識別の指数関数的な下限が、問題の漸増多項式アルゴリズムと必ずしも矛盾しないことです。そして、後者はポリ時間で2つの単調関数の相互双対性をチェックするのと同等です。]

私はあなたの推測を信じます ログNバツ一般に偽です。本当にそうである場合ログNバツクエリが必要です。これは、メンバーシップクエリを使用して単調関数を学習する上で非常に強力な下限を意味します。特に、posetをしましょうバツ 通常の順序でブールキューブになります(必要に応じて、 バツ はのパワーセットです {1,...,n} with as its partial order). The number M of maximal antichains in X satisfies logM=(1+o(1))(n1n/2) [1]. If your idea on logNX is correct, then there is some monotone predicate on X that requires essentially (n1n/2)2n queries. In particular, this implies a lower bound of essentially 2n for the complexity of any algorithm solving this problem.

However, if I've understood correctly [which I now know I hadn't], your problem is equivalent to checking the mutual duality of two monotone functions, which can be done in quasi-polynomial time (see the intro of this paper by Bioch and Ibaraki, which cites Fredman and Khachiyan), contradicting anything close to a 2n lower bound.

[1] Liviu Ilinca and Jeff Kahn. Counting maximal antichains and independent sets. arXiv:1202.4427


Josh, I don't see a problem with the logNX argument. my understanding is that it is open whether a monotone function can be learned in time polynomial in n and the number of minimal elements. the Bioch-Ibaraki paper is about incrementally polynomial algorithm
Sasho Nikolov

Ah, okay. I wasn't aware of that. (Like I said, I'm not an expert in this area - my answer was just based on looking up a few things and putting them together.) I'll leave it here so other people can see it and at least not make the same mistake / at best turn it into something useful.
Joshua Grochow
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.