CNF式のランダム性の測定


12

CNF式は、ランダムと構造化の2つの大まかなクラスに大まかに分割できることが広く知られています。構造化されたCNF式は、ランダムなCNF式とは反対に、何らかの順序を示し、偶然には起こりそうにないパターンを示します。ただし、ある程度のランダム性を示す構造式(つまり、特定の特定の節のグループは他の特定の群よりもはるかに構造化されていないように見える)や、弱い形式の構造を持つランダムな式(つまり、特定の節のグループは他の部分よりもランダムではないように見える) )。したがって、式のランダム性は単なるyes / noの事実ではないようです。

ましょう CNF式与えられ、その関数であるF Fの間の真の値を返し01:包括0ながら、手段純粋な構造式を1つの手段純粋ランダム式。r:F[0,1]FF0101

誰かがそのようなを発明しようとしたことがあるのだろうか。もちろん、rによって返される値は(少なくともこれは私の意図です)堅実な理論的真理ではなく、いくつかの合理的な基準に従った実際的な測定値になります。rr

また、の定義、または式の他の有用な全体的な特性の決定に使用できる統計指標を誰かが定義し、研究したことがあるかどうかを知りたいと思っています。統計指標とは、次のようなものです。r

  1. HCV(ヒットが分散をカウント)

    してみましょう変数与えられた、という関数であるVのJNは、回数を返しV j個に表示されてFを。してみましょうVがで使用される変数の集合とするF。してみましょうˉ H F = 1hF:NNvjNvjFVFAHC(平均ヒットカウント)です。HCVは次のように定義されます: HVC=1h¯F=1|V|vjVhF(vj)

    構成例ではないが、ランダムな事例では、HCVは、(すべての変数は時間のほぼ同じ数の記載されている)非常に低い(いくつかの変数非常に頻繁に使用され、他の一部は使用されていません。つまり、「使用量のクラスター」があります。HVC=1|V|vjV(hF(vj)h¯F)2



  2. AID(平均不純物度)

    してみましょうの回数もvのjのポジティブを発生し、聞かせてH - FVのJ、それは負の発生回数。ましょI N[ 0 1 ]変数が与えられると、その関数であるVのJVをそのID(不純物度)を返します。関数i v jは次のように定義されます:i hF+(vj)vjhF(vj)i:N[0,1]vjVi(vj)。正の半分の時間と負の半分の時間に発生する変数の不純物度は最大であり、常に正または常に負の変数(純粋なリテラル)の不純物度は最小です。AIDは次のように簡単に定義されます 。AID=1i(vj)=2min(hF+(vj),hF(vj))hF(vj)

    ランダム例において(確率変数の否定によって生成されるものでは少なくとも0.5)、AIDがほとんどであるに等しい1構成例において、それは通常遠いからであるが、1AID=1|V|vjVi(vj)

    0.511

  3. IDV(Impurity Degree Variance)

    IDVは、以外の確率で変数を否定することによって生成されるランダムインスタンスを考慮に入れるため、AIDだけよりも堅牢なインジケータです。次のように定義されます: I D V = 10.5

    IDV=1|V|vjV(i(vj)AID)2

    00

動機

  1. CNF数式がどのように機能するか、ランダム性/構造をどのように測定できるか、統計指標を見て他の有用な全体特性を推測できる場合、そのような指標を使用して検索を高速化できるかどうか、およびその方法を理解するために
  2. 統計指標を巧みに操作するだけで、CNF式の充足可能性(または解の数さえ)を推測できるかどうか疑問に思います。

ご質問

  1. CNF式のランダム性を測定する方法を提案した人はいませんか?
  2. CNFフォーミュラの有用な全体的特性を研究したり、機械的に推測するために使用できる統計指標を提案した人はいませんか?

1
この回答の論文(cstheory.stackexchange.com/questions/4321/…)を参照してください。それはあなたにそのようなrを定義する方法のヒントを与えることができます
マルコスヴィラグラ

1
ビット文字列のランダム性の測定に関するおそらく関連する議論mathoverflow.net/questions/37518/…–
ヤロスラフ・

私はしばらく自分でこれに取り組んできたので、これだけ多くを伝えることができます。SATを検討する場合、1と2の式は指数関数です。一方、k-SATの場合、1と2の式は多項式です。これは、ランダムK-SAT質問の私の正確な定義に関連しています。誰も答えたくないようです。
Tayfunペイ

@Geekster:ここで答えを提供しますか?
Hsien-Chih Chang張顯之

@Geekster:「... 1と2の式は指数関数的」とはどういう意味ですか?
ジョルジオカメラニ

回答:


3

I suggest to borrow physics intuition that "less random" structures are more symmetric. Symmetry for CNF is any transformation of the variables, that keeps the function invariant. By that criteria, functions of 3 variables such as

x1x2x3.

or, say,

(x1x2¬x3)(x1¬x2x3)(¬x1x2x3)(¬x1¬x2¬x3).

are less random than, say

(x1x2¬x3)(x1¬x2x3)(¬x1¬x2x3).

In general, defining a concept of "random" on finite structures is challenging. Historically, it was tried on binary sequences, which arguably are the simplest finite structures. For example, intuitively, a sequence 01010101 is "less random" than, say, 01001110. However, it was quickly realized that there is no consistent formal definition of finite random sequence! Therefore, one have to be skeptical of any naive attempts to define a measure of randomness for any finite structure.


I totally agree with the intuition "structure means presence of symmetries, whereas randomness means absence of symmetries". You refer to syntactic symmetries (whereas semantic symmetries are those changing the function but leaving the solution space unaltered). I've been always convinced that symmetries are the key.
Giorgio Camerani

1
@Walter:対称性の概念は、アルゴリズムではなく代数を活用する試みです。アルゴリズムの複雑さは、有限オブジェクトの一貫した定義に反する尺度です。ただ周りの問題をプッシュするようなこの感触... -しかし、その後、我々は割り当て複雑さの指標に各要素にグループを持っている(例えば、単一の変数を否定変換はネゲート2その1よりも簡単です)
Tegiri Nenashi
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.