L_k-distinctの最小NFAのサイズの限界


18

2つの文字が等しくないように、上のすべての文字の文字列で構成される言語考えます。LのK - D iは、S 、T I N C TLkdistinct K kΣΣ

LのK - D iは、sはT I N C T:= { wは= σ 1 σ 2σ K | I [ K ] σ IΣ  と  J I σ Jσ I }  

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

この言語は有限であり、したがって規則的です。具体的には、場合、\ left | L_ {k-distinct} \ right | = \ binom {n} {k} k!| Σ | = n |Σ|=n| L k d i s t i n c t | = nk k|Lkdistinct|=(nk)k!

この言語を受け入れる最小の非決定性有限オートマトンとは何ですか?

現在、次の緩やかな上限と下限があります。

  • 構築できる最小のNFAには、4 K 1 + O 1 P O L のY L O G N 4k(1+o(1))polylog(n)状態があります。

  • 次の補題は、2 k2k状態の下限を示しています。

してみましょうL Σ *LΣ正規言語であること。あると仮定nnP = { X IW I| 1 iがN }P={(xi,wi)1in}ようX IワットJLxiwjL場合にのみi = ji=j。次に、Lを受け入れるNFAには少なくともn個の状態があります。

  • 別の(簡単な)下限はl o g nlogk(nk)。これは、言語の最小DFAのサイズのログです。

また、オートマトンのサイズが\ epsilon \ cdot 4 ^ {k(1 + o()より小さい場合、L_ {k-distinct}の固定分数(0 < ϵ < 10<ϵ<1)のみを受け入れるNFAにも興味があります。1))} \ cdot polylog(n)L k d i s t i n c tLkdistinctε 4 K 1 + O 1 P O L のY L O G N ϵ4k(1+o(1))polylog(n)


編集:私はちょうどテキストに間違いがあった賞金を始めました。

私はk = O(log(n))を書いている間にk = p o l y l o g n k=polylog(n)を仮定することを意味しました。k = O l o g n k=O(log(n))

編集2:

賞金は間もなく終了するため、誰かがそれを獲得するより簡単な方法に興味がある場合は、次の言語を検討してください。

L r k d i s t i n c t:= { w wL(r,k)distinct:={w:w含まkkの異なるシンボルを及びNOシンボルが複数表示されないrr}}

(つまり、L 1 k d i s t i n c t = L k d i s t i n c tL(1,k)distinct=Lkdistinct)。

コメントの構造と同様の構造は、O(e ^ k \ cdot 2 ^ {k \ cdot log(1 + r)} \ cdot poly(n))L _ {(r、k)-distinct}のO E K2 K L O G 1 + R P O のL Y N O(ek2klog(1+r)poly(n))サイズのオートマトンをL r k d i s t i n c tL(r,k)distinct

これは改善できますか?この言語で表示できる最高の下限は何ですか?


2
上限NFAを説明できますか?
mjqxxxx 14年

私たちはまだ取り組んでおり、証拠を完成していないので、私はまだそれについて書くことができません。代わりに、サイズはるかに単純なオートマトンについて説明します:完全なハッシュファミリー。そのようなハッシュはすべて関数です。これは、サイズが最大ののすべてのサブセットに対して、サブセットのすべてのアイテムを異なる数にマッピングする関数が存在することを意味します。ハッシュ後、結果のアルファベットは文字になります。したがって、サイズ自動言語は言語を受け入れることができます。O 2 E 、K * 2 O L O G K * L O G N N K H H [ N ] [ K ] [ N ] のk H HとK 2 k L k d i s t i n cO((2e)k2O(log(k))log(n))(n,k)Hh:[n][k][n]khHk2ktLkdistinct
RB 14年

4
下限はを与え、ちょうどステップ後にNFAが存在できる状態の数をカウントします。私は、いくつかのに対してステップ後に何が起こるかを見るだけで得られるものよりも、合計サイズの有意に良い境界を与える証明方法を知っているとは思わない。しかし、ここでは、ごとに、正確に状態の後、状態のいずれか1つにしかなれないNFAがあります。2 o 1 k k / 2 t t t 2 + o 1 k t(2o(1))kk/2ttt(2+o(1))kt
ノーム14年

3
証明(以前の主張):最も難しいケースはです。選択異なるランダムサブセット(の正確にサイズのアルファベット記号)それぞれ、それぞれの状態を有するNFA構築最初ときに限り、それにつながるいくつかのパスとをシンボルはすべて異なり、に含まれ、後続のシンボルがすべて異なり、の補数に含まれている場合、そこからの受け入れパスがあり。カウント引数は、ランダムな選択を介して(そのWHPが表示されますT = K / 2 2 KP O のL yはK ログN S I N はt iがtはS iは、 kは- Tは、S iは、S It=k/22kpoly(k,logn)SintitSiktSiSi's)このNFAは実際にすべての希望する言語を受け入れます。
ノーム14年

3
前の構成では、NFAを構築する最も簡単な方法は、長さ可能な各プレフィックスと、長さ可能な各サフィックスの状態を持ちます。代わりに、NFAのプレフィックス部分とサフィックス部分は、同じランダム化構造を使用して再帰的に構築できます(ただし、現在はそれぞれとその補数内でのみ)。これにより、合計サイズはます。j < t j > k t S i4 + o 1 kj<tj>ktSi(4+o(1))k
ノーム14年

回答:


2

これは答えではなく、改善された下限に任せると思われる方法です。後に、私たちが問題をカットしてみましょう文字が読み込まれます。意味のファミリーの要素組によっておよびファミリーの要素組によって。がの要素を(任意の順序で)読み取った後に到達できる状態、およびがの要素を(任意の順序で)読み取った後に受け入れ状態に到達できる状態を示します。私たちは、必要とする場合にのみ、A [ N ] B = K - [ N ] B A S A B T B S AT BA B = aa[n]Ab=ka[n]BASABTBSATBAB=。これにより、必要な州の数の下限がすでに与えられており、自明ではない何かを与えることができると思います。

この問題は本質的に、折れ線グラフが(部分的に)既知であるハイパーグラフの頂点の数の下限を求めます。同様の問題は、たとえばボロバによって研究され、有用である可能性のあるいくつかの既知の証明方法があります。

更新2014.03.24:実際、上記のハイパーグラフを頂点で実現できる場合、サイズと入力セット(実際には2つのセット)を使用した長さ非決定的通信複雑度プロトコルも取得し問題は同等です)。もちろん、ボトルネックはときです。これについては、Eyal and Noamの本で次のものしか見つけることができませんでした:は、標準の確率論的議論によって証明されています。残念ながら、この問題の十分な下限を(まだ)見つけることができませんでしたが、上記が鋭いと仮定すると、下限sslogslogsaabba=b=k/2a=b=k/2N1(DISJa)log(2kloge(na))N1(DISJa)log(2kloge(na))Ω(2klogn)Ω(2klogn) 言及した2つの下限を統合します。


1
あなたの答えを@domotorpに感謝します。これは、元の質問の下限に使用した補題の証明に非常に似ていますが、実際のx iおよびy iを指定せず、したがって可算範囲ではありません。上記の質問に対するあなたのコメントは、2 kの限界はその方法では改善できないことを示唆していますが、これはもっと良くなると思いますか?xiyi2k
RB 14年

3
上記の私のコメントの要点は、これらの手法では2 + o 1 kの上下限を与えられないということでした。これが本当にこの問題を私にとって興味深いものにしているのです。(2+o(1))k
ノーム14年

@Noam:k = 2、a = b = 1とします。すべてのS Aは異なる必要があるため、すでにlog nの下限を取得していますlognSA
domotorp 14年

1
@domotorp:O 1 隠しO k個のログN 因子:ここでは、最悪の場合の分析である= B = K / 2:固定とスタートABとのランダムAのサブセットでピックSn個の文字が、その後、私たちは持っていたP R [ A Sをo(1)O(klogn)a=b=k/2a n dB S C ] = 2 - K。今ピック Rを2つのk個のランダムにそのようなセットは、それらの少なくとも一方のためにこれが起こる確率は 1 - E X P - R 。私たちが選択した場合、R = O ログを nはk=Oklognこの場合、すべての素集合AおよびB(サイズk/2)の場合、これがwhpであることがわかります。この構造におけるそのようなSの総数はO2kklognです。
ノーム14年

2
@Noam:私は申し訳ありませんが、私は見たことがないログをn個に隠されたO 1 の問題はまたのための興味深い私見です特にとして、K < < ログのn。しかし、あなたはRBがk = p o l y l o g nについて尋ねたことは正しいです。
domotorp

0

進行中のいくつかの作業:

4 kの下限を証明しようとしています。最小見つける:ここで私は、このような下界Aを与えるだろうかなり確信しているという問題であるTの関数が存在するように、F { S [ nは] | S | = K / 2 } { 0 1 } Tそのジャム互いに素、すなわちそのS 1S 2 = IFF F S 1F S 2= 。私はかなり確信しての下限てる T 2 kのほとんどすぐ下の下限暗示する 2 2 、K = 4 kの私たちの問題のために。f S は、これらの k / 2シンボルのセットが Sである場合、NFAが入力の最初の k / 2シンボルを読み取った後に到達できるノードのセットにほぼ対応します。

この問題の解決策は、通信の複雑さに関する文献(特に、互いに素な問題を扱う論文で、おそらく行列ランクの引数が役立つかもしれません)、またはエンコーディングに関する文献(例えば、このような)で既に知られていると思います。


2
上記の私のコメントは、このアプローチは2 + o 1 nを破ることができないことを示しています
ノーム14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.