ランダムDFAで単語を分離する


15

DFAに関する未解決の興味深い問題の1つは、DFAに関する未解決の問題はありますか?は、長さnの 2つのストリングを分離するために必要なDFAのサイズですn。ランダムなDFAが2つの与えられた(非ランダムな)文字列を分離する能力について何らかの結果があれば興味があります。

明らかに十分に多くの状態を持つランダムDFAは、高い確率で文字列を分離します。具体的には、場合U V Σ nはu,vΣn、ランダムDFA O N O(n)の状態は、それが最初の場所に達すると、これまでと同じ状態を再訪しにくいUu及びVはv異なるが、そのため分離Uu及びVをv

もっと良くできますか?理想的には、最小のものであるF N STは、ランダムなDFAを有することをF N 長さの状態が分離ストリングN陽性確率(あるいは確率で1 / 2)?簡単な検索では、ランダムDFAのプロパティに関する多くの結果は得られませんでした。私が見つけたのはhttp://arxiv.org/abs/1311.6830だけでした。f(n)f(n)n1/2


ここで、正の確率は、未解決の問題の単なる修正であるため、特に有用な条件ではありません。高い確率はまだ興味深いかもしれません。
ジェフリーアーヴィング

1
「分離」とはどういう意味ですか?一方を受け入れ、他方を拒否しますか?もしそうなら、O n で十分であることが明らかですか?O(n)
usul

はい、separatesは1つだけを受け入れることを意味します。そして、あなたは正しいです:最も些細な分離引数は実際にはO n 2状態を必要とします(上で書いたものは間違っています)が、もっと少ないものでは十分でない場合は驚かれます。O(n2)
ジェフリーアーヴィング

1
単語がどれだけ異なるかに依存することを期待しませんか?単一の文字で異なる単語は、その1つのトランジションで区別する必要があるため、ランダムに区別するのが難しく、非常に異なる単語が簡単になるようです。[一般化するために、最も長い共通プレフィックスを忘れることができます(そこからランダムな状態になります)。次に、異なる文字を使用すると、同じ状態または異なる状態になります。その後、状態が異なる場合は、再同期の可能性を見て、同期を保つ必要があります(言葉に応じて再び開始します)...]
a3nm

はい、未解決の問題と同様に、私は差別をするのに最も難しい言葉に興味があります。少数の場所でのみ異なる単語は、O log n 状態によって既に分離されている可能性があるため、難しいケースではありません。O(logn)
ジェフリーアーヴィング

回答:


2

[編集:この回答は機能しません。コメントを参照してください。]

これは単なる非公式のアイデアであり、それが役立つかどうかはわかりませんが、コメントとして与えるには長すぎます。また、ランダムDFAにはまったく精通していないので、確率をどのように推論すべきかについて間違った直感を持っているかもしれませんが、うまくいけば、これはまったく価値がないわけではありません。

あなたの境界は、uvがどれだけ異なるかに依存すべきだと思います。そうでない場合、それは最悪の場合は、彼らの最初の文字のみが異なる文字列であることを私に明らかと思われる(設定で異なる文字列X位置のセットで異なる文字列よりも離れて言われてのより多くのチャンス持っているY X位置のを、私は言うだろう、そしてできるだけ早く違いを置くことはあなたに再同期する機会を与える)。uvXYX

また、単語が区別される、つまり、異なる状態に到達する確率も調べます。次に、ランダムDFAが最終状態を割り当てる方法に基づいて、承認または拒否に適応する必要があると思います。各状態の最終確率が1/2の場合、文字列が同じ状態になると区別されず、異なる状態になると、区別される確率は1/2になります。

今、私は言葉を考えてみますwはから入手UおよびV:次のようにwが、私は = 1ならばU 私は = V Iを、そしてwは私は = 0をそう。uvについて考慮する必要があるのはwだけであることは明らかだと思います。wuvwi=1ui=viwi=0wuv

ここで、p i )をuおよびvの長さiのプレフィックスを読み取った後、同じ状態にある確率、およびq i = 1 p i がそうでない確率を定義します。p(i)iuvq(i)=1p(i)

w i + 11のとき、p i + 1 = p i + q i / nになると思います。直感的に、i + 1文字を読んだ後も同じ状態にあります。iを読んだ後に同じ状態になったとき、または2つの異なる(ランダムな)状態にあったとき、ランダムな状態への2つの遷移を描きました。同じものである。同様に、p i + 1 = 1p(i+1)=p(i)+q(i)/nwi+11i+1i/ Nのw I + 1である 0:あなたは、2つのランダムな状態、あなたがから始めたどんなにを描いています。p(i+1)=1/nwi+10

これから、uvを読み取った後、同じ状態になる確率を計算できると思います。uv


残念ながら、それはそれをはるかに明白であるから、Wが唯一の興味深い特性であるUV。これを確認する最も簡単な方法は、自明でないw0 nから区別する非ゼロの確率があることです。実際、nに関係なく2つの状態で十分です。ただし、arxiv.org/pdf/1103.4513.pdfで説明されているように、DFAが区別できる長さn st no o log n )の単語u vがあります。これは、p i )の式と矛盾しますwuvw0nnu,vno(logn)p(i)
ジェフリーアーヴィング

1
明確にするために、DFA遷移が文字列インデックスのランダム関数である場合、式は正しいでしょう。これらはインデックスに依存しないため、確率はかなり複雑な方法で相関されます。
ジェフリーアーヴィング

私はあなたの反例を得ることができないのではないかと心配しています。0 nw 0 nを区別する2つの状態を持つ> 0 prba があります。また、o log n 状態と区別できない長さnの単語があるかもしれません。しかし、wが唯一の重要なものであるという私の主張、またはp i )の>00nw0nno(logn)wp(i)?相関関係については、あなたが言及している種類のキャッチがあるかもしれませんが、なぜそれが正確に失敗するのかはまだわかりません。同じ状態を2回行った場合、相関関係がありますが、平均して特定の方向に影響を及ぼすと考える理由はありますか?
a3nm

場合P N < 1U及びVは正の確率で区別されます。ただし、nが十分に大きく、状態の数が少ない場合、一部のuおよびvに対してp n = 1であることがわかります。あなたの式は、p i < 1の場合、p i + 1 = p i + 1 pp(n)<1uvnp(n)=1uvp(i)<1i / n = p i 1 1 / n + 1 / n < 1の場合、特定の u vを区別することができないという事実をあなたの数式はキャプチャしません。p(i+1)=p(i)+(1p(i))/n=p(i)(11/n)+1/n<1uv
ジェフリーアーヴィング

ああ...そうです、わかりました。小さなDFAが2つの単語を区別できない場合、ランダム DFAもそれらを区別できません。確かに、私のアプローチには問題があります。これらの相関関係のため、確率q i は最終的にゼロに低下するはずです。間違った答えを提供して申し訳ありません。q(i)
a3nm
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.