与えられた通常の言語には、接頭辞のない無限のサブセットが含まれていますか？

一方が他方の接頭辞である2つの明確な単語がない場合、有限アルファベット上の単語のセットは接頭辞なしです。

質問は：

NFAとして指定された通常の言語にプレフィックスなしの無限サブセットが含まれているかどうかを確認する複雑さは何ですか？

回答（以下のミハイル・ルードイによる）：これは多項式時間で行うことができ、NLでさえ考えます。

ミハイルの答えを言い換えると、 $(\Sigma,q_0,F,\delta)$ 通常の形式の入力NFA（イプシロン遷移なし、トリム）とし、 $L[p,r]$ （それぞれ $L[p,R]$ ）状態を有することにより得られる言語 $p$ 初期状態として $\{r\}$ 最終状態（それぞれ状態として $p$ initalとして設定された $R$ 最終など）。言葉のために $u$ 聞かせて $u^\omega$ $u$ を反復することにより得られる無限の単語であること。

以下は同等です。

言語 $L[q_0,F]$ は、プレフィックスのない無限のサブセットが含まれています。
$\exists q \in Q$ 、 $\exists u \in L[q,q]\smallsetminus\{\varepsilon\}$ $\exists v \in L[q,F]$ その結果 $v$ の接頭辞ではない $u^\omega$ 。
$\exists q \in Q$ $L[q,q] \neq \{\varepsilon\}$ $\forall u \in L[q,q]$ $\exists v \in L[q,F]$ となるよう $v$ の接頭辞ではない $u^\omega$ 。

証明：

3 $\Rightarrow$ 2ささい。

2の場合 $\Rightarrow$ 1、それはいずれかのことを確認すればよい $w \in L[q_0,q]$ 私たちがいることを持っている $w (u^{|v|})^* v$ 無限の接頭辞のない部分集合である $L[q_0,F]$ 。

最後に、1 $\Rightarrow$ 3はミハイルの答えの「正しさ」の証明です。

— グーグロ
ソース

回答:

問題は多項式時間で解決できます。

開始するには、次の追加プロパティを使用して、指定されたNFAを同等のNFAに変換します。

イプシロン遷移はありません
すべての状態は開始状態から到達可能です

役立つサブルーチン

NFA $N$ 、状態 $q$ 、および空でない文字列 $s$ ます。次のサブルーチンは、私たちは次の文の真理値を評価できるようになる：「内のすべてのパス $N$ 状態から $q$ 受け入れる状態に相当する文字列の接頭辞である文字列へ $s^n$ 、いくつかのため $n$ 。」さらに、このサブルーチンは多項式時間で実行されます。

まず、 NFA $S$ を構築しますのプレフィクスされていないすべての文字列受け入れ状態任意のため（の「パターン」にどこを追跡するために、ループ内の非受け入れ状態を私たちは、これまでのところですそのパターンからすでに逸脱している場合は状態を受け入れます）。次に、NFA構築のような正確であるが、持っているその開始状態などを。最後に、最終的なNFA $|s| + 1$ $s^n$ $n$ $|s|$ $sssss\ldots$ $N'$ $N$ $q$ $N''$ その言語 $L(N'')$ であり、 $L(S) \cap L(N')$ 標準NFA交差構造を使用。これらの構造はすべて、入力のサイズが多項式であることに注意してください。

次に、 $N''$ の言語が空であるかどうかをテストします（単純なグラフ検索で多項式時間で実行できます）。 $L(N'') = \emptyset$ 場合に限り $L(S) \cap L(N') = \emptyset$ 、すなわち内のすべての文字列 $L(N')$ でない $L(S)$ 。つまり、言語 $N''$ 空の場合にのみである $N'$ 接頭辞ある文字列のみ受け付け $s^n$ 、いくつかのため $n$ 。これは、我々が評価しようとしていたまさに声明と言い換えることができます：「内のすべてのパス $N$ 状態から $q$ 受け入れる状態に相当する文字列の接頭辞である文字列へ $s^n$ 、いくつかのため $n$ 。」

メインアルゴリズム

ループ内にあるNFAの状態のセットを検討してください。そのような状態 $q$ ごとに、以下を実行します。

してみましょう $P_2$ 含む任意の単純なループも $q$ 。してみましょう $s$ ループに対応する文字列である $P_2$ 。NFAにはイプシロン遷移がないため、 $s$ は空ではありません。次に、サブルーチンをNFA、状態 $q$ 、および文字列 $s$ 適用します。サブルーチンが、NFAの $q$ で始まり、受け入れ状態で終わるすべてのパスが、ある $s^n$ プレフィックス対応することを示している $n$ 、次の状態 $q$ 進みます。それ以外の場合、指定されたNFAの言語にプリフェックスのないサブセットが含まれていることを出力します。

ループ内にあるすべての状態 $q$ を試行し、アルゴリズムが出力しない場合、指定されたNFAの言語にはプリフェックスのないサブセットが含まれていないことを出力します。

正しさ（前半）

最初に、上記のアルゴリズムが、指定されたNFAの言語に無限のprefexフリーサブセットが含まれていることをアサートすると仮定します。いくつかのループ $P_2$ といくつかの状態 $q$ を考慮しながら、この出力が選択されたとしましょう。前と同様に、 $s$ は $P_2$ 対応する文字列です。次に、サブルーチンに従って、NFAの $q$ で始まり、受け入れ状態で終わるすべてのパスが、一部の $s^n$ プレフィックスに対応するわけではないことがわかります（これは、メインアルゴリズムにつながるサブルーチンの唯一の出力であるためその出力）。 $n$ $q$

ましょう $P_3$ からのパス：その存在サブルーチンによってアサートされるパスで $q$ 対応する文字列のように受け入れる状態に $t$ の接頭辞ではない $s^n$ 任意のための $n$ 。

レッツ $P_2'$ で構成され $m$ のコピー $P_2$ $m$ その十分に大きい $m|s| > |t|$ 。以来、 $P_2$ を通るループで $q$ 、 $P_2'$ から経路として扱うことができる $q$ の $q$ 。 $P_2'$ 対応する文字列は $s^m$

ましょう $P_1$ の開始状態からのパスである $q$ （すべての状態が開始されてから到達可能であるので、存在する）およびlet $r$ 、このパスに対応する文字列です。

この場合、 $P_1$ 、 $x$ コピー、およびからなるパスは、受け入れ可能な計算パスです。このパスに対応する文字列はです。したがって、NFAは形式のすべての文字列を受け入れます。これは、NFAによって受け入れられる文字列の無限のセットであり、この文字列のセットにはプレフィックスが含まれていないと主張しています。特に、が $P_2'$ $P_3$ $r(s^m)^xt$ $r(s^m)^xt$ $r(s^m)^xt$ $r(s^m)^yt$ with $y > x$ 。つまり、 $t$ は $(s^m)^{y-x}t$ 接頭辞です。以来 $(s^m)^{y-x}$ 長有する $m(y-x)|s| \ge m|s| > |t|$ 、これは $t$ が接頭辞であることを意味します $(s^m)^{y-x} = s^{m(y-x)}$ 。しかし、我々はそのサブルーチンの出力によって知っている $t$ の接頭辞ではありません $s^n$ 任意のため $n$ 。したがって、 $r(s^m)^xt$ を $r(s^m)^yt$ プレフィックスにすることはできません。また、必要に応じて、文字列のセットにはプレフィックスがありません。

したがって、メインアルゴリズムが、指定されたNFAの言語に無限のprefexフリーサブセットが含まれていることを出力する場合、実際にそうであることを示しました。

正しさ（後半）

次に、残りの半分を示します。指定されたNFAの言語に無限のprefexフリーサブセットが含まれている場合、メインアルゴリズムはこの事実を出力します。

指定されたNFAの言語に、プレフィックスのない無限のサブセットが含まれているとします。ましょ $A$ これらの文字列に対応する（受け入れる）演算パスのセットです。 $A$ は、対応する文字列が互いのプレフィックスではない、受け入れ可能な無限の計算パスセットであることに注意してください。

その状態を介してNFAにループが存在する場合、NFAの状態は「ループ」であり、それ以外の場合は「非ループ」であるとします。開始状態から非ループ状態のみを通過するループ状態へのすべてのパスを考慮します（最終的に1つのループ状態を除く）。してみましょう $P$ これらの経路の集合とします。各パス $p \in P$ 、そのループ内の状態が状態をループとなるであろうようにループを有することができない $p$ ループ状態を通過します。したがって、 $P$ のパスの長さはNFAの状態の数によって上に制限されるため、 $P$ は有限です（たとえば、開始状態がループ状態の場合、そのようなパスは空のパスのみです）。

$A$ を $|P|+1$ 分割できます $A$ 計算パス開始方法に基づくつのサブセット。具体的には、のため $p \in P$ 、聞かせ内のすべての演算パスの集合パスで開始およびlet 内の他のすべてのパスのセットである。明らかに、すべての sとは互いに素であり、それらの和集合は集合です。さらに、 $A_p$ $A$ $p$ $B$ $A$ $A_p$ $B$ $A$ $B$ ループ状態を決して通過しないため、ループしないパスのみが含まれます。したがって、 $B$ は有限です。その場合、いくつかの $A_p$ は無限である必要があると結論付けることができます（それ以外の場合、 $A$ は有限個の有限集合の和集合になります）。

以来、無限大である、無限に多くの演算パスがある、その文字列から始まるパスを受け入れている互いのプレフィックスであるのいずれも。してみましょうパスの末尾に到達した状態である。受け入れパスは無限に多くあると結論付けることができ、で始まるこのセット呼び出します。これらのパスはすべて、お互いのプレフィックスではない文字列に対応します。 $A_p$ $p$ $q$ $p$ $A'$ $q$

メインアルゴリズム中に、状態 $q$ およびいくつかの文字列 $s$ サブルーチンを実行します。このサブルーチンは、で始まる、すべて受け入れてパスするかどうかを教えてくれる $q$ の接頭辞である文字列に対応し $s^n$ 、いくつかのため $n$ 。これが当てはまる場合、 $A'$ 無限に多くのすべての受け入れパスは、さまざまなに対する $s^n$ プレフィックスになります。これは、それらがすべて互いにプレフィックスであることを意味します。そうではないため、メインアルゴリズムが状態サブルーチンを実行すると結論付けます $n$ $q$ 、結果は他の可能な結果です。ただし、これにより、メインアルゴリズムは、NFAの言語にプレフィックスなしの無限サブセットが含まれていることを出力します。

これで正しさの証明が終わりました。

— ミハイル・ルドーイ
ソース

特定の状態

が（指数関数的に）多くのループの一部になる可能性があるため、ループ処理の仕組みがわかりません。もちろん、これらのループのいずれか2つを使用して非周期的なシーケンスを生成できる場合は、これで完了です。

q

$q$

— ジャフ

ループ処理とはどういう意味ですか？メインアルゴリズムでは、各状態のための

あなただけの1つのを通過するループ選ぶ

ループいること（潜在的に指数関数的に多くのうちいずれかのループ）とコール

あなたが状態でサブルーチンを実行する（あとがき

と文字列が

どこ

あるが

関連付けられた文字列）。サブルーチンは基本的に、そのループを使用して非周期的なシーケンスを生成できるかどうかのチェックを処理します。はいの場合、これで完了です。いいえ（さらに

ごとにno ）の場合、言語全体が周期的なシーケンスの結合であるため、これで完了です。

q

$q$

q

$q$

P_{2}

$P_2$

q

$q$

s

$s$

s

$s$

P_{2}

$P_2$

q

$q$

— ミハイルルドーイ

質問を明確にするために、初期状態

、最終状態

、および3つの遷移

、

持つ単純なNFAを示します。

のループはプレフィックスのない文字列を生成しませんが、

のループは生成します。

q

$q$

T

$T$

q \overset{a}{\to} q

$q \overset{a}{\rightarrow} q$

q \overset{b}{\to} q

$q \overset{b}{\rightarrow} q$

q \overset{a}{\to} T

$q \overset{a}{\rightarrow} T$

a

$a$

b

$b$

— ジャフ

実際、

のループはプレフィックスのないセットを生成

ます。文字列のセット

すべて

ループを使用します。私のアルゴリズムでは、

に対して選択し

ループが

ループである場合、サブルーチンは、

始まるすべての受け入れパスに

の形式の文字列があるとは限らないため、メインアルゴリズムは無限プレフィックスを言う-freeサブセットが存在します。用ループアルゴリズム使用する場合

代わりである

ループサブルーチンが始まるごとに受け入れパスでないと判断

フォームのストリング有する

a

$a$

a^{*} b a

$a^*ba$

a

$a$

q

$q$

a

$a$

q

$q$

a^{*}

$a^*$

q

$q$

b

$b$

q

$q$

、この場合もアルゴリズムの出力は同じです。

b^{*}

$b^*$

— ミハイルルドー

ありがとう、ミハイル！あなたの答えが問題を解決すると思います。

— グーグル

定義

定義1： $S$ を単語のセットとします。単語、およびが存在する場合、 $S$ は適切に無限の接頭辞なし（この回答の目的のために名前を作成）であると言い。 $u_0,\dots,u_n,\dots$ $v_1,\dots,v_n,\dots$

それぞれについて $n\ge 1$ 、 $u_n$ と $v_n$ 非空であり、異なる文字で始まります。
$S=\{u_0v_1,\dots,u_0\dots u_n v_{n+1},\dots\}$ 。

直観は、の単語がパスのラベルとまったく同じになるように、次の形状の無限の根付きツリー（■ルート、▲葉、•残りの内部ノード）にこれらのすべての単語を配置できることです。ルートからリーフへ： $S$

   u₀    u₁    u₂
■-----•-----•-----•⋅⋅⋅
      |     |     |
      | v₁  | v₂  | v₃
      |     |     |
      ▲     ▲     ▲

命題1.1：プレフィックスなしの素敵な無限集合はプレフィックスなしです。

命題1.1の証明： $u_0\dots u_n v_{n+1}$ が $u_0 \dots u_m v_{m+1}$ 厳密な接頭辞であると仮定します。次の2つの場合があります。

$n < m$ 場合、 $v_{n+1}$ は $u_{n+1}\dots u_m v_{m+1}$ 接頭辞です。 $u_{n+1}$ と $v_{n+1}$ は別個の最初の文字があるため、これは不可能です。
$n > m$ 場合、 $u_{m+1}\dots u_n v_{n+1}$ は $v_{m+1}$ プレフィックスです。 $u_{m+1}$ と $v_{m+1}$ 最初の文字が異なるため、これは不可能です。

命題1.2：接頭辞のない素敵な無限集合は無限です。

命題1.2の証明：証明1.1では、 $n\not= m$ 場合、 $u_0\dots u_n v_{n+1}$ および $u_0 \dots u_m v_{m+1}$ は接頭辞の順序で比較できないことを示しました。したがって、それらは等しくありません。

主な証拠

命題2：プレフィックスなしの無限セットには、プレフィックスなしの素敵なセットが含まれています。

命題3：言語に適切な無限プレフィックスフリーセットが含まれる場合に限り、言語には無限プレフィックスフリーセットが含まれます。

以下の証明。

命題3の証明： $\boxed{\Rightarrow}$ 命題2による $\boxed{\Leftarrow}$ 命題1.1および1.2による。

命題4：正規言語のうまくプレフィックスフリーサブセットのセット（無限ワードとして符号化 $\overline{u_0}\widehat{v_1}\overline{u_1}\widehat{v_2}\overline{u_2}\dots$ ）であり、 $\omega$ -regular（およびビュッヒのサイズそれを認識するオートマトンは、通常の言語を認識するNFAのサイズの多項式です）。

以下の証明。

定理5：NFAによって記述された通常の言語に接頭辞のないサブセットが無限に含まれるかどうかの決定は、NFAのサイズの時間多項式で行うことができます。

定理5の証明：命題3によって、無限に接頭辞のないサブセットが含まれているかどうかをテストするだけで十分です。これは、命題4で与えられるBüchiオートマトンを構築し、その非空言語（Büchiオートマトンのサイズで時間的に線形に実行できます）。

命題2の証明

補題2.1： $S$ が接頭辞なしの集合である場合、 $w^{-1}S$ も同様です（あらゆる単語 $w$ ）。

証明2.1：定義による。

補題2.2： $S$ を単語の無限の集合とする。してみましょう $w:=\operatorname{lcp}(S_n)$ 内のすべての単語に最長プレフィックス共通である $S$ 。 $S$ と $w^{-1}S$ 基数は同じです。

証明2.2：により $f:w^{-1}S\to S$ 定義する。これは、ウェルの定義によって定義されるの定義によって単射との定義により全射。 $f(x)=wx$ $w^{-1}S$ $f$ $w$

命題2の証明：我々は構築 $u_n$ と $v_n$ の誘導によって $n$ の誘導仮説と、 $H_n$ 以下の部品で構成さ：

$(P_1)$ すべてについて $k\in\{1,\dots,n\}$ 、 $u_0\dots u_{k-1} v_k \in S$ 。
$(P_2)$ すべてについて $k\in\{1,\dots,n\}$ 、 $u_k$ と $v_k$ 非空であり、異なる文字で始まります。
$(P_3)$ $S_n:=(u_0\dots u_n)^{-1}S$ は無限です。
$(P_4)$ $S_n$ すべての単語に共通する空でない接頭辞はありません。言い換えれば、何の文字がありませんように。 $a$ $S_n\subseteq a\Sigma^*$

備考2.3：なしで $H_n$ を検証するシーケンスがある場合、を変更しても満たすようにすることができます。実際、をに置き換えるだけで十分です。は影響を受けません。は簡単です。は建設によるものです。 $(P_4)$ $u_n$ $(P_4)$ $u_n$ $u_n\operatorname{lcp}(S_n)$ $(P_1)$ $(P_2)$ $(P_4)$ $(P_3)$ 補題3です。

$n$ 帰納法によりシーケンスを構築します。

初期化： $H_0$ は、 $u_0:=\operatorname{lcp}(S)$ をとることによって真になります（つまり、 $u_0:=\varepsilon$ をとって、注釈3.1を適用します）。
誘導ステップは：私たちは言葉があるとし $u_1,\dots,u_n$ と $v_1,\dots,v_n$ 、その結果 $H_n$ のためのいくつか $n$ 。私たちは、構築します $u_{n+1}$ と $v_{n+1}$ ように $H_{n+1}$ 。

以来、 $S_n$ 無限大と接頭辞を含まない（補題1）、それが含まれていない $\varepsilon$ ように $S_n=\underset{a\in \Sigma}{\bigsqcup}(S_n\cap a\Sigma^*)$ 。以来、 $S_n$ 無限大であり、文字が存在するように、無限であるが。、文字ありは異なるように $a$ $S_n\cap a\Sigma^*$ $(P_4)$ $b$ $a$ $S_n\cap b\Sigma^*$ は空ではありません。選ん $v_{n+1}\in S_n\cap b\Sigma^*$ 。服用 $u_{n+1}$ であることを満足する、及び我々が取得する発言3.1を適用するように： $a$ $(P_1)$ $(P_2)$ $(P_3)$ $(P_4)$ $u_{n+1}:=a\operatorname{lcp}(a^{-1}S_n)$ 。

$(P_1)$ $u_1\dots u_nv_{n+1}\in u_1\dots u_n(S_n\cap b\Sigma^*)\subseteq S$ 。

$(P_2)$ $u_{n+1}$ および $v_{n+1}$ 定義による。

$(P_3)$ $a^{-1}S_n$ は $a$ 定義により無限でため、 $S_{n+1}$ は補題3により無限になります。

$(P_4)$ $u_{n+1}$ 定義による。

命題4の証明

命題4の証明： $A=(Q,\to,\Delta,q_0,F)$ NFAとする。

$u_0$ $v_1$ $u_0$ $u_1$ $v_n$ $u_n$

マルチヘッドオートマトンの方が簡単だと言われましたが、形式にあまり詳しくないので、ブッチオートマトン（ヘッドが1つしかない）を使用して説明します。

$\Sigma':=\overline{\Sigma}\sqcup\widehat{\Sigma}$ $u_k$ $v_k$

$Q':=Q\times (\{\bot\}\sqcup (Q \times \Sigma))$

$(q,\bot)$ $u_n$
$(q,(p,a))$ $u_n$ $p$ $v_{n+1}$ $a$ $p$ $u_{n+1}$ $a$

$q_0':=(q_0,\bot)$ $u_0$

$F'$ $F\times Q \times \Sigma$

$\to'$

$u_n$ $q\overset{a}{\to}q'$ $(q,\bot)\overset{\overline{a}}{\to'}(q',\bot)$
$u_n$ $v_{n+1}$ $q\overset{a}{\to}q'$ $(q,\bot)\overset{\widehat{a}}{\to'}(q',(q,a))$
$v_n$ $q\overset{a}{\to}q'$ $(q,(p,a))\overset{\widehat{a}}{\to'}(q',(p,a))$
$v_n$ $u_n$ $p\overset{a}{\to}p'$ $p$ $b$ $a$ $(q,(p,b))\overset{\overline{a}}{\to'}(p',\bot)$

$\overline{u_0}\widehat{v_1}\overline{u_1}\widehat{v_2}\dots \overline{u_n}\widehat{v_{n+1}}$ $A'$ $n\ge 1$ $u_n$ $v_n$ $n\ge 0$ $u_0\dots u_n v_{n+1}\in L(A)$

補題4.1の証明：読者に任せてください。

— xavierm02
ソース