言語がコンテキストフリーではないことを証明するにはどうすればよいですか？

88

コンテキストフリー言語のクラスについて学びました。コンテキストフリーの文法とプッシュダウンオートマトンの両方が特徴であるため、特定の言語がコンテキストフリーであることを簡単に示すことができます。 $\mathrm{CFL}$

しかし、どのように反対を見せますか？私のTAは、そうするためには、すべての文法（またはオートマトン）に対して、手元の言語を記述できないことを示さなければならないことを固く主張しています。これは大きなタスクのようです！

ポンピング補題について読んだことがありますが、本当に複雑に見えます。

— ラファエル
ソース

Ntpick：言語がコンテキストフリーであるかどうかを示すことは決定できません。

— reinierpost

1

@reinierpostあなたのコメントが質問にどのように関係しているかわかりません。それはについてです証明していない、物事を決める（アルゴリズム）。

— ラファエル

一般に、言語がコンテキストに依存していないことを示すのは簡単ではないということを指摘するだけです。fraflが簡単な場合は、言語を説明するプッシュダウンオートマトンが与えられるなど、一般的な言語には当てはまらない特定の特別な条件が原因である必要があります。

— reinierpost

@reinierpostその推論の行は、決定できないことを証明するのが難しい（等しい？）ことを前提としているようです。それは本当かしら。

— ラファエル

69

私の知る限りでは、ポンピング補題があり、これまでで最も簡単で、使用される技術。難しい場合は、最初に通常バージョンを試してください。それほど悪くはありません。文脈自由とはほど遠い言語のためのいくつかの他の手段があります。たとえば、決定不能な言語は、文脈に依存しないことは自明ではありません。

そうは言っても、もしあれば、ポンピング補題以外のテクニックにも興味があります。

編集：これはポンピング補題の例です：言語が文脈自由であると仮定します（は素数の集合です）。ポンピング補題には多くの量指定子があるので、これを少しゲームのようにします： $L=\{ a^k \mid k ∈ P\}$ $P$ $∃/∀$

ポンピング補題はあなたにを与えます $p$
少なくともの長さの言語の単語を与える $s$ $p$
：ポンプの補題はこのようにそれを書き換え（いくつかの条件付きと） $s=uvxyz$ $|vxy|≤p$ $|vy|≥1$
整数 $n≥0$
場合はされていない、あなたが勝つ、文脈自由ではありません。 $uv^nxy^nz$ $L$ $L$

この特定の言語では、任意の（およびは素数）がトリックを行います。次に、ポンピング補題はを与えます。コンテキストの自由度を反証しますようなを見つける必要があります素数ではありません。 $s$ $a^k$ $k≥p$ $k$ $uvxyz$ $|vy|≥1$ $n$ $|uv^nxy^nz|$

| u v^{n} x y^{n} z | = | s | + (n - 1) | v y | = k + (n - 1) | v y |

$|uv^nxy^nz|=|s|+(n-1)|vy|=k+(n-1)|vy|$

そして、は次のことを行いますは素数ではないので、です。ポンピング補題は適用できないため、はコンテキストに依存しません。 $n=k+1$ $k+k|vy|=k(1+|vy|)$ $uv^nxy^nz\not\in L$ $L$

2番目の例は、言語です。（もちろん）文字列を選択し、これらの5つの部分に分割し、導出されたすべての文字列を言語に残すことができる方法がないことを示す必要があります。 $\{ww \mid w \in \{a,b\}^{\ast}\}$

文字列は、この証明に適した選択肢です。ここで、とがどこにあるかを調べる必要があります。重要な部分は、または何か（おそらく両方）が含まれていること、およびと（および）の両方が長さ部分文字列に含まれていることです。 $s=a^{p}b^{p}a^{p}b^{p}$ $v$ $y$ $v$ $y$ $v$ $y$ $x$ $p$

この文字列には、とがどこにあるかについて多くの可能性がありますが、実際にはいくつかのケースが非常によく似ていることがわかります。 $v$ $y$

VのY ∈ B * B | v y | = k個の≤のPまたは。そのため、これらは両方とも、連続し sまたは s のセクションの1つに含まれています。これは、彼らがどちらにいるかは関係ないので、議論するのは比較的簡単なケースです。。
- それらがsの最初のセクションに場合、ポンプするとき、新しい文字列の前半はで、2番目は。明らかにこれはの形式ではありません。 $a$ $a^{p+k}b^{p-k/2}$ $b^{k/2}a^{p}b^{p}$ $ww$
- 他の3つのセクションのいずれの引数もほぼ同じように実行され、とがインデックスで終わる場所になります。 $k$ $k/2$
2つのセクションにまたがっています。この場合、ポンプダウンはあなたの友達です。繰り返しますが、これが発生する可能性のある場所（正確には3つ）がありますが、説明のために1つだけを行い、残りはそこから簡単に理解できるはずです。
- が最初のセクションと最初のセクションの境界にまたがると仮定します。してみましょう（正確にどこ関係ないsおよび sがであるおよびが、我々は、彼らがためにいることを知っています）。次に、ポンプダウンすると（つまり場合）、新しい文字列ですが、をに分割できる場合、中間点は2番目セクションのどこかにある必要があるため、前半は $vxy$ $a$ $b$ $vy = a^{k_{1}}b^{k_{2}}$ $a$ $b$ $v$ $y$ $i=0$ $s'=a^{p-k_{1}}b^{p-k_{2}}a^{p}b^{p}$ $s'$ $ww$ $a$ $a^{p-k_{1}}b^{p-k_{2}}a^{(k_{1}+k_{2})/2}$ 、後半はです。明らかにこれらは同じ文字列ではないため、とそこに置くことはできません。 $a^{p-(k_{1}+k_{2})/2}b^{p}$ $v$ $y$

残りのケースはそこからかなり透過的でなければなりません-それらは同じアイデアで、最初のインスタンスの他の3つのスポットにとを置き、2番目のインスタンスに2つのスポットを置きます。ただし、すべての場合において、文字列を半分に分割すると順序が明らかに混乱するような方法でそれをポンピングできます。 $v$ $y$

— jmad
ソース

確かに、kozenのゲームはこれを実行する方法です。

— ソクラテス

45

オグデンの補題

補題（オグデン）。してみましょう文脈自由言語であること。定ある毎のためにそのようなとの任意の方法マーキングの以上の位置（シンボル）「区別位置」と、次にのように書くことができる、そのような $L$ $N$ $z\in L$ $N$ $z$ $z$ $z=uvwxy$

$vx$ には少なくとも1つの位置があります。

$vwx$ には最大で位置があります。 $N$

すべてのために、。 $i\geq 0$ $uv^iwx^iy\in L$

例。ましょう。想定文脈自由である、と聞かせてオグデンの補題によって与えられた一定です。ましょ（に属する）、と我々は仮定マークシンボルとして識別全ての位置を（すなわち、第1の位置）。ましょう分解することオグデンの補題から条件を満たしました。 $L=\{a^ib^jc^k:i\neq j,j\neq k,i\neq k\}$ $L$ $N$ $z=a^Nb^{N+N!}c^{N+2N!}$ $L$ $a$ $N$ $z$ $z=uvwxy$ $z$

またはに異なるシンボルが含まれる場合、シンボルの順序が間違っているためです。 $v$ $x$ $uv^2wx^2y\notin L$
と少なくとも一方には、のみが区別されているため、シンボルのみを含める必要があります。したがって、または場合、です。してみましょう。次に、つまりが除算することを意味し。してみましょう。次に、は属します。ただし、です。以来正確に持ってシンボルを、そして $v$ $x$ $a$ $a$ $x\in L(b^*)$ $x\in L(c^*)$ $v\in L(A^+)$ $p=|v|$ $1\leq p\leq N$ $p$ $N!$ $q=N!/p$ $z'=uv^{2q+1}wx^{2q+1}y$ $L$ $v^{2q+1}=a^{2pq+p}=a^{2N!+p}$ $uwy$ $N-p$ $a$ $z'$ 持っているシンボル。しかし、と両方にがないため、にはシンボル、これはを意味し、これはオグデンの補題と矛盾します。または場合、同様の矛盾が発生します。は文脈自由ではないと結論付けます。 $2N!+N$ $a$ $v$ $x$ $c$ $z'$ $2N!+N$ $c$ $z'\notin L$ $x\in L(A^+)$ $x\in L(c^*)$ $L$

運動。Ogdenの補題を使用して、がコンテキストフリーではないことを示します。 $L=\{a^ib^jc^kd^{\ell}:i=0\text{ or }j=k=\ell\}$

ポンピング補題

これは、すべての位置が区別されるオグデンの補題の特殊なケースです。

補題。してみましょう文脈自由言語であること。定ある毎のためにそのような、のように書くことができる。、そのような $L$ $N$ $z\in L$ $z$ $z=uvwxy$

$|vx|>0$ 。

$|vwx|\leq N$ 。

すべてのために、。 $i\geq 0$ $uv^iwx^iy\in L$

パリフの定理

これは、オグデンの補題よりもさらに技術的です。

定義。ましょう。を定義しますここで、は中。 $\Sigma=\{a_1,\ldots,a_n\}$ $\Psi_{\Sigma}:\Sigma^*\to\mathbb{N}^n$

Ψ_{Σ} (w) = (m_{1}, \dots, m_{n}),

$\Psi_{\Sigma}(w)=(m_1,\ldots,m_n),$

m_{i}

$m_i$

a_{i}

$a_i$

w

$w$

定義。部分集合のと呼ばれる線形それを書き込むことができる場合： $S$ $\mathbb{N}^n$

S = {u_{0} + \sum_{1 \leq i \leq k} a_{i} u_{i} : for some set of u_{i} \in N^{n} and a_{i} \in N}

$S = \{\mathbf{u_0} + \sum_{1 \le i \le k} a_i \mathbf{u_i} : \text{ for some set of $\mathbf{u_i} \in \mathbb{N}^n$ and $a_i \in \mathbb{N}$}\}$

定義。のサブセットは、線形集合の有限コレクションの和集合である場合、半線形と呼ばれます。 $S$ $\mathbb{N}^n$

定理（パリフ）。してみましょう超える言語とすることが。場合文脈自由であり、その後準線形です。 $L$ $\Sigma$ $L$
$Ψ_{Σ} [L] = {Ψ_{Σ} (w) : w \in L}$ $\Psi_{\Sigma}[L]=\{\Psi_{\Sigma}(w):w\in L\}$

運動。Parikhの定理を使用して、はコンテキストに依存しないことを示します。 $L=\{0^m1^n:m>n\text{ or }(m\text{ is prime and }m\leq n)\}$

運動。パリクの定理を使用して、単項アルファベット上の文脈自由言語も規則的であることを示します。

— じゃのま
ソース

1

質問がポンピング補題に明示的に言及しているため、jmadの答えを受け入れました。しかし、私はあなたの答えにとても感謝しています。ここですべての主要なメソッドを収集することは素晴らしいことです。

— ラファエル

1

それは結構ですが、ポンピング補題はオグデンの補題の特定のケースであることに注意してください

— ;

もちろん。それでも、ほとんどの人は最初にPLを試します。多くはOLさえも知らない。

— ラファエル

1

パリクの定理に基づいたギンズバーグとスパニエの定理は、有界の場合に文脈自由のために必要かつ十分な条件を与えます。math.stackexchange.com/a/122472

— sdcvvc

他の操作に関して「区別されたポジション」を定義してください。または少なくとも非公式に？OLの定義は、多くの異なる場所で逐語的にコピーされていますが、これまでのところ、その意味を説明することを気にかけていませんでした。

— -wvxvw

34

クロージャープロパティ

コンテキストに依存しない言語の小さなコレクションを作成したら、次のようにクロージャープロパティを使用できます。 $\mathrm{CFL}$

と仮定します。次に、クロージャープロパティX（Yと共に）により、ます。これは、我々が保持することがわかっていると矛盾するため、です。 $L \in \mathrm{CFL}$ $L' \in \mathrm{CFL}$ $L' \notin \mathrm{CFL}$ $L \notin \mathrm{CFL}$

これは、多くの場合、事前知識の少ない他の結果のいずれかを使用するよりも短くなります（エラーが少なくなります）。また、あらゆる種類のクラスのオブジェクトに適用できる一般的な概念です。

例1： 通常言語との交差

正規表現指定された正規言語に注意してください。 $\mathcal L(e)$ $e$

してみましょう。なので $L = \{w \mid w \in \{a,b,c\}^*, |w|_a = |w|_b = |w|_c\}$

$\qquad \displaystyle L \cap \mathcal{L}(a^*b^*c^*) = \{a^nb^nc^n \mid n \in \mathbb{N}\} \notin \mathrm{CFL}$

そしては通常の言語との交差の下で閉じられます。 $\mathrm{CFL}$ $L \notin \mathrm{CFL}$

例2：（ 逆）準同型

ましょう。準同型 $L = \{(ab)^{2n}c^md^{2n-m}(aba)^{n} \mid m,n \in \mathbb{N}\}$

$\qquad \displaystyle \phi(x) = \begin{cases} a &x=a \\ \varepsilon &x=b \\ b &x=c \lor x=d \end{cases}$

我々は $\phi(L) = \{a^{2n}b^{2n}a^{2n} \mid n \in \mathbb{N}\}.$

今、と

$\qquad \displaystyle \psi(x) = \begin{cases} aa &x=a \lor x=c \\ bb &x=b \end{cases}\quad\text{and}\quad L_1 = \{x^nb^ny^n \mid x,y \in \{a,c\}\wedge n \in \mathbb{N}\},$

を取得します。 $L_1 = \psi^{-1}(\phi(L)))$

最後に、と通常の言語をせると、言語。 $L_1$ $L_2 = \mathcal L(a^*b^*c^*)$ $L_3 = \{a^n b^n c^n \mid n \in \mathbb{N}\}$

合計で、ます。 $L_3 = L_2 \cap \psi^{-1}(\phi(L))$

ここで、がコンテキストフリーであると仮定します。そして、は準同型、逆準同型、および正規集合との交差に対して閉じられているため、もコンテキストフリーです。しかし、はコンテキストフリーではないことを（必要に応じてPumping Lemmaを介して）知っているため、これは矛盾です。ことを示しました。 $L$ $\mathrm{CFL}$ $L_3$ $L_3$ $L \notin \mathrm{CFL}$

交換補題

インターチェンジ補題 [1]よりも強い状況フリーネスに必要な条件提案オグデンの補題を。たとえば、次のことを示すために使用できます

$\qquad \{xyyz \mid x,y,z \in \{a,b,c\}^+\} \notin \mathrm{CFL}$

他の多くの方法に抵抗します。これが補題です。

してみましょう。次に、定数があり、任意の整数、任意のセットおよび任意の整数にがあり、文字列と $L \in \mathrm{CFL}$ $c_L$ $n\geq 2$ $Q_n \subseteq L_n = L \cap \Sigma^n$ $m$ $n \geq m \geq 2$ $k \geq \frac{|Q_n|}{c_L n^2}$ $z_i \in Q_n$

$z_i = w_ix_iy_i$ for、 $i=1,\dots,k$

$|w_1| = |w_2| = \dots = |w_k|$ 、

$|y_1| = |y_2| = \dots = |y_k|$ 、

$m \geq |x_1| = |x_2| = \dots = |x_k| > \frac{m}{2}$ および

$w_ix_jy_i \in L_n$ すべてのための。 $(i,j) \in [1..k]^2$

それを見つけることを意味適用及びよう1.-4。ただし、5は違反されます。元の論文で示されたアプリケーション例は非常に冗長であるため、ここでは省略します。 $n,m$ $Q_n$

現時点では、自由に利用できる参考文献はありません。上記の定式化は、1981年の[1]のプレプリントから引用されています。同じプロパティが最近（再）発見されたようです[2]。

その他の必要条件

BoonyavatanaとSlutzki [3]は、Pumping and Interchange Lemmaに似たいくつかの条件を調査します。

W.オグデン、RJロス、K。ウィンクルマンによる、文脈自由言語の「交換補題」（1985）
T.Yamakami（2008）による通常言語と文脈自由言語の補題の交換
R. BoonyavatanaおよびG. Slutzki（1988）による文脈自由言語の交換またはポンプ（DI）補題

— ラファエル
ソース

ありCFLの豊富なサブクラスの素敵な閉鎖プロパティを使用することができ、同じ効果には。

— ラファエル

19

設定されたnon-context-free-languagesは半決定的ではない（akare）ため、一般的な方法はありません。一般的な方法がある場合は、それを使用してこのセットを半決定できます。

2つのCFLが与えられた場合、それらの交差点もCFLであるかどうかを判断できないため、状況はさらに悪化します。

参照：Hopcroft and Ullman、「Introduction to Automata Theory、Languages、およびComputation」、1979

— カベ
ソース

2

興味深い（ただし、より高度で自由回答の質問）とは、特定のメソッドを使用して非CFLであることが証明できる非CFLのサブクラスを分類することです。

— カベ

計算可能な方法を探しているのではなく、ペンと紙での校正技術を探しています。後者は必ずしも前者を意味するものではありません。

— ラファエル

13

Ogdenの条件（OC）のより強力なバージョンは

バデル・モウラの状態（BMC）

言語定数が存在する場合BMCを満たすあれば、このようなこと、我々はそれを「区別」位置にラベルを付けるとし、位置を「除外」を場合、次のように書くことができます。 $L\subseteq \Sigma^*$ $n$ $z \in L$ $d(z)$ $e(z)$ $d(z) > n^{e(z)+1}$ $z = uvwxy$

$d(vx) \geq 1$ および $e(vx) =0$

$d(vwx) \leq n^{e(vwx)+1}$ および

すべての、はます。 $i \geq 0$ $uv^iwx^iy$ $L$

がBader-Mouraの条件を満たす場合、言語であると言います。 $L \in BMC(\Sigma)$ $L$

我々は持っている BMCがOCより厳密に強いですので、。 $CFL(\Sigma) \subset BMC(\Sigma) \subset OC(\Sigma)$

参照：Bader、C.、Moura、A.、A Generalization of Ogden's Lemma。JACM 29、いいえ。2、（1982）、404–407

— Vor
ソース

2

理由だけではなく、すべての方法DömösiとKudlekの一般化に行かないdx.doi.org/10.1007/3-540-48321-7_18 ...

— アンドラス・サラモン

@AndrásSalamon：知りませんでした！:-) ...たぶん、OC、BMC、PCは特別なケースであると言う新しい回答として投稿することができます（すべて区別されているか、除外されたポジションはありません）。

— Vor

あなたはそれを投稿することを歓迎します、今は時間がありません。

— アンドラスサラモン

この答えは例から利益を得るでしょう。

— ラファエル