出現回数で記述される言語が規則的かどうかは決定可能ですか?


14

等しい数の0と1を含む単語の言語は規則的ではなく、等しい数の001と100を含む単語の言語は規則的であることが知られています(ここを参照)。

2つの単語与えられたw1,w2場合、同じ数のw1を含む単語の言語w2が規則的かどうかは決定可能ですか?


1i001i、または0i1以外の、そのように定義された通常の言語の他の例を挙げることができます10iか?3シンボルのアルファベットの例はどうですか?
babou

w1厳密なサブワードである場合w2、言語が空であり、したがって通常である可能性が高くなります。他の例は知りません。
sdcvvc

上記の例だけが問題を決定可能にするのではないかと思われます。「発生回数で説明する」という意味を十分に正確に説明していません。
babou

質問の本文は十分に正確なIMOです。
sdcvvc

1
これまでの特別な場合の解決策は、の部分文字列のw1出現が、介在する単一の出現のみを保証するという考えにかかっているようですw2。どういうわけか、現在の答えが正しいと仮定する[まだ明確ではない] w1間に何らかの関係がありw2、文字列のスキャン中に「等しい」または「等しくない」状態になることが保証される「ただし、「等しくない」場合は最大有限数だけオフになります。
vzn

回答:


3

2つの単語w1与えられたw2場合、等しい数のw 1w 2を含む単語の言語が規則的かどうかは決定可能ですか?Lw1w2

最初にいくつかの定義:
それらをより簡潔にすることができ、それらを証明で使用する場合は表記を改善することができます。これは最初のドラフトにすぎません。

2つの単語w1与えられた場合w2、次のように言います。

  • w1 常に発生するw2留意、w1w2、IFF

    1. x s = x w 2 yであるような 文字列に対してss=xw2y | x | 0| x | 1 | | y | 0| y | 1 | 1が存在する別の分解、S = X ' 、W 1つのY ' xおよび yという条件x,y ≥∣w1+w2|バツ|0|バツ|1||y|0|y|1|1s=バツw1y
      バツyそれぞれが少なくとも0含み、1(@sdcvvcによって見出さ)病的なケースで必要とされる:W 2 = V 1 、I + JおよびY 1 *、およびその対称的変異体。w1=10w2=v1+jy1
    2. 文字列が存在する| X | s=バツw2y多くても1つの分解に存在するように、S = X ' 、W 1つのY 'x,y ≥∣w1+w2s=xw1y
  • 常に共起 W 2留意、 wは1w1 w2、それぞれが常に他と一緒に発生する場合、w1w2

  • w 2は独立して出現し w 1 noted notedw1w2 、どちらも常に発生しない場合、w1w2

  • 常に発生のm回以上、またはより W 2留意、 wは1 M wが2の任意の文字列を、IFFを Sように 、S = X W 2、Y | X | | Y | | | wは1 | + | wは2 |ある m個の他の分解、S = X I W 1つのY Iをw1 mw2w1mw2ss=バツw2yバツ y| ≥∣w1+w2ms=バツw1y以下のための ように、I jが意味X IX jは[1m]jバツバツj

これらの定義は、w 2が発生するはずの文字列の終わりで起こることを無視できるように構築されています。文字列の最後の境界効果は個別に分析する必要がありますが、それらは有限数のケースを表します(実際、以下の最初の分析ではそのような境界サブケースを1つまたは2つ忘れていたと思いますが、実際には問題ではありません)。定義は、発生の重複と互換性があります。w1w2

考慮すべき4つの主なケースがあります(w 2の間の対称性を無視します):w1w2

  1. おそらく文字列の両端を除いて、両方の単語は必然的に一緒になります。これは、 1 i 0 01 iまたは 0 i 1 10 iの形式のペアのみに関係します。これは、認識される文字列の両端での孤立した出現のみをチェックし、両端または両端で孤立した出現があることを確認する有限オートマトンによって簡単に認識されます。w 1 = w 2の場合も縮退する場合があります。言語Lは明らかに規則的です。w1w2
    10010110w1=w2

  2. ではなく、 W 2W 1 2つの単語が他なしで起こることができないが、逆は真ではないの一つ(ストリングの端部に可能性を除きます)。これは次の場合に発生します。w1w2w2w1

    • w 2の部分文字列です。有限オートマトンは、 w 1 w 2のインスタンスの外側に発生しないことを確認できます。w1w2w1w2

    • 及び W 2 = V 1 jのいくつかの単語のための V { 0 1 } * V 01 I:その前の場合のように、有限オートマトンチェック wは1から分離が発生しない W 2。ただし、オートマトンでは、 w 2の場合に受け入れられる w 1の追加インスタンスを1つカウントできます。 w1=10w2=v1jv{01}v01w1w2w1w2文字列の接尾辞です。他にも3つの対称的なケースがあります(1-0対称および左右対称)。

  3. 2つのワードの一方が他方に二度起こります。これは、文字列に小さな単語が出現しないことをチェックする有限自動化によって認識できます。また、より小さな文字列、この場合にはケース2の2つのバリエーションオートマトンチェック組み合わせやや複雑変異体である 1 I 0は発生しないが、の一部としておそらく除く外 V大きい方で、V 1 jは接尾辞として来ストリングの(および対称性による他の3つのケース)。w12w2
    10vv1j

  4. つの単語は互いに独立して発生します。Generalized-Sequential-Machine(gsm) Gを作成します。これは、 w 2の発生を認識したときに w 1 bの発生を認識し、他のすべてを忘れときに aを出力ます。言語 Lは、言語 G L が正規の場合にのみ正規です。しかし、 G L = { W { B } * | | W | Aw1w2
    Gaw1bw2LG(Lこれは明らかにコンテキストフリーであり、規則的ではありません。したがって、 Lは規則的ではありません。 実際には、 L = G 1G L です。gsmマッピングと逆gsmマッピングでは通常の言語とコンテキストフリー言語が閉じられているため、 Lがコンテキストフリーであることもわかっています。GL={w{ab} wa= ∣wb}L
    L=G1(G(L))L

正式な証拠を整理する1つの方法は、次のとおりです。最初に、言語を認識するPDAを構築します。実際には、1カウンターマシンで実行できますが、有限制御の重複を避けるために2つのスタックシンボルを持つ方が簡単です。次に、FAである必要がある場合は、2つの単語のみに依存する定数でカウンターを制限できることを示します。その他の場合、カウンターが任意の値に到達できることを示します。もちろん、PDAは、証明が簡単に持ち運べるように編成する必要があります。

FAを2スタックシンボルのPDAとして表現するのがおそらく最も簡単な表現です。非正規の場合、PDAの有限制御部分は、上記の校正スケッチのGSMの有限制御部分と同じです。代わりに、出力のさんとBを GSMのようにs 'は、PDAはスタックに数の差をカウントします。ab


3つの単語の場合、文脈自由性について質問がありました。同様に分析できるとわかったときに削除しました。私は最初、非CF性を証明することはオリジナルの練習になると考えていましたが、GSMはそれを台無しにします。
babou

2
「互いに独立して発生する」、「必然的に一緒になる」などの意味は明確ではありません。代わりに正式な定義を書き、すべてのケースをカバーしていることを証明してください。
sdcvvc

1
あなたが何を求めているのか、どのレベルの形式化が必要なのか、どのような目的のためかわからない。私は、2つの単語の可能な関係を手で分析しても正しいとは限らず、とにかく重要ではないことに気付きました。重要なのは、ある単語の出現が、他の単語の出現(または複数)を同時に作成することなく存在できるかどうかです。それは常にローカライズされ、したがって有限に管理できるため、詳細は重要ではありません。どちらもローカライズされているため、両端は関係ありません。発生の重複であっても、1か所で有限数にしかなれないため、重要ではありません。
babou

1
コメントで言及された用語の正確な定義について尋ねました。それらを書いてくれてありがとう。以前にそれらを推測することになっていましたか?とにかく、という主張に思える。これは、s = 0 M 0 i 1 1 M1 0 iが発生しないため、「w 1は常にw 2で発生」の定義の条件1を満たしません。0i110iw1w210is=0M0i11M
sdcvvc

申し訳ありませんが、私はあなたに推測させるつもりはありませんでした。あなたが何を望んでいたかを正確に理解するのに時間がかかりました。私の失敗のみ。あなたの反例については、あなたは正しいです。しかし、私にとってそれは、関係の定義において、テロメアについてもう少し注意しなければならないことを意味するだけです。私はそれらをあまりにも早く定義しましたが、このコンテキストではまたは1 Mはあまり情報を伝えません。これは実際には病理学的ケース内の境界病理学的例であり、3つ以上のシンボルが使用されている場合は実際には発生しません。私はそれが何かを変えるとは思わない。0M1M
babou
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.