形式言語間の適切な同型は何ですか?


9

アルファベットΣ上の形式言語 は、Σ ∗のサブセット、つまりそのアルファベット上の単語のセットです。2つの形式言語LL は、対応するセットがL form L ′のサブセットとして拡張的に等しい場合、等しい。複雑性理論の言語を使用して、「問題」の概念形式化できますLΣΣLLLL「一般に」エクステンションの平等は決定不可能であると文句を言うかもしれませんが、これは誤解されると思います。

私はしばらくして次の問題を考えています:アルファベットΣ = { a b }およびΣ = { c d }(ここでabcおよびd)に関する 2つの言語およびL LLΣ={a,b}Σ={c,d}abcd異なる文字)は、「まったく」同じ「問題」を説明していても、決して等しくなることはありません。しかし、実際に「正確に」同じ「問題」を説明する場合、それらは同型でなければなりません。私が知りたいのは、複雑性理論に適した同型の考えられる概念です。私は当初、有限状態マシンのような計算的に弱い「トランスレーター」を使用して、許容される同型を定義できると考えていましたが、これは、同等の論理式間の簡単な構文変換ではすでに壊れているようです。(例えば参照の構文定義で、この表をデュアル A線形ロジックで)。

今日、私は次のアイデアを思いつきました。特定の「決定問題」に対応する言語の定義には2つの部分があることがよくあります:(1)許可された問題インスタンスを有限のシンボル文字列としてエンコードすること、および(2)「その言語に属する「受け入れられた」問題インスタンス。与えられたシンボルの有限文字列が許可された問題インスタンスのエンコーディングであるかどうかのチェックで、有限状態マシンよりも計算的に強力なマシンがすでに必要な場合、このより強力なマシンを許可された同型の定義にも使用する必要があります。

質問:この一連の推論により、私の問題が「解決」される可能性はありますか?私の問題はすでに解決されているので、適切なリファレンスを読む必要があるだけですか?私の問題自体は理にかなっていますか、またはこれは拡張平等の決定不能性について不平を言うのと同じくらい間違っていますか?


編集(まだ回答はありません)「(1)シンボルの有限文字列としての許可された問題インスタンスのエンコーディング」には、正規化された入力の(非表示の)仮定がすでに含まれていることに気付きました。この仮定がないと、2つの異なる有限文字列が同じ問題インスタンスに対応する可能性があります。与えられた有限の文字列が有効かどうかをチェックする代わりに、チェックは正規化された入力を生成します(そして無効な文字列を特別な文字列にマップします)。

この設定には、チェック/正規化を行うマシンに、有限ストリングを他の有限ストリングに変換する手段がすでに備わっているという利点があります。このタスクに許可されたマシン(複雑度クラス)は問題定義の一部である可能性があり、(等)射は同​​じマシン(複雑度クラス)を使用します。(ラファエルのコメントからの「ポリタイム多元削減」の提案は、実際にPの問題の1つの可能性でしょう。P。)

欠点は、この指定方法は確定的マシンにのみ適している場合があることです。非決定的なマシンでは、2つの入力文字列が同じ問題インスタンスに対応するかどうかを指定/決定するためのより柔軟な方法が必要になる場合があります。


1
すべての無限言語(有限アルファベット以上)は同型です(それらは数えられるため)。あなたが望むものを洗練する必要があります。また、2つの問題は「同じ」とはどういう意味ですか。間違いなく、ポリタイムの多対1削減は、希望どおりのマッピングを提供しますが、これらは「異なる」(まだ同じように難しい)問題を相互にマッピングします。
ラファエル

@Raphael「あなたが望むものを改良する必要がある」というコメントに少し混乱しています。この質問は、正確に、私が使用したい同型の概念についてです。あなたが本当に何を望んでいるかを知るのは時々難しいです!「完全に」同じ「問題」を記述する言語について話す質問の通過について、私は基本的に、acで識別しbdで識別するLL ′が等しくなる場合を考えていました。この推論の流れを続けることで、当初、私は有限状態機械を「変換器」と見なすようになりましたが、これは結局私の問題を解決しません。acbdLL

@Raphael私は、ほとんどの問題について、ポリタイムの多対1削減は、私が考えている同型写像にとって計算的には非常に強力すぎると思います。同型写像で解を計算したり、グラフ理論の問題を論理充足問題にしたりしたくありません。同じ問題のインスタンスの2つのわずかに異なるが本質的に同等のエンコーディングを特定したいだけです。この同型の概念が偶然に特定の(のエンコーディング)グラフ理論的問題と特定の(のエンコーディング)論理充足可能性問題を識別する場合、問題はありません。
トーマスクリンペル2014年

大まかに言えば、削減に関連する複雑さがこの目的で使用されます。P時間よりも強力な削減は、たとえばログスペースの削減、時間などですO(nc)
。– vzn

回答:


6

私の問題はすでに解決されているので、適切なリファレンスを読む必要があるだけですか?

抽象言語族の理論が関連しています。たとえば、有限状態トランスデューサーによって定義される射は、コーンファミリーにつながります。1970年からのEilenbergの短いICM講演はこのフレームワークをうまく説明しています 1979年からのJ. HopcroftとJ. Ullmanによる「オートマトン理論、言語、および計算入門(第1版)の第11章「言語のファミリの閉包特性」も参照してくださいこのフレームワークに適合するのは非決定論的な言語のみです1。最後に、 1985年のJ. BerstelおよびD. PerrinによるコードTheory of code、問題の合理的な解決策を見つけるのに役立ちました。コードとオートマトン2009年のJ.ベルステル、D。ペリン、C。ロイテナウアーによるこの本の大幅な改訂で、より広範囲をカバーしています。

この推論の行は私の問題を「解決」する可能性がありますか?私の問題自体は理にかなっていますか、またはこれは...と同じように間違っていますか?

「問題の概念を形式化する」ために言語間の同型をモデル化するための正しいカテゴリが1つあるという仮定は、誤った方向に導かれています。正式な言語のコンテキストで興味深いと思われる多くの異なるカテゴリがあります。

多項削減に関連する3つの興味深いカテゴリを以下に示します。これらは、全体部分、および関係と呼ばれます。カテゴリのオブジェクトは、ペアで有限アルファベットのΣと言語L Σ *以上の単語のΣ。以下のために合計、ソースオブジェクトとの間の射Σ L と対象物Σ 'Lは'の合計の関数であるF(Σ,L)ΣLΣΣ(Σ,L)(Σ,L) L = F - 1L '。以下のために部分的、射は、部分関数である F Σ *Σ ' * L = F - 1L '、二つの部分関数 F Gがあれば(射として)等しいと考えられる F X = G X f:ΣΣL=f1(L)f:ΣΣL=f1(L)fgf(x)=g(x)すべてのためと同じソースとターゲットとの間の任意の二つの射が同じであると考えられます。許可された関数または関係のセットをさまざまな単純な「トランスレータ」に制限して、興味深い同型のカテゴリを取得できます。xL。以下のためにリレーショナル、射が関係しているL = R - 1L 'RΣ×ΣL=R1(L)

  • からΣ までのモノイド準同型は、非常に基本的な合計カテゴリを提供します。このカテゴリーの同型は基本的に、ΣΣ ′の間の全単射です。ΣΣΣΣです。言語の合理的なファミリは、これらの同型性をより尊重する必要があります。つまり、逆準同型性の下で閉じられるべきです。
  • 確定的ログスペースチューリング機械トランスレータによって定義された部分関数は、非常に自然な部分カテゴリを提供します。多くの自明な構文変換(否定を原子に移動するためにドモルガンの法則を適用するなど)を実行でき、機能的な有限状態トランスデューサーによって定義される射を含みます1ソートもできます。それでも、2つの完全に関連のない言語を同型であると識別することはありません。2つの射の構成の正体射との同等性は、双方向での多元化の存在よりもはるかに強い要件だからです。
  • 非決定論的なログ空間チューリング機械翻訳によって定義された関係は、興味深い関係カテゴリを提供します。SATはこのカテゴリのHORNSATに同型ですが、TAUTOLOGYまたは他のco-NP完全問題がHORNSATに同型であるかどうかは未解決の問題です。

アルファベット上の 2つの言語L ′はΣ = { a b }Σ = { c d }(ここでabcdは異なる文字です)は、「正確に」同じ「問題」。しかし、実際に「正確に」同じ「問題」を説明する場合、それらは同型でなければなりません。LLΣ={a,b}Σ={c,d}abcd

上記の非常に基本的な合計カテゴリでこの問題を解決します。

「まったく同じ」を「ほとんどの実用的な目的ではほぼ同じ」に置き換えると、問題はさらに興味深いものになりますΣ = { U C A G } の言語とし、L Σ上の言語とします。' = { 0 1 }から得られたL置換によってU 00C 01A 10、及びG 11LΣ={U,C,A,G}LΣ={0,1}LU00C01A10G11。注いずれかであること、全カテゴリ、およびL "のために同型ではありませんL = Σ *。同じことが真のためであろう部分「二つの部分の機能部場合、カテゴリFGがあれば(射として)等しいと考えられるF X = G X のすべてのためのx Lの定義から省略されました」。LLL=Σfgf(x)=g(x)xL

上記の非常に自然な部分カテゴリは、L 'を同型にするのに十分です。それらを同型にするより基本的な(つまり、より制限的な)カテゴリーがあるとよいでしょう。以下の(より制限が厳しくなる)カテゴリは、私には合理的に見えます。LL

  • 唯一の受け入れ状態が初期状態である明確な有限状態トランスデューサ2によって実現される部分関数。この部分カテゴリの同型は、認識可能な可変長コード間の全単射(のサブセット)です。
  • 確定的な有限状態トランスデューサーによって実現される部分関数。ここで受け入れられる状態は初期状態のみです。この部分カテゴリの同型は、プレフィックスコード間の全単射(のサブセット)です。
  • 唯一の受け入れ状態が初期状態である前方および後方決定論的トランスデューサーの両方によって同時に実現される部分的な機能。この部分カテゴリの同型は、バイフィックスコード間の全単射(のサブセット)です。
  • 同型写像がブロックコード間の全単射であるような部分関数のさらなる制限も意味があります。

複雑性理論の言語を使用して、「問題」の概念を形式化できます。

カテゴリ理論について学ぶ前から、「問題」の概念を形式化するための「より忠実な」方法があるかどうか疑問に思っていました。カテゴリー理論に精通した後、私は時々可能な解決策を考え出そうとしましたが、いつも最初のつまずきブロックですぐに諦めました(とにかく誰も気にしないので)。ユーリ・グレビッチがいくつかの関連する問題を解決したことを知っていますが、彼の解決策は実際に適用可能です。

過去3週間の私の暇な時間のほとんどは、ついにこの問題についていくらかの進歩を遂げることに費やされました。ほとんどの場合、時間は私が考えていた可能な解決策で迷惑な問題を見つけることに費やされていました。(古い)本や記事を読んだり、トランスデューサーや有理セットについて多くの基本的な概念や事実を学んだりすることで、進歩の感覚が生まれました。最後に、私は、接頭コードとbifixコード(以前の概念を学んだbiprefixコード私は、合理的な思い付くすることができBerstelの本の中で)、3つのカテゴリーは、上記に。

より明白なカテゴリーのいくつかの問題を見たことがない限り、それらの(コード関連の)カテゴリーを理解するのは難しいかもしれません。一般的な問題は、合成時のクロージャにより、部分関数の適切に制限されたクラスを定義することが困難になる可能性があることです。もう1つの問題は、1の加算(または定数による乗算)が、数値の桁がローエンディアンの順序で指定されている場合は「関数の計算が簡単」であるが、桁数が大きい場合はそうではないという事実に関連しています。エンディアン順。


O(n)O(1)

2 明確な有限状態トランスデューサは、各入力に対して最大1つの受け入れパスを持つ非決定性有限状態トランスデューサです。部分的な機能を実現するため、機能的な有限状態トランスデューサでもあります。与えられた有限状態トランスデューサが明確であるかどうかは決定可能です。

RΣ×ΣL=R1(L)R1(ΣL)、および同じソースとターゲットの間の2つの射は等しいと見なされます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.