有限集合の正規表現のサイズを最小化する


15

言語の仕様としてDFAを使用している場合でも、正規表現のサイズを最小化することはPSPACE完全であることが知られています。

言語が有限の場合、結果はどうなりますか?

この問題は2つのモデルで検討できます。

  1. 入力は言語のすべての文字列であり、すべての文字列の長さの合計によって入力サイズを測定します。
  2. 入力はDFAであり、DFAの状態の数によって入力サイズを測定します。

Kleene starは有限の場合には役に立たないため、、式では(連結)が使用されます。もちろん、正規表現の長さは任意です。代わりに、各操作に重みを付け(括弧の追加を含む)、正規表現の重みを最小化するように要求できます。|

編集: adrianNが指摘したように、それは文法ベースのコードに関連しています。有限集合を記述するために最小長の文脈自由文法を生成することはNP完全です。最小サイズの文脈自由文法が最小サイズの正規表現について多くを暗示している理由は明らかではありません。巧妙な書き換えルールがこれら2つを関連付け、最初のモデルでは問題がNPにあることを証明できます。


3
これは文法ベースのコードに関連しているようです。
adrianN

入力サイズが制限されているとします。kleene starは有効である可能性があります。そのため、入力サイズが有限言語の最長の文字列に(自然に)制限されるかどうかを定義するのは理にかなっています。&また、その場合にkleene starがまだ除外されている場合。また、(明らかですか?)ヒューリスティックとして、DFAを最小化し、それからREを構築することも1つの戦略です...また、RE(変数置換あり)はDAGのような構造を持ち、多くの(強力な)thmsが知られていないことにも注意してくださいDAGを-のように最小限の構造について....変数置換のないREがツリー状(式)です&...との仕事に容易であろう
vzn

他の角度。brzozowskiによって導入RE「誘導体」などを参照のDFAに直接のREを変換するのに有用であることが知られている再検討正規表現誘導体オーウェンズ、Reppy、Turonでは。逆の問題に同じ構造を使用する方法があるかもしれません。とにかくしかし全体的には....オープンな問題のように見える
vzn

回答:


4

次の引数は基本的に(1)からのものです。2つの問題の決定バージョンは、次のように、多項式階層の第2レベル(より正確には:複雑度クラス)に含まれています。最大のサイズの正規表現を推測し、指定された決定性有限オートマトン(それぞれ:単語のリストとして指定された言語)と同等かどうかを確認します。 KΣ2Pk

あなたの問題に関するこれ以上の結果は知られていないと思います。正規表現ではなく、最小の等価な非決定的有限オートマトンを見つけることを目的とする、似たような最適化問題の場合、次の結果が判明しています。

  • DFAとして記述された入力の場合、最小等価NFA問題は -hardです((1)を参照)。ここで、は「差分多項式時間」を表します。これは、ブール階層の第2レベルの「シグマ」複雑度クラスです。D PDPDP
  • NP
  • L{01}mNP

注意:無限言語の設定とは異なり、NFA最小化のケースから質問の問題への直接的な削減は見られません。

参照:

(1)Hermann GruberおよびMarkus Holzer。有限および単項言語のNFA最小化の計算量。In:第1回言語とオートマトンの理論と応用に関する国際会議(LATA 2007)、pp。261-272、2007。

(2)Hermann GruberとMarkus Holzer。P <> NPを仮定した場合の非決定的状態の非近似性と遷移の複雑さ。In:言語理論の発展に関する第11回国際会議(DLT 2007)、LNCS 4588、pp。205-216、2007。

L={w}w


-6

明らかに正確な既知の答えまたはこれよりも優れた答えが欠けている、REを最小化するsubjに関する研究に関する近い/最近の参照があります(明らかに珍しい角度です):

NFAと正規表現の最小化(2005) 、Gregor Gramlich、Georg Schnitger

非決定性有限オートマトン(nfa)の最小化および特定のnfa、正規表現、または決定性有限オートマトン(dfa)に関連する正規表現に関する近似不可能な結果を​​示します。特定のnfaまたは正規表現をn個の状態、遷移、応答で効率的に最小化することは不可能であることを示します。P = PSPACEでない限り、因子o(n)内のシンボル。n個の状態を持つ特定のdfaの近似不可能性の結果は、暗号の仮定に基づいており、効率的なアルゴリズムには少なくともpoly(log n)の近似係数があることを示しています。また、セットアップにより、一貫性のある最小のdfa問題を分析できます。


4
この論文は、言語が有限である場合に何が起こるかを扱っていないため、この質問は特に尋ねられました。
チャオ徐

1
それからそれは[関連/ nec] bkgとして役立つ。ただし、他の質問に[公開済み]の回答がない場合、この質問も当然のことながら驚くことではないことに注意してください。また、[ MEA culpa ] didntの通知用紙は他の問題にMDBによって引用しました。
vzn
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.