タグ付けされた質問 「fl.formal-languages」

形式言語、文法、オートマトン理論

4
通常の文法で受け入れられた単語を数える
通常の言語(NFA、DFA、文法、または正規表現)が与えられた場合、特定の言語で受け入れられる単語の数をどのようにカウントできますか?「ちょうどn文字」と「最大n文字」の両方が重要です。 Margareta Ackermanには、NFAによって受け入れられた単語を列挙するという関連するテーマに関する2つの論文がありますが、効率的に数えるためにそれらを修正することはできませんでした。 通常の言語の制限された性質がそれらを比較的簡単にカウントするように思えます-私はアルゴリズムよりも数式をほとんど期待しています残念ながら、これまでの検索では何も見つかりませんでしたので、間違った用語を使用する必要があります。

3
文脈自由言語をキャプチャする正規表現の拡張機能はありますか?
文脈自由文法(CFG)を含む多くの論文で、そこに提示されているそのような文法の例は、しばしば生成する言語の簡単な特徴づけを認めています。例えば: S→aaSbS→aaSbS \to a a S b S→S→S \to 生成、{a2ibi|i≥0}{a2ibi|i≥0}\{ a^{2i} b^i | i \geq 0\} S→aSbS→aSbS \to a S b S→aaSbS→aaSbS \to a a S b S→S→S \to 生成、及び{aibj∣i≥j≥0}{aibj∣i≥j≥0}\{ a^i b^j \mid i \geq j \geq 0 \} S→aSaS→aSaS \to a S a S→bSbS→bSbS \to b S b S→S→S …

5
Earleyパーサーから解析フォレストを回復しますか?
私は最近Earleyパーサーを読んでいて、これまで見た中で最もエレガントなアルゴリズムの1つだと思います。ただし、従来の意味でのアルゴリズムは認識機能であり、パーサーではありません。つまり、文字列が特定のCFGに一致するかどうかを検出できますが、解析ツリーは作成できません。私の質問は、解析ツリーではなく、指定された入力文字列のすべての可能な解析の解析フォレストを回復する方法です。 GruneとJacobの「Parsing Techniques:A Practical Guide」では、Earleyレコグナイザーの結果から解析フォレストを回復するために使用できるアルゴリズムを示していますが、実行時間はO(n k + 1)、ここでkは文法の最長の生成の長さです。これは、ランタイムが文法のサイズの多項式ではないことを意味します。さらに、解析フォレストを回復するためのアルゴリズムを示唆するアルゴリズムに関するEarleyの元の論文は間違っています(例えば、富田によるこの記事の 762ページを参照)が、多くのソースはまだ解析フォレストを回復する適切な方法としてそれを引用していますが。 私の質問は、与えられた入力文字列の解析フォレストを多項式時間で回復できるかどうかです。私はここで、PDAのシミュレーションを使用して任意の解析用のキュービックサイズの解析フォレスト表現を生成するアルゴリズムを提供する論文を見つけました。理想的には、入力文法をCNFに変換せずにこれを実行したいです(実際に問題を解決します)。結果の解析フォレストはかなり乱雑になるからです。 あなたが提供できる助けをありがとう!

2
文脈依存文法とタイプ
1)静的型付けと正式な文法との関係は、もしあれば、何ですか? 2)特に、線形有界オートマトンは、たとえばC ++またはSMLプログラムが適切に入力されたかどうかをチェックできますか?ネストされたスタックオートマトン? 3)静的型付け規則を正式な文法用語で表現する自然な方法はありますか?

1
半分の言語の複雑さ
上の任意の言語に対して、定義します つまり、は、ような等しい長さのが存在するすべてので構成されます。LLLΣ∗Σ∗\Sigma^*L1/2={x∈Σ∗:xy∈L,y∈Σ|x|}.L1/2={x∈Σ∗:xy∈L,y∈Σ|x|}.L_{1/2} = \{x \in \Sigma^* : xy\in L, y\in\Sigma^{|x|} \}.L1/2L1/2L_{1/2}xxxyyyxy∈Lxy∈Lxy\in L Sipserの本の演習では、が常にが規則的であることを示すように求めています。私は2つの明確な解決策を見てきましたが、どちらも状態の指数関数的な拡大を伴います。L1/2L1/2L_{1/2}LLL 質問:の標準オートマトンがそれよりも(指数関数的に)大きくなるように、だれでも言語ファミリー構築できますか?これまでの私の最善の努力は、状態サイズをだけ増やすだけです!{Ln}{Ln}\{L_n\}(Ln)1/2(Ln)1/2(L_n)_{1/2}LLL+1+1+1

1
多項式サイズのDFAで認識される言語
固定有限アルファベット場合、正確にを受け入れる上の決定性有限オートマトン(DFA)が存在する場合、上の形式言語は正規です。ΣΣ\SigmaLLLΣΣ\SigmaΣΣ\SigmaLLL 私は、語長で多項式的にのみ成長するサイズのオートマタ族によって認識できるという意味で「ほぼ」規則的な言語に興味があります。 正式に、すべての単語に対して、成り立つ場合、形式言語はDFA ファミリーによって認識されます 、はあり、受け入れる場合(他の受け入れるかどうかに関係なく)、p-regular言語を、PTIMEで計算可能な多項式サイズのDFAファミリーによって認識される言語として定義させます。ような多項式すべてのLLL (An)(An)(A_n)w∈Σ∗w∈Σ∗w \in \Sigma^*n=|w|n=|w|n = |w|wwwLLLAnAnA_nwwwAiAiA_iP | A n | ≤ P (N )N(An)(An)(A_n)PPP|An|≤P(n)|An|≤P(n)|A_n| \leq P(n)nnn。(この名前 "p-regular"は私が作ったものです。私の質問は、これに別の名前が既に存在するかどうかを知ることです。これは置換オートマトンの意味でp-regular言語と同じではないことに注意してください。) P-正規言語のこのクラスは、もちろん正規言語は、(単に取るすべてのためのn、Aは正規言語を認識するいくつかのDFAです)。例えば、そのよく知られている:それは、それの完全なスーパーセットである{ n個のB N | N ∈ Nは }(文脈自由ではなく規則的であるが、それは、P-正規であるA NだけカウントしなければNを出現とNの出現B)。ただし、オートマトンは多項式サイズのDFAである必要があるためAn=AAn=AA_n = AnnnAAA{anbn∣n∈N}{anbn∣n∈N}\{a^n b^n \mid n \in \mathbb{N}\}AnAnA_nnnnaaannnbbb、一部の形式言語(実際には一部のコンテキストフリー言語)はp-regularではありません。たとえば、palindromesの言語はp-regularではありません。なぜなら、直感的に、単語の前半を読んだときに、この前半と後半を正確に一致させる必要があるため、可能な限り多くの異なる状態。 そのため、p-regular言語のクラスは、コンテキストフリー言語とは比べものにならない通常の言語の厳密なスーパーセットです。実際には、あなたも、多項式の最小の程度に基づいたp-正規言語を区別することにより、言語の階層を得ることができるものと思わ彼らはそのためのP -regular。この階層が厳密であることを示すために例を作成するのはそれほど難しくありません。ただし、これと、A nの計算の複雑さを制限する階層の代替定義との間の相互作用については、まだよく理解していません。PPPPPPAnAnA_n 私の質問は次のとおりです。p-regularと呼ばれるこのクラス、および関連する階層は以前に研究されたことがありますか?はいの場合、どこで、どの名前の下に? (可能なリンクは、フィールドまたはストリーミング、またはオンラインアルゴリズムです。言語認識問題のストリーミングアルゴリズムの用語では、決定論的なワンパス認識アルゴリズムを持つことができる言語のクラス(または階層)に興味があります。多項式の状態数(つまり対数メモリサイズ)を使用しますが、この論文または関連論文でこのクラスの定義を見つけられませんでした。ただし、問題の表現では、単語の長さは事前にわかっています。ストリーミングコンテキストに少ない自然れている:あなたのストリーミングで読んだ後に到達可能な状態の数という無限オートマトン、特別な「エンド・オブ・言葉」のシンボル、および制約としてこれを見ることができたの文字が多項式であるn個nnnnnn。私はこの区別が違いを生む可能性があると考えています:値が長さで割り切れるバイナリワードの言語は、固定長では簡単ですが、(私は推測します)以前の意味では無限オートマトンでは表現できないため、識別がありません長さが事前にわからない場合は作成できます。) (このp-regularクラスの動機は、確率的単語の言語メンバーシップの確率などのいくつかの問題が、言語が規則的であるときだけでなく、p-regularであるときにもPTIMEであるように見えることです。どのような状況でこれらの問題が扱いやすいかを正確に特徴付けるため)

6
複雑さの下限を決定するための高度な手法
皆さんの中には、この質問をフォローしている人もいるかもしれませんが、これは研究レベルではないため閉じられました。それで、私は研究レベルにある質問の一部を抽出しています。 並べ替えやEXPTIME完了問題への還元などの「より単純な」手法以外に、問題の時間の複雑さの下限を証明するためにどの手法が使用されていますか? 特に: 過去10年間に開発された「最先端の」技術とは何ですか? 抽象代数、カテゴリー理論、または通常「純粋な」数学の他の分野の手法を適用できますか?(たとえば、ソートの「代数構造」についての言及をよく耳にしますが、これが何を意味するのかについての本当の説明はありません。) 重要度は低くなりますが、バウンドの複雑さに対するあまり知られていない結果は何ですか?

1
すべての明確な文法を線形時間で解析できますか?
非標準のLR解析をいじくり回すとき、O (n 2)時間の明確な文法を正確に解析できる解析方法(無限サイズのテーブルを使用し、多少実用的ではありません)を考え出しました。 :O (n2)O(n2)O(n^2) すべての明確な文法を線形時間で解析できますか? 私はどこかにこれが事実であることを読んだと確信していますが、インターネットを検索するときにそれは現れません。ここでも同じ質問がされましたが、私の知る限り答えはありませんでした。

2
プロトコルのパーティション番号と確定的な通信の複雑さ
ほかに(決定的)通信複雑 関係の、必要な通信量の別の基本的な尺度であるプロトコルパーティション数。これら2つの測定値の関係は、一定の係数まで知られています。Kushilevitz and Nisan(1997)によるモノグラフは、Rc c (R )cc(R)cc(R)RRR p p (R )pp(R)pp(R) C C (R )/ 3 ≤ ログ2(P P (R ))≤ C C (R )。cc(R)/3≤ログ2⁡(pp(R))≤cc(R)。cc(R)/3 \le \log_2(pp(R)) \le cc(R). 2番目の不等式に関しては、関係(の無限族)を与えるのは簡単です。log 2(p p (R ))= c c (R )RRRログ2(p p (R ))= c c (R )ログ2⁡(pp(R))=cc(R)\log_2(pp(R)) = cc(R) 最初の不等式に関して、Doerr(1999)は、最初の境界の係数を置き換えることができることを示し。仮にあったとしても、最初の限界をどれだけ改善できますか? c = …

3
カテゴリー理論的観点からの通常言語
アルファベット超える通常の言語は、自然にポーズ、そして実際には格子と考えることができることに気付きました。さらに、空の言語との連結は、このカテゴリの厳密なモノイド構造を定義します。これは、結合よりも分配的です(満たすかどうかはわかりません)。これは、通常の言語の理論または実践において有用な構成体ですか?たとえば、Kleeneの星を1つとして定義できますか?ΣΣ\Sigmaϵϵ\epsilon これはCourseraのコンパイラコースで質問された質問のコピーです:https ://class.coursera.org/compilers/forum/thread ? thread_id=311

4
プッシュダウンオートマトンを使用したコンテキストフリー言語のポンピング補題の証明
通常の言語のポンピング補題は、学習した言語を認識する有限状態オートマトンを検討し、状態数よりも長い長さの文字列を選択し、鳩の巣の原理を適用することで証明できます。ただし、コンテキストフリー言語のポンピング補題(およびやや一般的なオグデンの補題)は、学習した言語のコンテキストフリー文法を検討し、十分に長い文字列を選択し、解析ツリーを調べることで証明されます。 2つのポンピングレンマの類似性を考えると、文法ではなく言語を認識するプッシュダウンオートマトンを検討することにより、コンテキストのないものも通常の方法と同様の方法で証明できることが期待されます。しかし、私はそのような証拠への参照を見つけることができませんでした。 したがって私の質問:プッシュダウンオートマトンのみを含み、文法を含まないコンテキストフリー言語のポンピング補題の証拠はありますか?



5
言語の特別なクラス:「循環」言語。知られていますか?
有限アルファベットシグマ上で、次のクラスの「循環」言語を定義します。実際、この名前はすでに、DNAコンピューティングの分野で使用されていると思われる別のものを示すために存在しています。AFAICT、それは言語の異なるクラスです。 言語Lは、すべての単語に対する循環iffです。wwwΣ∗Σ∗\Sigma^* wwwがLに属するのは、すべての整数、がLに属する場合のみです。k>0k>0k > 0wkwkw^k このクラスの言語は知られていますか?私も定期的で、特に次のような循環言語に興味があります。 それらが既に知られている場合、それらの名前 オートマトン(特にDFA)が与えられた場合、受け入れられた言語が上記の定義に従うかどうかの問題の決定可能性

1
明確なコンテキストフリー言語の等価性は決定可能ですか?
同等性の問題は一般的な文脈自由言語では決定できないことはよく知られています。しかし、私が知っているこの事実のすべての証拠は、いくつかのあいまいな文脈自由文法を含むようです。このため、問題を明確なコンテキストフリー言語に制限しながら、問題が未決定のままであるかどうかを確認したいと思います。つまり、曖昧でないことがアプリオリに付与された2つの文脈自由文法が与えられた場合、それらが同等であるかどうかは決定可能ですか? この問題は少し興味をそそります。それは、決定論的コンテキストフリー言語では等価性が決定可能であることが知られているからです。見下ろす。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.