カテゴリ理論とパーサー

私はパーサー（主にパーサーの表現文法）に興味があるので、パーシングのカテゴリー的な扱いを与える作業があるかどうか疑問に思っています。カテゴリ理論の解析への応用に関する参考文献は大歓迎です。

ベスト、

カテゴリ理論の代数幾何学以外の主題への非常に最初の応用の1つは、構文解析でした！検索のガイドとなるキーワードは、「Lambek calculus」と「categorial grammar」です。

現代では、Joachim Lambekは文構造をモデル化するために非可換線形論理を発明しました。基本的な考え方は、基本的な品詞を型を持つように指定し、（たとえば）英語の形容詞を名詞句から名詞句に変換する関数型とすることです。（たとえば、「green」は名詞を名詞に変換する関数と見なされます。これは、「eggs」が名詞であるため、「green eggs」のタイプが適切であることを意味します）。

線形性は、形容詞が引数として正確に1つの名詞句を取るという事実から発生し、非可換性は、文中の単語の順序が重要であるという事実から発生します。たとえば、形容詞の名詞引数は形容詞（「green eggs」）の後に来るのに対し、前置詞句の名詞句は前置詞句（「green eggs with ketchup」）の前に来ます。カテゴリ用語では、左右が閉じている（非対称の）モノイドカテゴリが必要です。タイプは、左側にが先行するときにタイプを持つフレーズのタイプであり、は、右側にが成功しときにタイプを持つフレーズのタイプであり、タイプは、タイプ何かをタイプ何かと連結することによって作成されるフレーズのタイプです。 $A\setminus{}B$ $B$ $A$ $B/A$ $B$ $A$ $A \ast B$ $A$ $B$

Lambek文法は文脈自由言語と同等であることがわかりますが、明らかにこれは非常に難しい結果です。CFGはLambek文法のサブセットであることを示すのは簡単ですが、他の方向は1991年にPentusによってのみ確立されました。

読者のために良い運動^ H ^ H ^ Hpublicationは（つまり、私はそれを試してみましたが、それは試してみ冷やすことだと思うしていない）再公式化するLambekの計算を使用することであるブール行列乗算を経由して解析するCYKのヴァリアントのプレゼンテーションをカテゴリで、条項。動機として、Lambekの1958年の論文The Mathematics of Sentence Structureから引用します。

ここで提示される計算は、GD Findlayと線形および多重線形代数の正準写像の議論のために本著者によって構築された計算と形式的に同一です。

— ニール・クリシュナスワミ
ソース

Lambekの言語でパースCFG-の言い換えVailantのマトリックス乗算の演出は、文法...単なる運動よりもおそらくある

— マーティン・ベルガー

@MartinBerger：それは良いですか？:)

— ニールクリシュナスワミ

調べる方法は1つだけです！

— マーティンバーガー

うーん、しかし「カテゴリー文法」はカテゴリーの言語的概念（en.wikipedia.org/wiki/Syntactic_category）を指し、数学者のカテゴリー理論を含みません。したがって、答えは質問とは関係ありません。

— エミルイェジャベクはモニカをサポートします

ランベック計算（カテゴリ文法の主要な形式の1つ）は、カテゴリ理論の意味で確かにカテゴリ的です-閉じたモノイダルカテゴリの構文理論であり、ランベックはこの事実をかなり意識していました。証明理論の言語では、言語学のカテゴリーは、ランベック計算の「原子命題」を与えます。

— ニールクリシュナスワミ

la Parsecの（コンテキストなしの）構文解析は、自然にApplicative型クラスの観点から表現されているように見えます。ターンでは、このクラスは、この非常に素晴らしいcstheoryの質問とこの素敵なstackoverflowの質問で言及されている、いわゆる強い緩いモノイダルファンクターによってよく説明されています。

より一般的には、Parsecパーサーはモナドであり、CS理論とカテゴリー理論の両方でよく知られているので、質問がない限り参照しません。

— コーディ
ソース

計算の概念はモナドであると言っていますか？ほとんどすべてがモナドとして表現できます。

— マーティンバーガー

大したことではありませんが、私は同意しますが、元の要求に対する回答を提供します。

— コディ

カテゴリ理論とパーサー—参照が必要