すべてのCFGに対するあいまいな CFG の比率はどのくらいですか?
両方のセットは無限に無限であるため、比率は明確に定義されていません。しかし、何についての漸近密度:
ここで、終端記号と非終端記号は、固定の可算セットから来ています。
文法のサイズは、文法のサイズの合理的な概念です。たとえば、
- プロダクションルール内の変数と端子の出現の総数、または
- 変数の出現回数の合計、または
- 生産ルールの総数、または
- 個別の変数の数。
(サイズの定義は回答に影響しないと想定しています。)
すべてのCFGに対するあいまいな CFG の比率はどのくらいですか?
両方のセットは無限に無限であるため、比率は明確に定義されていません。しかし、何についての漸近密度:
ここで、終端記号と非終端記号は、固定の可算セットから来ています。
文法のサイズは、文法のサイズの合理的な概念です。たとえば、
(サイズの定義は回答に影響しないと想定しています。)
回答:
問題は、正確なエンコーディングによって異なります。ただし、多くの合理的なエンコーディングでは、長さが無限大になる傾向があるため、プロダクションルール(開始シンボルと終端適切な解釈のため)の数は、1つ以上の確率で高くなります。ここで私は、文字通り意味同じターミナル。これをあいまいさだと考えると、「ほとんどの」文法があいまいになると思います。また、やのルールなど、同様の状況を少なくとも1回出現させることもできます。S a a S → S S → a
この一般的な仮説を想定すると、考えられるすべての(固定された)ルールは長さが無限大になる傾向があるため、高い確率で現れるはずであり、「ほとんどの」文法はあいまいな方法で生成することがわかります。
例として、超える文法の次のエンコーディングを考えます。文法アルファベットはの記号で構成されます。非終端記号には、少なくとも2の長さのバイナリ文字列によってインデックスが付けられます。ルールは完全なストップで区切られます。各ルールは、セミコロンで区切られた一連のバイナリ文字列です。最初のバイナリ文字列は左側の非終端記号であり、残りは(もしあれば)右側を構成します。最初のバイナリ文字列が非終端文字でない場合(つまり、、0,1)、最初の非終端文字が想定されます。開始の非終端記号は常に00です。
このエンコーディングでは、すべての文字列が文法を説明します。ランダムな文法には、高い確率で多くのコピーが含まれますおよび、特にあいまいになります。