私の先生は私の火星の宿題に不満でした。私はすべての規則に従いましたが、彼女は私が出力したものが意味不明であると言います...彼女が最初にそれを見たとき、彼女は非常に疑っていました。「すべての言語はZipfの法則に従わなければなりません」... Zipfの法則が何かさえ知りませんでした!
結局のところジップの法則の状態は、y軸上の各単語の頻度の対数、およびX軸上の各単語の「場所」の対数(最も一般的な= 1をプロットした場合には、二番目に多い= 2、 3番目に最も大きいcommmon = 3など)、プロットには約-1の勾配の線が表示され、約10%が与えられます。
たとえば、Moby Dickのプロットは次のとおりです。
x軸はn番目の最も一般的な単語で、y軸はn番目の最も一般的な単語の出現回数です。線の勾配は約-1.07です。
今、私たちはVenutianをカバーしています。ありがたいことに、Venutiansはラテンアルファベットを使用しています。ルールは次のとおりです。
- 各単語には少なくとも1つの母音(a、e、i、o、u)が含まれている必要があります
- 各単語には、連続して最大3つの母音を含めることができますが、連続する子音は2つまでです(子音は母音ではない任意の文字です)。
- 15文字を超える単語はありません
- オプション:単語をピリオドで区切られた3〜30語の文にグループ化します
私は火星の宿題をだましていると先生が感じているので、少なくとも30,000語の長さのエッセーを書くように割り当てられました(ヴェヌチア語)。彼女は、Zipfの法則を使用して私の作品をチェックするので、線を(上記のように)当てはめる場合、勾配は最大-0.9で-1.1以上でなければならず、少なくとも200語の語彙が必要です。同じ単語を5回以上連続して繰り返さないでください。
これはCodeGolfなので、バイト単位の最短コードが優先されます。出力をPastebinまたはテキストファイルとしてダウンロードできる別のツールに貼り付けてください。


