特定のテキストで最もよく使用される単語のASCIIチャートを作成する[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 7年前休業。 ロックされています。この質問とトピックへの回答はロックされています。質問はトピックから外れていますが、歴史的に重要です。現在、新しい回答や相互作用を受け入れていません。 挑戦: 特定のテキストで最も一般的に使用される単語のASCIIチャートを作成します。 ルール: a-zおよびA-Z(アルファベット文字)のみを単語の一部として受け入れます。 大文字と小文字を区別しません(She==ここsheでは目的)。 次の単語は無視してください(かなり自由自在です)。 the, and, of, to, a, i, it, in, or, is 明確化:考慮don't:これは、2つの異なる範囲の言葉」として取られるだろうa-zとA-Z(:donとt)。 必要に応じて(正式に仕様を変更するのは遅すぎます)、1文字の「単語」をすべて削除することもできます(これにより、無視リストも短くなる可能性があります)。 与えられたものを解析しtext(コマンドライン引数で指定されたファイルまたはパイプで読み込まれたファイルを読み取り、presume us-ascii)word frequency chart、次の特性を持つを構築します。 最も頻度の高い22の単語(頻度の降順)のグラフを表示します(以下の例も参照)。 バーwidthは、単語の出現回数(頻度)を(比例的に)表します。スペースを1つ追加して、単語を印刷します。 これらのバー(およびスペース-ワード-スペース)が常にフィットすることを確認してください:bar+ [space]+ word+ [space]は常に<= 80文字でなければなりません(可能な異なるバーとワードの長さを考慮に入れてください:例:2番目に最も一般的なワードはそれよりずっと長い可能性があります最初の頻度はそれほど変わらない)。これらの制約内でバーの幅を最大化し、バーを適切にスケーリングします(バーが表す頻度に従って)。 例: 例のテキストはここにあります(ルイス・キャロルによる不思議の国のアリスの冒険)。 この特定のテキストは、次のチャートをもたらします: _________________________________________________________________________ | _________________________________________________________________________ | 彼女 | _______________________________________________________________ | 君は | ____________________________________________________________ | 前記 | ____________________________________________________ …