タグ付けされた質問 「word」

自然言語の人間による処理に関する問題。タスクには、フリーテキストの解釈、スペルや文法の修正、発音の理解などが含まれます。

12
最も「ユニークな」単語を見つける
選択した言語を使用して、テキスト内で一意の文字の数が最も多い単語を識別することができる最短の機能/スクリプト/プログラムを作成します。 一意の文字には、UTF-8エンコーディングを使用した任意の個別の文字を含める必要があります。 同じ文字の大文字と小文字のバージョンは異なり、区別されます。 'a' != 'A' 単語は空白文字で区切られます。 「文字」は、単一のユニコード文字で表すことができる記号です。 テキストドキュメントはコードで読み込む必要があります。テキストのプリロード/ハードコーディングは許可されていません。 出力は単語であり、その後に一意の文字の数が続きます。 llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch - 18 2つの値を区切る文字が少なくとも1つある限り、2つの値の間の区切り文字/間隔は任意です。 最高のカウントを持つ複数の単語が存在する場合、そのカウントのすべての単語を1行の改行で区切って出力します。 超謝辞-16 偽板状枝-16 これはコードゴルフなので、最短のコードが勝ちます。 English.SEに関するこの回答は、私にこの挑戦を生み出すきっかけとなりました。この例では単語リストのみを使用していますが、テキストはすべて処理できる必要があります。
12 code-golf  word 

9
単語を同じスコアの部分に分割する
A = 1、B = 2 ... Z = 26で、単語の値がこれらの文字値の合計であるとすると、いくつかの単語を2つの部分に分割して、それらの値を等しくすることができます。 たとえば、 "wordsplit"は次のように2つの部分に分割できます:ordslwpit。o+ r + d + s + l = w + p + i + tだからです。 これは私のコンピューティングの先生から私たちに与えられた挑戦でした-それは明らかに古いLionhead Studiosの挑戦です。私はそれをPythonで解決しました。まもなく私の回答を投稿します。 課題:等しいスコアを持つすべての可能な分割をリストできる最短のプログラム。文字のグループごとに1つだけリストする必要があることに注意してください。たとえば、ordsl wpitはrdosl wtipと同じです。単語の中で来る順にリストする方が簡単です。 ボーナス: 両方の単語が有効な英語の単語(または文字のいくつかの順列)であるペアを強調表示する場合は、何らかの単語リストを使用します。(これは、各メソッドまたは他のメソッドの隣にアスタリスクを配置することで実行できますが、明確にしてください。) 重複を削除するオプションを追加します(これはデフォルトではありません)。 3つ、4つ、またはn方向の分割など、3つ以上の分割をサポートします。
9 code-golf  word 

5
単語または近い単語?
文字列(またはあなたの言語で同等のもの)を指定するプログラムまたは関数を記述し、文字列が単語かどうかを判断し、真または偽の値を出力します。 (これは単語でもありますか?の重複ではありませんか?間違った単語は非常に異なる方法で生成され、これはまったく異なる課題になると思います) 単語はすべて小文字で、5〜10文字で、アポストロフィはありません。 正しい単語は、SCOWL英語単語リスト(サイズ50)のランダムに選択されたサブセットです。 不適切な単語は、スワッピングと置換の2つの方法で生成されます。 「スワッピング」単語は、ランダムに選択された(実際の)単語の文字に変更されたフィッシャーイェーツのシャッフルを使用して生成されます。毎回文字を交換する代わりに、文字を交換する場合としない場合があります(確率が異なるため、一部の単語は他の単語よりも現実的です)。新しい単語が既存の単語と一致する場合、結果は破棄され、別の単語が生成されます。 「置換」単語は、同様の方法を使用して生成されますが、文字を別の文字と交換する代わりに、各文字が別のランダムな文字に置き換えられる可能性があります。 各メソッドは、偽の単語の50%を生成するために使用されます。 得点 関数は150バイト未満でなければなりません。スコアリングは次のように決定されます。 percentage of answers correct + ((150 - length of program) / 10) ルール これは多数のテストケース(各ワードリストは1000ワード)を扱うため、自動テストプログラムで問題ありません。自動テスターはプログラムの長さにはカウントされません。ただし、他のユーザーがテストできるように投稿する必要があります。 抜け穴はありません。 スペル/辞書関連のビルトインはありません。 資源 単語のリスト: http : //pastebin.com/Leb6rUvt 単語ではないリスト(更新済み):http : //pastebin.com/rEyWdV7S その他のリソース(SCOWLワードリストとランダムワードの生成に使用されるコード):https ://www.dropbox.com/sh/46k13ekm0zvm19z/AAAFL25Z8ogLvXWTDmRwVdiGa?dl=0

16
文字の繰り返しが最も多い単語
最近、スタックオーバーフローに関する質問がありました。OPは、文字の繰り返しが最も多い文字列内の単語を検索する関数を作成しようとしました。もちろん、数秒で1つ書くのは難しくありません。私は楽しみのために、できるだけ短い時間でJavascriptで1つ作成しました。しかし、私はコードゴルフの専門家ではないので、この単純なプログラムはどれだけ短くできるのでしょうか。 チャレンジ 一連の単語を取り込んで、最も多く繰り返される1文字の単語を返すか印刷するプログラムまたは関数を記述します。 ルール: 繰り返し1文字が最も多い単語を選択します(下の例を参照) 単語に繰り返し文字がない場合は、-1を返します。 2つの単語の繰り返し文字の最大数が同じである場合は、文字列の先頭に近い方の単語を選択します。 バイトでの最短の提出が優先されます。 入力 スペースで区切られた1つ以上の単語で構成される文字列を入力として受け取ります。入力は、STDIN(または最も近い代替手段)、コマンドラインパラメーター、または関数の引数から取得できます。 出力 出力をSTDOUTに出力して返します。 例 文字列を考えますaaabbb cccc。これには2つの単語が含まれています:aaabbbとcccc。ワードはaaabbb3持ちa'sおよび3 b' Sを、そしてcccc4有しcさん。したがって、で繰り返される文字の最大数aaabbbは3で、最大ccccは4です。単一の文字が繰り返される最大数の単語を選択するので、の出力はにaaabbb ccccなりますcccc。 その他のテストケース: Today, is the greatest day ever! --> greatest This is a great day --> -1 aaabbb cccc --> cccc
8 code-golf  word 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.