タグ付けされた質問 「natural-language」

自然言語の人間による処理に関する問題。タスクには、フリーテキストの解釈、スペルや文法の修正、発音の理解などが含まれます。

5
作家は男性ですか、女性ですか。
このようなWebサイトの問題の1つは、男性と話しているのか女性なのかわからないことがよくあることです。ただし、テキストの作者の性別を判別するために使用できる簡単なNLP手法を考え出しました。 理論 英語で使用されている文字の約38.1%が母音[a、e、i、o、u]です(以下の参考文献を参照してくださいy。この場合は母音ではありません)。したがって、母音が40%以上の単語は女性の単語として定義し、母音が40%未満の単語は男性の単語として定義します。 この定義の他に、単語の男らしさや女性らしさを見つけることもできます。してみましょうCは言葉で子音の数であり、Vは母音の数であります: 単語が女性である場合、それは女性らしさです1.5*V/(C+1)。 単語が男性的である場合、それは男性らしさですC/(1.5*V+1)。 たとえば、単語catchは男性です。その男らしさは4/(1.5*1+1) = 1.6。言葉phoneは女性的です。その女性らしさは1.5*2/(3+1) = .75。 アルゴリズム テキストの一部の作家の性別を把握する、我々はすべての男性的な単語(Σの男らしさの合計取るM)、およびすべての女性のワード(Σの女性らしさの合計Fを)。Σ場合はM >Σ F、私たちは、作家が男性であることを決定しました。それ以外の場合、著者は女性であると判断しました。 信頼レベル 最後に、信頼水準が必要です。ライターが女性であると判断した場合、信頼度はです。ライターが男性であると判断した場合、信頼度はです。2*ΣF/(ΣF+ΣM)-12*ΣM/(ΣF+ΣM)-1 入力 入力は句読点を含む英語のテキストです。単語はすべてスペースで区切られます(改行や余分なスペースを気にする必要はありません)。一部の単語には文字以外の文字が含まれているため、無視する必要があります(「You're」など)。文字以外の単語(「5」や「!!!」など)に遭遇した場合は、無視してください。すべての入力には、少なくとも1つの使用可能な単語が含まれます。 出力 ライターの性別に応じてMまたはFを出力し、その後に信頼度を出力する必要があります。 例 There's a snake in my boot. 性別+各単語の男性性/女性性: [M1.0,F1.5,F.75,F.75,M2.0,F1.0] Σ M = 3.0、Σ F = 4.0 CL:2*4.0/(4.0+3.0)-1= .143 出力: F .143 Frankly, I don't give a ^$*. [M2.4,F1.5,M1.2,F1.0,F1.5]、Σ M …

11
言葉への手紙の流れ
文字のみを含む文字列(大文字と小文字を区別しない)が与えられた場合、以下の分布を使用して、ランダムな長さの単語に分割します。ただし、有効な長さ(1〜10)の最後の単語は例外です。出力は、スペースで区切られた文字列("test te tests")、文字列の配列(["test","te","tests"])、またはその他の同様の出力形式として、これらの単語です。 語長分布 Word Length - Fractional Chance / 72 - Rounded Percentage 1 - 2 / 72 - 2.78% 2 - 14 / 72 - 19.44% 3 - 16 / 72 - 22.22% 4 - 12 / 72 - 16.67% 5 - 8 / 72 - 11.11% 6 …

8
逆ギリシャ変換ゴルフ
前書き ギリシャ数字をアラビア数字に変換する関数を作成する必要があります。入力は、より小さい1000およびより大きいギリシャ数字になり0ます。これは私の以前の課題の逆です。 アルゴリズム 手紙に分割入力(例:ΡΚΓ- > Ρ、Κ、Γ) (例えば、各文字を取り、文字への変更は、文字記号のために、下の表で見つかりましたΡΚΓ- > Ρ、Κ、Γ- > 100、20、3)。 追加(例えばΡΚΓ- > Ρ、Κ、Γ- > 100、20、3- > 123) 仕様書 組み込みの数体系変換なし 入力は例のように大文字になります。 出力はベース10でなければなりません。 ΡΡΡΡ決して起こりません。になりますΥ。 テストケース ΡΚΓ -> 123 Η -> 8 ΨΟΖ -> 777 Ρ -> 100 ΧϜ -> 606 ΡϘ -> 190 ΜΒ -> 42 Ν -> 50 テーブル Α …

10
ギリシャ変換ゴルフ
前書き アラビア数字をギリシャ数字に変換する関数を作成する必要があります。入力はより小さい1000およびより大きい整数になり0ます。 アルゴリズム 桁に分割数(例えば123- > 1、2、3) 各桁を取り、文字に変更し、文字記号や文字の名前のために、下の表で見られる(例えば123- > 1、2、3- > ΡΚΓまたはRhoKappaGamma)。 仕様書 組み込みの数体系変換なし 例のように、結果は大文字にする必要があります。 入力はベース10になります。 テストケース 123 -> RhoKappaGamma or ΡΚΓ 8 -> Eta or Η 777 -> PsiOmicronZeta or ΨΟΖ 100 -> Rho or Ρ 606 -> ChiDiGamma or ΧϜ テーブル Α = 1 = Alpha = 913 UTF-8 …

8
スペイン語の動詞の活用
説明 ほら!スペイン語をとらないあなたのために、動詞は行動をする人に基づいて活用されます。これがチャートです: English Spanish I Yo You Tú He Él She Ella You (formal) Usted We all Nosotros You all Vosotros They (masculine, plural) Ellos They (feminine, plural) Ellas You (plural) Ustedes スペインでは、すべての動詞の末尾ar、erまたはir。次に、別の役立つグラフを示します。 Ar Er Ir Yo o o o Tú as es es Él a e e Ella a …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.