人の名前を性別にマッピングするための優れたライブラリーを知っている人はいますか?[閉まっている]


90

自分の名前やニックネームに基づいて、男性か女性かを推測できるライブラリまたはデータベースを探しています。何かのようなもの

john => "M",
mary => "F",
alex => "A", #ambiguous

英語以外の名前(日本語、インドなど)をサポートするものを探しています。

「性別や性別を想定して人を怒らせる」という別の答えを得る前に、はっきり言っておきますが、私のアプリケーションは誰とも相互作用しません。それはとにかくメールを送信したり、誰かに連絡したりすることはありません。質問するユーザーはいません。多くの場合、問題の人は死亡しており、私が持っている唯一の情報は、名前、生年月日、および死亡日です。私が個人の性別を知りたい理由は、出力の文法をより良くし、後者の可能性のある検索を支援するためです。


33
うわー...「どうすればいいですか」という質問ではなく、「どうすればいいですか」という質問に誰もが答えているようです。驚くことではなく、ただ面白い。
2009年

9
これは素晴らしい質問だと思います。ウェブサイトにアクセスして、90%の確率で性別がわかると、メリットがわかります。テレビでも同じことができたらいいのにと思います。私は最近のフライトでキングオブザヒルの再放送を見ていました。3分ごとに「パーソナルマッサージャー」の広告がありました。
ウリ

6
@mPわあ、推測のセックスから文法を人種のプロファイリングに適したものにする方法。
Chas。オーエンス

2
茶道、それは人々があなたに与えることを望んでいないことではありません。それは道徳的なことのために、それは最初は意味がないので、あなたは失敗の解決策を求めています。また、あなたは英語の名前以外に言及し、異文化の参照では、それはさらに複雑になります。私にとって、それはノーゴーです。
zalew 2009年

2
名前が男性か女性かはどのようにしてわかりますか?アレックスはアレクサンダー(男性)またはアレクサンドラ(女性)の略である可能性があります。男性のミカと女性のミカを知っています。そして、外国の名前はどうですか?
Gabe

回答:


66

名前の性別は、一般的なケースではプログラムから推測できないものです。名前データベースが必要です。これは米国国勢調査局の無料の名前データベースです。

編集:2010年の名前のリンクは無効ですが、コメントには作業用のリンクとライブラリがあります。


2
これは素晴らしい。質問者が必要とするものだけのようです。あいまいな名前の場合、男性の頻度と女性の頻度に基づいて、性別を「推測」できます。
stalepretzel 2009年

1
私は国勢調査データを使用してこのためのライブラリを構築し、それはうまくいきます!潜在的なアプリケーション:分析、IVR音声の性別の選択。
Chris McCall

9
ここに名前-> Python dictとしての国勢調査データからの性別:raw.github.com/Bemmu/gender-from-name/master/gender.py
Bemmu

3
元のリンクは死んでいますが、国勢調査はまだリストを維持しています。1990年代に、バージョン固有の(私はなぜ知らない)ここにある:census.gov/genealogy/www/data/1990surnames/names_files.html
Chipmonkey

2
出生年別の性別を含む22 MBの米国の赤ちゃんの名前:ssa.gov/oact/babynames/limits.html (2015年7月に有効なリンク)
Dylan Hogg

70

gender.cは、良い仕事をするオープンソースの Cプログラムです。世界中の44568人の名のデータが付属しています。適切なドキュメントとファイル形式の説明(基本的にプレーンテキスト)があるため、独自のアプリケーションから読み取るのは難しくありません。

これは著者が言うことです:

データの品質について一言

名の辞書は細心の注意を払って作成されています。たとえば、この辞書のトルコ語、インド語、韓国語の名前はすべて、複数のネイティブスピーカーによって個別に分類されています。また、現在見つけられる名前だけをリストするように特別な注意を払いました。

これからの教訓は?

変更は非常に慎重に行う必要があります(また、検索アルゴリズムで必要な並べ替えを遵守する必要があります)。たとえば、ドイツでは「サシャ」が男の子の名前であることを知っているため、著者は英語の「サーシャ」を女の子の名前であると想定したことはありません。「Jan」はドイツでは男の子の名前であることを知っていたので、「Janet」の英語の短縮形だとは思いもしませんでした。別の例として、「Esra」という名前があります。これはドイツでは男の子の名前ですが、トルコでは女の子の名前です。

プログラムは、名前が男性であるか女性であるかの確率を計算します。入力としての名前だけで、または名前と原産国を使用してこれを行うことができます。

ドイツのコンピュータ雑誌c't 40 000 Namenのウェブサイトからダウンロードできます 。記事はドイツ語ですが、心配しないでください。すべてのドキュメントは英語です。記事に興味がなければ、ここに直接FTPリンク0717-182.zipがあります。zipファイルには、ソースコード、Windows実行可能ファイル、データベース、およびドキュメントが含まれています。


これは素晴らしいです、ありがとう。
Dale Athanasias

Pythonポートについては、こちらをご覧ください-pypi.python.org/pypi/SexMachine
philshem

33

「そうです、 『スー』という名前の少年にとって人生は容易ではありません。」

...では、なぜそれを難し​​くするのですか?性別を知りたい場合は、質問してください。それ以外の場合は、心配しないでください。


15
@Chas:80%の確率で正しく管理できたとしても、ソフトウェアを使用している10人に2人は苛立ちます。あまり良くない...私は動機を理解していますが、あなたはメッセージを性別に中立なものに変えるようにメッセージを書き直す方が良いでしょう。
Shog9 2009年

2
誰か他の人がSNLの「Pat」を覚えているだろうか。
エリクソン2009年

8
これをもう一度読んで、私はひどい説教を脱いでいます...あなたのアイデアを捨てるつもりはありません、それは面白いものだと思います...しかし、非常に危険でもあります。私は以前テレマーケティング担当者として働いていましたが、知っている名前がいくつあっても、声の認識がどれほど上手くなっても、たまに間違って推測してしまうこともあり、決して楽しいことではありません。ですから、それを正しく管理するための大きな大きな見返りがない限り、これは避けたいことです。
Shog9 2009年

3
私はShog9の助言を受けます。アプリケーションが英語以外の言語である場合を除き、性別に依存しない代名詞を使用する方が簡単な場合があります(例:
Calvin

11
私のガールフレンドの名前はケヴァンです。彼女は彼女の名前から彼女の性別を誤って推測する十分な人々を得る、彼女はまたそれを行うコンピュータを必要としない。注意すべきことは、コンピュータの推測に基づいて誰かの性別を示すデータベースエントリを作成することです。それを見る人は、それが本人自身によって提供されたものであると想定し、その想定が間違っていることが判明すると本当に混乱します(名前だけに基づいて多少混乱するのではなく)。
ブライアンキャンベル、

29

私は、名に基づいて性別を確率的に推測する無料のAPIを作成しました。上記のアプローチのいずれかを使用する代わりに、ソーシャルネットワークからのプロファイルの巨大なデータセットを使用して、確実性係数と共に確率的推測を提供します。また、国または言語IDによるオプションのフィルタリングもサポートします。より多くのプロファイルがデータセットに追加されるので、それは日ごとに良くなっています。

http://genderize.ioで無料で使用できます

ONEあなたが考慮すべき事は、命名規則はこれに大きく依存しているように、考慮に人口統計をとるツールを使用しています。

http://api.genderize.io?name=kim
{"name":"kim","gender":"female","probability":"0.89","count":1440}

http://api.genderize.io?name=kim&country_id=dk
{"name":"kim","gender":"male","probability":"0.95","count":44,"country_id":"dk"}

2
コード拡張- genderize.io/#extensions
philshem

22

以下は、動作しない可能性があり、ライセンスの条件に違反しないとまとめて動作しない可能性が高い2つの奇妙なアプローチです。

  1. Facebook API(私は事実上何も知らない、それも不可能かもしれない)を使用して、2つの検索を実行します。2つの数値を使用して、性別の確率を決定します。

  2. より緩やかですがよりスケーラブルです。GoogleAPIを使用して、名前と性別固有の代名詞を検索し、数値を比較します。たとえば、「Richard his」(フレーズではなく)を検索した結果は592,000,000ですが、「Richard her」は179,000,000です。


ソフトウェアが名からセックスのようなものを推測しようとするという一般的なコンセンサスは別として、これは元の質問に対する本当にクールなアルゴリズムの答えです。よくやった。
peSHIr 2009年

いい案。ローカライズするために、特定の国の言語でいくつかの単語を投入することもできます。
Nosredna 2009年

良い点、Nosrenda ...もちろん、Googleでは検索結果を言語コードでフィルタリングすることもできます。HTTPリクエストからユーザーの優先言語を盗むこともできます。彼らのブラウザの言語設定は彼らの名前の民族性と一致するかもしれないし一致しないかもしれませんが、これはとにかくあいまいなテクニックです。
richardtallent 2009年

2
私はGoogleが優越主義者であることを発見しました。より多くの男性がGoogleにいるため、女性より男性の方がより多くの結果が返されます。Facebook APIはおそらくもっと代表的なものです。
Chris McCall

6

あなた述べた制約を考えると、あなたの最良のオプションは、ためにしている書き込み、あなたは何でも再フレーズにあるジェンダーニュートラルあなたがない限り知っている彼らは、各インスタンスに呼ばれるようにしたいものを男女。

英語で書く場合は、単数形の「they」は文法的には、ジェンダーに中立な3人称単数代名詞として適切であることを覚えておいてください。

良い例は、この質問のタイトルです。現在のとおり:

    …人の名前を性別にマッピングする?

次のように書けば、それほど厄介ではありません。

    …人の名前を性別にマッピングする?

文法的には「完全に」ではありません。ウィキペディアの記事でさえ、一部の作家が一般的な「彼」に不快感を抱いた結果として、特に現代の文脈で使用されたことを認めています。私はこれを行うライターには大きな問題はありません(ただし、性別-中立性が本当に重要な場合は、「1」のような代名詞を使用できるように構成を言い換えることを好みます)が、それをそれと呼んでみましょう。
ベンコリンズ

私たちはどちらも正しいと主張します。すべての文法、特に英語の文法には重大な問題があります。しかし、英語のあらゆるものに実際に適用される「完全な文法」の定義もここで適用されると思います。単数形の「彼ら」は完全に文法的であるか、英語では何もない:-)
bignose 2009年

注目すべきことに、Grammar Girl(作者Mignon Fogarty)は、しばらくの間、単数形の "they"の受け入れに傾倒してきました。 grammar.quickanddirtytips.com/...
カレン・ロペス

4

また、ユーザーが男性または女性である必要があると想定することもお勧めできません。少数ではあるがかなりの数の「インターセックス」の人々がいます。そのほとんどは、チェックするボックスがないことに心からうんざりしています
。こんなに長い歴史があるとは知りませんでした。


4

これはサービスではなく、データベースを備えた小さなアプリです。http
//www.codeproject.com/KB/cpp/genderizer.aspx

そしてこのツールはドイツ語です:http :
//www.faq-o-matic.net/2011/06/01/zu-einem-vornamen-das-geschlecht-finden/

そして、VBのもう1つ:http :
//www.vbarchiv.net/tipps/tipp_1925-geschlecht-anhand-des-vornamens-ermitteln.html

「2011年に最もよく使われる名」リストと組み合わせれば、きちんとしたものを作成できるはずです。


4

PythonパッケージのSexMachineがそれを行います。男性、女性、またはユニセックスの場合、ファーストネームを指定すると返されます。これは、Jorg Michaelによるgender.cプログラムからのデータに依存しています。


3

それを自動化しようとすることから得られる唯一のものは、不幸なユーザーの束です。その国勢調査データから:

ジェームス、ジョン、ロバート、マイケル、ウィリアム、デビッド、リチャード、チャールズ、ジョセフ、トーマス、クリストファー、ダニエル、ポール、マーク、ドナルド、ジョージ、ケネス、スティーブン、エドワード、ブライアン、ロナルド、マサチューセッツ、アンソニーゲイリー、ティモシー、ホセ、ラリー、ジェフリー、フランク、スコット、エリック、ステファン、アンドリュー、レイモンド、グレゴリー、ジョシュア、ジェリー、デニス、ウォルター、パトリック、ピーター、ハロルド、ヘンリー、カール、アーサー、ライアン、ジョー、ジョージャック、アルバート、ジャスティン、テリー、ジェラルド、キース、サムエル、ウィリー、ローレンス、ロイ、ブランドン、アダム、フレッド、ビリー、ルイス、ジェレミー、アーロン、ランディ、ユージーン、カルロス、ラッセル、ボビー、ビクター、マーティン、ジェスショーン、クラレンス、ショーン、クリス、ジョニー、ジミー、アントニオ、トニー、ルイス、マイク、デール、カーティス、ノーマン、アレン、グレン、トラビス、リー、メルビン、カイル、フランシス、イエス、レイ、ジョエル、エディ、トロイ、 ALEXANDER、MARIO、FRANCISCO、MICHEAL、OSCAR、JAY、ALEX、JON、RONNIE、TOMMY、LEON、LEO、WESLEY、DEAN、DAN、LEWIS、COREY、MAURICE、VERNON、ROBERTO、CLYDE、SHANE、SAM、LESTER、CHARLIE、TYLER、GENE、BRETT、ANGEL、LESLIE、CECIL、ANDRE、ELMER、GABRIEL、MITCHELL、ADRIAN、KARL、CORY、CLAUDE、JAMIE、JESSEクリスチャン、ロニー、コーディ、ジュリオ、ケリー、ジミー、ジョーダン、ジェイミー、キャシー、ジョニー、シドニー、ジュリアン、ダリル、ヴァージル、マーシャル、ペリー、マリオン、トレイシー、レン、フレディ、オースティン、ジャッキー、ジョイナ、エヴァンドニー、シャノン、アンジェロ、ショーン、リン、キャメロン、ブレイク、ケリー、ジーン、イラ、ルディ、ベニー、ロビン、ローレン、ノエル、デヴィン、キム、グアダルーペ、キャロル、サミー、マーティ、テイラー、エリス、ダラス、ローレンスドリュー、ジョディ、フランキー、パット、メルル、テレル、ダーネル、トミー、トビー、ヴァン、コートニー、ジャン、キャリー、サントス、オーブリー、モルガン、ルイ、ステイシー、ミカ、ビリー、ローガン、デミトリウス、ロビー、ケンドール、ロイミッキー、デボン、アシュリー、キャリー、息子、マーリン、アリ、サムミー、ミッシェル、ローリー、クリス、エイブリー、アレクシス、ジェリー、ステイシー、カーメン、シェルビー、リッキー、ボビー、オリー、デニー、ディオン、オデル、メリー、コルビー、ホリス、カービー、クルス、メリル、レーン、クレオ、ブレア、ナンバーズ、クレア、バーニー、ジョーン、ドミニク、トリスタン、ジェイミー、ゲイルLAVERNE、ALVA、STEVIE、ERIN、AUGUSTINE、YOUNG、JOHNIE、ARIEL、DUSTY、LINDSEY、TRACEY、SCOTTIE、SANDY、SYDNEY、GAIL、DORIAN、LAVERN、REFUGIO、IVORY、ANDREA、SANG、DEON、CAROL、YONG、BERGトリニダード、シャーリー、マリア、チャン、ロザリオ、ダニー、フランス、タン、コニー、トリー、ルーペ、ディー、ソン、チ、クイン、ミン、テオ、ルー、チャン、バレンタイン、ジェイミー、ホイットニー、ソル、チョン、パリ、オーサ、レイシー、ドン、アントニア、ケリー、キャロル、シェイン、ヴァル、ジュード、ブリット、ホン、レヒ、ゲイル、ジェイ、ニッキー、レスリー、マン、ケイシー、ジュエル、パトリシア、ローレン、エリシャ、ミハエル、リンゼイ、ジュエルクレア、バーニー、ジョーン、ドミニク、トリスタン、ジェームズ、ゲイル、ラヴァーン、アルバ、スティーヴィー、エリン、オーガスティン、ヤング、ジョーニー、アリエル、ダストリー、リンジー、トレイシー、スコッチー、サンディー、シドニー、ゲイル、ドリアン、ラグーンアイボリー、アンドレア、サン、デオン、キャロル、ヨン、ベリー、トリニダード、シャーリー、マリア、チャン、ロザリオ、ダニー、フランス、タン、コニー、トーリー、ルーペ、ディー、サン、チ、クイン、ミン、テオ、ルー、チャン、バレンタイン、ジェイミー、ホイットニー、ソル、チョン、パリ、オーサ、レイシー、ドン、アントニア、ケリー、キャロル、シェイン、ヴァル、ジュード、ブリット、ホン、レイグ、ゲイル、ジェイ、ニッキー、レスリー、マン、ケーシー、ジュエル、パトリシア、ローレン、エリシャ、ミハル、リンゼイ、ジュエルクレア、バーニー、ジョーン、ドミニク、トリスタン、ジェーム、ゲール、ラヴァーン、アルバ、スティーヴィー、エリン、オーガスティン、ヤング、ジョーニー、アリエル、ダストリー、リンジー、トレーシー、スコッティー、サンディー、シドニー、ゲイル、ドリアン、ラグーンアイボリー、アンドレア、サン、デオン、キャロル、ヨーン、ベリー、トリニダード、シャーリー、マリア、チャン、ロザリオ、ダニー、フランス、タン、コニー、トーリー、ルーペ、ディー、サン、チ、クイン、ミン、テオ、ルー、チャン、バレンタイン、ジェイミー、ホイットニー、ソル、チョン、パリ、オーサ、レイシー、ドン、アントニア、ケリー、キャロル、シェイン、ヴァル、ジュード、ブリット、ホン、レイグ、ゲイル、ジェイ、ニッキー、レスリー、マン、ケーシー、ジュエル、パトリシア、ローレン、エリシャ、ミハル、リンゼイ、ジュエルマリア、チャン、ロサリオ、ダニー、フランス、タン、コニー、トリー、ルーペ、ディー、ソン、チ、クイン、ミン、テオ、ルー、チャン、バレンタイン、ジェイミー、ホイットニー、ソル、チョン、パリ、オーサ、レイシー、ドン、アントニア、ケリー、キャロル、シェイン、ヴァル、ジュード、ブリット、ホン、リーグ、ゲイル、ジェイ、ニッキー、レスリー、マン、ケイシー、ジュエル、パトリシア、ローレン、エリシャ、ミシェル、リンゼイ、ジュエルマリア、チャン、ロサリオ、ダニー、フランス、タン、コニー、トリー、ルーペ、ディー、ソン、チ、クイン、ミン、テオ、ルー、チャン、バレンタイン、ジェイミー、ホイットニー、ソル、チョン、パリ、オーサ、レイシー、ドン、アントニア、ケリー、キャロル、シェイン、ヴァル、ジュード、ブリット、ホン、リーグ、ゲイル、ジェイ、ニッキー、レスリー、マン、ケイシー、ジュエル、パトリシア、ローレン、エリシャ、ミシェル、リンゼイ、ジュエル

男性と女性の両方のために働くすべての名前です。女の子の名前がロバートであり、あなたのソフトウェアを含むすべての人が彼女を男性と呼び続けていると、彼女はかなり腹が立つでしょう。


25
マークと呼ばれる女の子がいるとしましょう(自由に指摘してください)。私が彼女だったとしたら、チャスのソフトウェアではなく両親に腹を立てるだろう...
ダーコZ

6
ソフトウェアが彼女を男性とは呼ばず、UIの「男性的な」バージョンを提示する場合はどうでしょうか。それとも彼女は、マーケティング資料を開発するために使用されるデータセット全体で、男性とひとまとめにされていますか?彼女も気付かないかもしれません。
Chris McCall

これらの名前の多くについて、指定した名前のFacebookプロファイル500〜1200のデータに基づいて、100%の確実性を得ています。 api.genderize.io/?name=robert api.genderize.io/?name=andrew api.genderize.io/?name=john
Stromgren

3

データベースがおそらく最も実用的な解決策ですが、楽しみたい場合は、名前を受け取り、3つのオプション(F、M、A)のいずれかを出力するニューラルネットを作成(またはニューラルネットライブラリを使用)してみてください。 )。

他の回答によって提案されたデータベースに存在するデータセットや、他のデータを使用して、それをトレーニングできます。

このソリューションでは、以前に明確に分類されていない名前を処理したり、さまざまな言語を処理したりできます。言語(わかっている場合)をニューラルネットへの入力としても渡すことができます。

ニューラルネット(またはその他の機械学習)が分類に役立つとは言えません。


3

それは文化/地域に依存します。イタリア人は男性だけのため、アンドレアは男性のためであり、スウェーデンは女性の名前であるため、アンドレアを取ってください。ショーンは英語があいまいです。ラテン語やロシア語のように言語に偏角がある場合、最終的な文字は文法規則に従って変化します。

あいまいさのもう1つの原因は、個人名と同一の姓です。

私の意見では、一般的に解決することは不可能です。


OPが起源、出身地、国籍などの文化を示すコンパニオン変数を持っている場合、それが何であれ便利です。しかし、彼はそうではないと言ったので、集計に基づいて統計的に情報を得た推測をしなければなりません。
smci 2013年

3

このアイデアは、ほとんどの言語では明らかに機能しません。

ただし、事前に国籍を教えていただければ幸運が高まります。ほとんどのスラヴ語(ロシア語、ポーランド語、ブルガリア語など)では、-va -cha -ska(-aは一般的には女性)で終わる姓はすべて、-v -ch -shiは男性的であると考えて間違いありません。

実際、どの姓も、エンディングに応じてフェミニンで男性的な形をしています。他の国(たとえば、米国)で使用されている同じ名前でも、男性形のみが使用される場合があります。

ファーストネームについても同じことが言えます(-a -yaはフェミニンです)が、100%正確ではありません。

しかし、一般に、十分に正確なライブラリーを入手することはほとんどできません。


姓は男性的または女性的ですか?
Simon_Weaver 2012

2
@Simon_Weaver父の姓はSlavchevで、母の姓はSlavchevaです。それは実際には同じ姓のビットであり、男性と女性のスペルは異なります。これはスラブ名で一般的です。
Dimitar Slavchev 2012


2

Zディレクトリ(vettrasoft.com)にはC言語の関数があり、次のように機能します。

void func()
{
    char c = z_guess_sex_byfirstname ("Lon");
    switch(c)
    {
    case 'M': std::cout << "It's a boy!\n"; break;
    case 'F': std::cout << "It's a girl!\n"; break;
    case 'B': std::cout << "this name is for both sexes\n"; break;
    case '?': std::cout << "sex unknown sorry\n"; break;
    }
}

データベース駆動型で、テーブルには10,000以上の名前があると思いますが、zディレクトリをダウンロードしてインストールする必要があります(国、地理的ランドマーク、空港、州、市外局番、郵便番号など、他の多くの地形アイテムが含まれます)。データにアクセスするためのc ++関数およびオブジェクトとともに)。ただし、名前は非常に英語指向です。テーブルは進行中の作業であり、徐々に更新されます。


1

名前の性別マップは機能しますが、多文化の国では、推測のようなものです。一例を挙げると、ポーランドのマリアンは典型的な男性的な名前ですが、イギリスの同じ名前は女性の名前です。世界中に移住する人々の時代には、そのようなデータベースが非常に正確であるとは思えません。幸運を!


1
いいえ、ただし50%を超えている限り、名前をいつも男性的なものとして扱うのに勝ります。
Chas。オーエンス

@Chas、それでなぜその誤った二分法に固執するのですか?あなたは性別中立のオプションがあります。
bignose 09年

データベースには、女性として分類される「マリア」-「マリア」という2番目の名前を持つ2つの有名な政治があります。ただの笑い。
zalew 2009年

@JZ私は姓ではなく名について話している(または逆の文化ではその逆)。
Chas。オーエンス

@bignose、ジェンダーに中立な言語は奇妙に見えて複雑ですが、できればもっと見栄えの良いものを作りたいと思います。これは個人に伝えられない(存在する場合でも)ので、攻撃の可能性はありません。人々が良いことを知っている場合、データベースへのリンクを提供するだけでなく、なぜこれを議論するのに多くの時間を費やしているのかわかりません。 1。
Chas。オーエンス

1

一部の文化では、私のようにユニセックスな名前が付けられています。だったらどうしようか?答えは明白で単純だと思います-想定しないでください-あなたは犯罪を引き起こす可能性があります。それが必要かどうか尋ねてください、そうでなければ性別の中立性。


5
質問はすでにあなたの答えを答えました:alex => "A"、#あいまいです。質問に答えがあるかどうかにかかわらず、あなたの答えはそうではありません。
Windowsプログラマ、

私は同意しません-私のポイントは、すべての名前が潜在的にあいまいであることです。
Preet Sangha

名前がユニセックスである場合、それらはすべてAとして分類され、性別による中立を求めますが、名前が主に男性的または女性的である場合、より自然な言葉を使用できます。
Chas。オーウェンズ

私はあなたの推論が何であるかはわかりますが、私はあなたに後者のコメントを紹介します。
プリートサンガ

3
しかし、StackOverflowに「Preet」が表示された場合、それはおそらく男性です。
Nosredna 2009年

1

まあ、もう。IBM はしばらく前にそのアイデアの特許取得しました。

したがって、柔軟性のレベル(名前のリスト以外のもの)を探している場合は、(あえぎ!)ユーザーに尋ねるか、単にIBMに権利を支払う必要があります。

いずれにせよ、そのような自動検出は、性別があいまいな名前を持っている、または単に親を意味している多くの人々にとって迷惑です。彼らのためにこれをもっと難しくしないようにしましょう。


3
IBMは、名前に基づいてアバターを選択する特許を取得しているようです。幸い、これは私がこれを使用するつもりのアプリケーションの1つではないので、私は彼らの特許を侵害していません。ユーザーへの質問については、名前のリストではなく、ユーザーに質問することを前提としています。私は繰り返し、ユーザー、インタラクション、名前が属している人々へのメッセージはないと述べました。
Chas。オーエンス

1

それは無料ではありませんが、これは私が以前に使用したことがある素晴らしいライブラリです。

NetGender for .NETを使用すると、名前検証、解析、性別判定をカスタムアプリケーションにすばやく簡単に組み込むことができます。特定のフィールドに有効な個人または会社が含まれているかどうかを正確に確認します。NetGenderは、民族的に多様な100,000以上の名前辞書を8,000以上の会社名辞書と組み合わせて使用​​して、正確な性別判定を確実にします。

http://www.softwarecompany.com/dotnet/netgender.htm


1

あなたが生年月日を持っていると言うのは興味深いです。それが役立ちます。名前の人気の歴史のデータベースを見てきました。

映画「スプラッシュ」(1984年)では、明らかに「マディソン」は女の子の名前ではないため、ダリルハンナのキャラクターがマディソンアベニューの道路標識から「マディソン」という名前を選んだのはおかしかったです。

24年後、マディソンは女の子の赤ちゃんの4番目に人気のある名前です!


政府の歴史に名前を付けます。(過去100年間のメアリーの悲しい衰退をチェックしてください。)


私が子供としてホワイトハウスに手紙を書いたとき、リチャードニクソン(またはおそらく秘書)が「ミスレットアンダーソン」に宛てた歴史的な場所の写真をいくつか返信してくれました。「ミス・レット?」それも意味がありません!クラークゲーブルのレット(口ひげのある、風と共に去りぬ!)とビビアンリーのスカーレットの違いを本当に伝えないのですか?「リチャード・ニクソンでさえ魂を得ている」というニール・ヤングの保証にもかかわらず、私は彼を決して許しません。


良い点、日付は間違いなくここに登場します。
Chas。オーエンス

1

許容できるレベルの精度でこのようなサービスが存在することはないと確信しています。これは私が克服できないと思う問題です:

  • 男性と女性の両方を表す名前はたくさんあります。
  • 1つの国だけを考えても、この世界にはさまざまな名前がたくさんあります。
  • ジョニー・キャッシュによって雄弁に提起された「少年はスーという名前の」問題があります:-)

2
優れたデータベースは、パーセンテージ男性/地域別両性具有名の女性を持っているでしょうし、サンプルなどを撮影したとき

日本語などの言語はどうですか?私は日本語を学んでいるので間違っているかもしれませんが、名前<->の漢字は単純な関係ではありません。
10


1

私のpython性別検出プロジェクトをご覧ください https://github.com/muatik/genderizerをご覧ください。

それは彼らの名前やサンプルテキスト(例えばつぶやき)を見ている著者の性別を検出しようとします。

また、パフォーマンスのためにmemcachedのmongodbもサポートしています。


良さそうですが、「原産国」を認識する必要がある場合は、下記のgender.cまたはgenderize.ioを参照してください
HaveAGuess

0

これは実際にはプログラミングの問題ではありません-確率表を取得することになります。

私の知る限り、蒸留形式の公共データベースはありません。これを国勢調査データから構築するか、誰かからデータを購入することができます。

たとえば、カナダの確率表を販売している人です


0

私見、個人の名前から性別を特定することは一般的に悪い考えです。多くの名前はインターセクシャルであり(良い悲しみ、これは一言?? :-)、また、ある文化では別の性別、別の文化では別の性別かもしれません。

いくつかの愚かな例、頭に浮かんだほんの一例(私の世界の一部、CEから)

Vanja-ここから東の国では女性、主に男性
Alex-インターセックス(サンドラ、女性、およびサンドロ、男性の略)
Robin-西洋文化では、両方になることができます

世界の一部の地域では、人の性別は名前がどのように終わるかを見ることで決定できます。たとえば、Marija、Sandra、Ivana、Petra、Sara、Lucija、Ana-これらの女性の名前のほとんどが「ja」または「ra」で終わることがわかります。他の例もあります。

それでも、ユーザーにセックスを求めるだけの方がいいと思います。


9
「それでも、ユーザーにセックスを尋ねるだけの方がいいと思います。」-私は同意します。それはスタックオーバーフローにコメントを投稿するよりもはるかに優れています。
Windowsプログラマ、

2
UPS。Okeey、それは正しく出てこなかった:-)
Rook

編集前の方が良かった:-)
Windowsプログラマ


0

そのようなサービスは知らない。ただし、探しているデータを見つけることはできます。米国政府は、名前の蔓延とその人の性別に関するデータを公開しています。社会保障局にはそのようなページがあり、国勢調査もそうかもしれないが、私は時間をかけて見ていない。おそらく他の世界政府も同様のことをしています。


0

しかし、そのようなサービスは知らない。

  • あなたは人名の生のリストから始めるか、
  • いくつかのルールに従って性別を推測します(例-o =>男性、-ela、-a =>女性)

一部の国(ドイツなど)では、人が付けることのできる名前は法律によって制限されています-おそらく、その問題に関する出版物がいくつかあります。


0

私がやろうとしていることは、名前を取得してFacebook APIに対して検索するハックを作成することです。次に、結果のユーザーを調べて、そのうちの何人が女性か男性かを数えます。その後、パーセンテージを返すことができます。もうそんなに乗り越えられません。:)


-2

ちょうど人々に尋ねてください、そして、彼らが良いなら彼らはあなたに彼らの 'M'または 'F'を与えます、そして彼らがそうでなければ彼らに 'A'を与えます。


2
名前をマッピングしたい人とは連絡が取れません。
Chas。オーエンス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.