マッチングに利用できる教師あり学習アルゴリズムはどれですか?


7

私は非営利団体に取り組んでいます。そこでは、経験/知恵を共有したい卒業生と彼らをマッチングすることによって、潜在的な大学の応募者を支援しようとしています。現時点では、それは手動で行われています。そのため、2つのテーブルを用意します。1つは学生用で、もう1つは卒業生用です(いくつかの機能は共通しているかもしれませんが、必ずしもすべてではない場合があります)。

NameGenderHeightKathyF165TommyM182RuthF163......... NameGenderWeightMiss LucyF65Miss GeraldineF70Miss EmilyF60.........

現在、表1のメンバーと表2のメンバーを手動で照合しています。また、試合後に情報を収集します(「これは良い試合でしたか?1から10のスケールで評価してください」)。したがって、次のようになります。

Person #1Person #2Match?RuthMiss LucyNTommyMiss EmilyYKathyMiss GeraldineNRuthMiss EmilyN.........

このプロセスには学習アルゴリズムを使用したいと思います。機械学習については少し知っていますが、まだ初心者なので(詳細について学ぶ機会でもあります)、このような教師あり学習をどのように行うかについて頭を抱えることはできません。 2つのセットがあり、どちらにも複数の機能がある場合。これを行うには、どのようなマッチングアルゴリズムを使用できますか?(また、私はRで作業することを好みます)

(ちなみに、私を正しい方向に向けていただければ幸いです。読んで解いてみます。また、すでに回答済みの質問を見るのは非常にイライラします。 -これが当てはまる場合は、質問に答えずに私に知らせてください。GoogleとStackExchangeでさまざまな文字列を検索しようとしましたが、ほとんどの場合、グラフ理論に関する講義スライドは見つけられないようです。私が探しているもの(それは、それが私の頭の少し上にあるからかもしれませんが。)どうもありがとう!)


1
名前、性別、身長体重に基づいて生徒とメンターを照合する正気は成功する可能性が低く、違法である可能性があるため、機能や何かにジッターをかけていますか?問題を変更または簡略化することで、質問をするときに匿名性を高めようとする人がよくいますが、質問を変形するよりも、実際の質問に答える方がはるかに簡単です。つまり、答えがない場合は、方法がわかりません。正しく変換します。
AN6U5 2016年

文献からゲイルとシャプリーのマッチングアルゴリズムを見て、それをここで適用できるかどうかを確認してください。
Deepak Pahwa

回答:


2

この問題を推奨システムの状況として組み立てることができます。ユーザー(将来の学生)とアイテム(卒業生)がいて、ユーザーに1つのアイテムを推奨する場所。

ユーザーごとに1つのアイテムだけが必要であり、ユーザーごとの以前の一致データがないため、完全に一致するわけではありません。ただし、このアイデアをもう少し詳しく調べることができます。私はこれらのテクニックを採用問題に適用しており、ユーザーを求人にマッチングさせて成功しています。

レコメンダーシステムについて少し読んでみてください。まず、大規模なデータセットのマイニングの第9章をお勧めします。これは実際に導入されたものですが、最も一般的な手法の概要を示しています。


これを推奨システムとして扱うことを試みるための+1。問題に信号を追加するには、何らかの機能エンジニアリングと機能抽出を行う必要がある可能性が高いと私は付け加えます。
AN6U5 2016年

0

問題を2つに分けます。

  1. 特定のペアが適切に一致するかどうかを予測します。
  2. ペアを一致させます。

最初に、予測の問題について説明しましょう。ペアのマッチングは、推奨問題ではなく、教師あり学習問題として扱うべきだと思います。JoãoAlmeidaが書いたように、新入生は卒業生とこれまでの関係はありません。
卒業生でさえ、以前の関係はほとんどありません。各卒業生に、集計に基づくいくつかの機能を追加します(たとえば、過去の関係の数、過去の良い一致の比率)。

その後、「マッチ?」を使用して、過去のペアのデータセットを構築する必要があります。コンセプトとして。適切な一致ルールが存在する場合でも、それを学習できるかどうかは明確ではありません。あなたのデータセットは非常に小さいと思います。一致の確率が低い場合は、不均衡の問題がある可能性があります。AN6U5がコメントしたように、身長と体重は、学生を卒業生に一致させるにはかなり奇妙な特徴です。有用な機能があるかどうかを確認するために、機能と概念(相互情報ピアソン相関など)の関係を計算します。

2番目の質問については、ペアが適切に一致するかどうかを十分に予測できたとしても、どのペアを使用するかというアルゴリズム上の問題があります。どんな学生にもぴったりの「スーパー卒業生」を考えてみましょう。「スーパースチューデント」と一致させたくないが、他の同窓生との一致が難しいと思われる学生。幸い、使用できるマッチングアルゴリズムがあります。生徒と卒業生をノードとしてグラフを作成します。適切な一致を予測し、それに基づいて一致アルゴリズムを実行する場合は、エッジを作成します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.