ランキングのための機械学習アルゴリズム


10

私は、特性に従って記述できる要素セットを持っています。したがって:Xn

xi:{ci1,ci2,,cin}xiX

ここで、は、特性による要素(数値)評価です。だから私の要素は次元空間の点として見ることができます。 i j ncijijn

私のリーディングによると、いくつかの要素からなる「トレーニングセット」を使用した場合、「ベイズ分類子」のようなアルゴリズムがあり、私のセットの要素に「はい」または「いいえ」タイプの回答を提供できます。私のセットの要素、およびアルゴリズムの予想される結果。そのデータに基づいて、アルゴリズムはトレーニングセットの一部ではなく、他の要素を取り、トレーニングセットのおかげで学習した内容に基づいて「はい」または「いいえ」の回答を提供できる必要があります。これは、期待すること(トレーニングセット)について何らかの考えを持っているが、その結果をもたらす特定のルールがわからない場合に最適です。

私のデータでしたいことは、「はい」または「いいえ」のタイプの回答を得ることではありませんが、要素内のランキングを紹介したいと思います。それらのいくつかは他より「より良い」です。ベイズフィルターの場合と同様に、私は何を期待しているのかについての一般的な考えを持っています。このようにして、MLAにフィードする要素のサブセットから取得した「トレーニングランキング」を生成できます。そのトレーニングに基づいて、私のセット全体をランク付けすることができます。

それを行うために、私は2つのアプローチを見ます:

  1. 各要素にはMLAによってスコアが与えられ、スコアに従って要素をランク付けします。
  2. MLAは、2つの要素とを取り、どちらが良いかを判断できます(ペアワイズ比較)。その比較演算を使用してクイックソートを使用します。x jxixj

注:スコアに基づいてペアワイズ関数を実装するのは簡単であり、ペアワイズ関数に基づいてスコアを生成するのは簡単です。したがって、これらは同じ結果をもたらす2つのアプローチにすぎません。

スコアリング関数またはペアワイズ比較関数を提供できるMLAの例はありますか?

編集:より多くのコンテキストを追加するために:現在、私のアイテムは、計算を行うことによって各アイテムのスコア(実数)を生成するアルゴリズムに従ってランク付けされています。生成されたランキングは非常に正確ですが、アルゴリズムを変更して、何らかの方法で調整しなければならないことがよくあります。これは、期待したとおりにランク付けされていないアイテムがはっきり見えるためです。cij

現在、私の設計プロセスは次のとおりです。

  1. 完璧なランキングがどうなるかを理解する
  2. そのような項目をランク付けするアルゴリズムを(手動で)導出しようとします
  3. 結果を観察する
  4. アルゴリズムを適合させる

私のプロセスの開始点はトレーニングデータとして使用できるものであるため、MLAについて考えました。私はおそらく現在のランクを取得することから始めて、私のニーズに応じてアイテムを交換し、それを養います。

回答:


3

多くの分類アルゴリズムは、すでに求めていることを正確に実行していますが、多くの場合、バイナリ(またはnウェイ)判断の形式でユーザーに回答を提示します。たとえば、SVMLightはサポートベクターマシン分類アルゴリズムの実装です。人々は一般的にこれを使用して、いくつかのデータセットに対してバイナリ判断を行います。ただし、内部では、アルゴリズムが署名付き信頼性判断をデータに割り当てています。これらは-1.0と1.0の間にあり、データのランク付けに使用する必要があります。


2

回帰分析が使えるようです。また、スコアがない場合は、トレーニングセットの要素にスコア(実数)を割り当てる必要があります。目標値としてランクを使用することもできますが、トレーニングサンプルのセットが少ない場合は、モデルの品質が低下します。


0

機械学習アルゴリズムに期待しすぎていると思います。コンピュータは、アイテム1だけでアイテム2よりも優れているかどうかを判断できません。機械学習アルゴリズムが実行できることは、いくつかの項目1を項目2よりも優れていると評価した例をいくつか挙げると、項目のランク付けを学習できます[1]。ただし、トレーニングデータのすべてのアイテムについて、アイテムの例とアイテム1がアイテム2より大きいかどうかの情報を提供するトレーニングデータが依然として必要です。

[1] http://www.cs.cornell.edu/people/tj/svm_light/svm_rank.html


リンクありがとうございます。また、後続のアイテムをランク付けできるように、アルゴリズムにトレーニングセットを提供する必要があることを完全に理解しています。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.