部分的なランキングのリストをグローバルランキングに変換する


13

私は次のような問題に取り組んでいます。私はたくさんのユーザーとN本を持っています。各ユーザーは、たとえばBook 1> Book 40> Book 25のように、読んだすべての本(N本のサブセットである可能性が高い)の順序付けられたランキングを作成します。

ここで、これらの個々のユーザーのランキングを、すべての本の単一の順序付けされたランキングに変えたいと思います。

試みる良いまたは標準的なアプローチはありますか?これまでのところ、ブラッドリー・テリーのモデルをペアワイズ比較に適用することを考えていますが、他に何かあるのか疑問に思っています。


2
ユーザーが(何らかの理由で)同様の本を読んでいない限り、スパース性に関する多くの問題に遭遇すると思います。しかし、n人が与えられ、ほとんどの人が比較的少ない本を読むことを考えると、大部分のペアでは比較を行う人は1人だけになります。(中央値は1人あたり年間6でした。ピュー
ピーターフロム-復職モニカを

2
(+1)raegtin、あなたは素敵で興味深い質問をします。私はBTモデルが好きですが、ここでは少し強制されているようです。共同フィルタリングの文献に精通していますか?それは同じ問題ではありませんが、いくつかの概念と技術を借りることができます。ここで未解決の質問は、そもそも本に明確で明確なランキングを与えることができると信じるべき理由です。(たとえば、2ユーザー、2冊の本のケースをどのように処理しますか?)
枢機

@Peter Flom:正しい、ほとんどのペアには比較がありません。しかし、A> BおよびB> Cであることがわかっている場合、AとCを直接比較しなくても、A> Cを推測できるため、これで問題ないことを
願ってい

@cardinal:ええ、BTモデルはここで強制されているように見えますが、私が今考えることができるのはそれだけです。私は共同フィルタリングの文献に精通していますが、類似性ではなくランキングが必要なため、ここでどのように適用されるのかわかりません。単一のグローバルランキングが必ずしも意味をなさないことは事実です(たとえば、子供向けの本と大人向けの本を比較するのは理にかなっていますか?フィクションとノンフィクションですか?)。「ベストオブ」ブックリストは常にポップアップします:)
raegtin

また、近い注文についてはあまり気にしません(たとえば、1番の本が2番よりも優れているかどうか)。下位10%または中間10%よりも優れている)。
レグチン

回答:


2

(開発よりも)使用に興味がある場合は、ランク付けシステム、rankadeを試してください。

Rankadeは無料で使いやすく、2つ以上の派with(シナリオでは本など)との一致を管理できるため、Bradley-TerryモデルやEloランキングシステムとは異なります(比較はこちら)。ユーザーの順序付けされたランキング(2つ以上の本の一致、タイを含む詳細な最終順位)を挿入すると、探しているすべての本の単一の順序付けされたランキングがられます。中毒では、rankadeは本のランキングの時間の進化、および本の対戦の統計などをチェックする機会を与えます。


1
少なくとも一般的には、アプローチとしてアルゴリズムを記述する必要があります。そして、それが完全に記述されている論文へのリンク。そうでなければ、あなたの答えは単なる広告とみなされるかもしれません。
ttnphns

1
reeと最もよく知られているランキングシステムを簡単に比較するためのリンクを追加しました。最初の声明では、(開発よりも)使用に興味がある場合は、問題の解決策として提案されています(rankadeはGUIを備えていますが、Bradley-TerryとPlackett-Luceは実装が必要です)要求されたソリューションに到達するためのパス。
トマソネリ

1

Plackett-Luceランキングモデルはこの問題に対処し、尤度関数に対して補助目的関数を使用するという意味で、期待値の最大化に似たメジャー化最大化ルーチンを使用して尤度を最大化する尤度ベースの手法です。尤度関数の反復的な単調な最大化を保証するために最適化されています。(David HunterによるPlackett-LuceランキングモデルのMMアルゴリズムを参照)。彼はコードも提供します。

> =

これはデータセットに完全に適合します。

ブック1>ブック40>ブック25

ブック40>ブック30

Book 25> Book 17> Book 11> Book 3など

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.