Mahoutのアイテムベースとユーザーベースの推奨の違い


15

ユーザーベースの推奨事項とアイテムベースの推奨事項がどれだけ正確に異なるかを知りたい。

それを定義します

ユーザーベース:同様のユーザーを見つけてアイテムを推奨します。多くの場合、ユーザーの動的な性質のため、これをスケーリングするのは困難です。

アイテムベースアイテム間の類似性を計算し、推奨事項を作成します。通常、アイテムはあまり変化しないため、多くの場合、オフラインで計算できます。

しかし、2種類の推奨事項がありますが、私が理解しているのは、これらの両方が何らかのデータモデル(たとえば、1,2または1,2、.5としてitem1、item2、valueまたはuser1、user2、valueが値ではない場合)必須)そして、選択した類似度測定値とリコメンダービルトイン関数としてすべての計算を実行し、同じデータに対してユーザー/アイテムベースの推奨の両方を実行できます(これは正しい仮定ですか??)。

したがって、これら2つのタイプのアルゴリズムがどのように正確にどの側面で異なるかを知りたいと思います。

回答:


11

両方のモデルが問題なく同じデータで機能することは正しいです。両方の項目は、ユーザー項目評価のマトリックスで動作します。

ユーザーベースのアプローチでは、アルゴリズムはに類似する他のユーザーの評価を組み合わせることiにより、ユーザーuによるアイテムの評価を生成u'uます。ここで似ているということは、2人のユーザーの評価が高いピアソン相関またはコサイン類似性または類似のものであることを意味します。

アイテムベースのアプローチでは、我々はのための評価を生成iすることによってuアイテムのセットを見て、i'と類似しているiこと(私たちは、アイテムがユーザーから受信したことを評価を見ていると思い、今以外は上記と同じ意味で)u評価していますその後、による評価を組み合わせてui'ことで、予測の評価にui

アイテムベースのアプローチは、ユーザーベースのフィルタリングでスケールの課題に対処するためにAmazon(http://dl.acm.org/citation.cfm?id=642471)で発明されました。販売するものの数は、ユーザーの数よりもはるかに少ないため、アイテムとアイテムの類似性をオフラインで計算し、必要なときにアクセスできます。


21

アイテムベースのアルゴリズム

for every item i that u has no preference for yet

  for every item j that u has a preference for

    compute a similarity s between i and j

    add u's preference for j, weighted by s, to a running average

 return the top items, ranked by weighted average

ユーザーベースのアルゴリズム

for every item i that u has no preference for yet

 for every other user v that has a preference for i

   compute a similarity s between u and v

   add v's preference for i, weighted by s, to a running average

 return the top items, ranked by weighted average

アイテムベースとユーザーベース:

1)推奨者は、対処する必要のあるアイテムまたはユーザーの数に応じてスケーリングするため、各タイプが他のタイプよりも優れたパフォーマンスを発揮できるシナリオがあります

2)アイテム間の類似性の推定値は、ユーザー間の類似性よりも時間とともに収束する可能性が高い

3)収束する類似性を計算してキャッシュできるため、アイテムベースのレコメンダーにパフォーマンス上の利点を与えることができます

4)アイテムベースのレコメンダーは、ユーザーの好みのアイテムのリストから始まるため、ユーザーベースのレコメンダーが行うように、最も近いアイテムの近所は必要ありません。


公正な警告:このサイトでは、リンクは回答として受け入れられません。投票権を得る前に編集または削除することをお勧めします!
シェルドンクレガー14

1
最も可能性の高い「ユーザーベースのアルゴリズム」のタイプミスがある- 4行目は、「私のためのuの好みを追加...」で始まる必要があります
ベルナルドAflalo

私はそのタイプミスを思ういけない@BernardoAflalo、あなたはすべてのVのための好みを追加し、加重平均を取る
オズワルド
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.