協調フィルタリング/推奨システムで非否定性が重要なのはなぜですか?


11

私が見てきたすべての最新の推奨システムでは、マトリックス因数分解に依存しているため、非負のマトリックス因数分解がユーザー映画マトリックスで実行されます。なぜ非負性が解釈可能性にとって重要であるか、および/または疎要素が必要かどうかを理解できます。しかし、たとえばnetflix賞の競争のように、予測のパフォーマンスのみに関心がある場合は、なぜ非否定性の制限を課すのでしょうか。因数分解で負の値を許可するよりも厳密に悪いように思えます。

このペーパーは、協調フィルタリングでの非負行列因数分解の使用の1つの非常に引用された例です。


1
私はレコメンダーシステムにあまり詳しくありません(おそらく、質問にいくつかのサンプルペーパーを含めることができますか?)。推論するNNMF設定のパターンが真である場合、最も可能性の高い答えは、一般化可能性を改善することです。言い換えれば、経験的に「解釈可能性/疎性」の欠如が過剰適合に関連しいる可能性があります。ただし、スパースコーディング(つまり、L1正則化/ LASSO)は、私の知る限りこれらの要件を満たすことができます。(ただし、NNMFの方が解釈性が高い可能性があります。)
GeoMatt22

回答:


14

私はレコメンダーシステムの専門家ではありませんが、私が理解している限り、この質問の前提は間違っています。

非否定性は、協調フィルタリングではそれほど重要ではありません。

Netflix賞は、BellKorチームによって2009年に受賞しました。以下は、それらのアルゴリズムを説明した論文です。BellKor2008 Solution to the Netflix Prize。見やすいように、SVDベースのアプローチを使用しています。

2008年の進捗状況の基礎は、KDD 2008のペーパーに記載されています[4]。[...]論文[4]では、3つの因子モデルの詳細を説明しています。1つ目は単純なSVDです[...] 2つ目のモデルは[...]このモデルを「非対称SVD」と呼びます。最後に、「SVD ++」という名前のより正確な因子モデル[...]

レコメンダーシステム用の同じチームマトリックス因数分解手法によるこのより一般的な記事も参照してください。彼らはSVDについて多く話しますが、NNMFについてはまったく触れません。

この人気のあるブログ投稿「Netflix Update:Try This at Home from 2006 」も参照してください。SVDのアイデアについても説明しています。

もちろん、あなたは正しいですし、共同フィルタリングのためにNNMFを使用することにもいくつかの作業があります。では、SVDとNNMFのどちらがより効果的ですか?わかりませんが、2012年の協調フィルタリングアルゴリズムの比較研究の結論は次のとおりです。

行列分解ベースのメソッドは、通常、最も高い精度を持っています。特に、正則化されたSVD、PMF、およびそのバリエーションは、NMFが最高のパフォーマンスを発揮する非常にまばらな状況を除いて、MAEおよびRMSEまで最高のパフォーマンスを発揮します。


2
一般的にこれは良い答えです。しかし、いくつかの事実を正すために、BellKor 2008ソリューションは進歩賞を獲得しました。全体的な勝利アルゴリズムは、100を超える予測子のブレンドでした(Töscheret al。2009)。NMFもその一部でした。
dpelisek
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.