タグ付けされた質問 「recommender-system」

推奨エンジンは、ユーザーが特定の商品(映画、本、歌など)をどれだけ楽しむかを予測し、推奨を行います。オンラインベンダーは、新しい購入を提案するためによく使用します。

5
協調フィルタリングでSVDを使用するにはどうすればよいですか?
共同フィルタリングでSVDがどのように使用されるか、少し混乱しています。ソーシャルグラフがあり、エッジから隣接行列を作成し、SVD(正則化、学習率、スパース性最適化などを忘れましょう)を使用すると、このSVDを使用して推奨事項を改善できますか? 私のソーシャルグラフがinstagramに対応しており、ソーシャルグラフのみに基づいて、サービス内のユーザーを推奨する責任が課せられたとします。最初に隣接行列を作成し、SVD取得し、最初の固有値を選択します。(m × m )A = U s V kAA\mathbf A (m × m )(m×m)(m\times m)A = U s VA=UsV\mathbf A = \mathbf{U s V}kkk おそらく新しい行列のセットを作成します。 それでは何をしますか?うんN E WsN E WVN E W〜M × K〜K × K〜K × MUnew∼m×ksnew∼k×kVnew∼k×m\begin{align} \mathbf U_{new} &\sim m\times k \\ \mathbf s_{new} &\sim k\times k …

3
R:データセットにNaNがないにもかかわらず、「Forest function call」エラーでNaN / Infをスローするランダムフォレスト[非公開]
キャレットを使用して、データセットに対してクロス検証されたランダムフォレストを実行しています。Y変数は要因です。データセットにNaN、Inf、またはNAはありません。ただし、ランダムフォレストを実行すると、 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs introduced by coercion 3: In data.matrix(x) : NAs introduced by …

3
SVDを協調フィルタリングの問題に適用するとどうなりますか?2つの違いは何ですか?
協調フィルタリングでは、入力されていない値があります。ユーザーが映画を見なかった場合、そこに「na」を入力する必要があります。 このマトリックスのSVDを取得する場合、そこにいくつかの数値(0など)を入力する必要があります。マトリックスを因数分解すると、同様のユーザーを見つける方法があります(どのユーザーが縮小された次元空間)。しかし、予測される嗜好自体-アイテムに対するユーザーにとってはゼロになります。(なぜなら、未知の列に入力したものだからです)。 そのため、共同フィルタリングとSVDの問題に悩まされています。それらはほとんど同じように見えますが、完全ではありません。 それらの違いは何ですか?SVDを協調フィルタリング問題に適用するとどうなりますか?私はそうしましたが、結果は近くのユーザーを見つけるという点で許容できるように見えますが、これは素晴らしいですが、どのようにですか?

4
潜在的な特徴の意味?
推奨システムの行列因子分解モデルを理解しようとしていますが、常に「潜在機能」を読みますが、それはどういう意味ですか?トレーニングデータセットにとって機能が何を意味するかは知っていますが、潜在的な機能の概念を理解することはできません。私が見つけることができるトピックに関するすべての論文はあまりにも浅いです。 編集: 少なくともアイデアを説明するいくつかの論文を教えていただければ。

3
動的推奨システム
A 推薦システムは彼に興味のある項目について、特定のユーザーのために、異なるユーザーの評価及び降伏勧告との相関関係を測定します。 ただし、好みは時間とともに変化するため、古い評価は現在の好みを反映していない可能性があります。かつて「嫌ではない」などと評価する本に「優秀」を付けたことがあるかもしれません。さらに、利益自体も変わります。 推奨システムは変化する環境でどのように機能する必要がありますか? 1つのオプションは、「古い」評価を切り捨てることです。これは、「古い」を正しく定義していればうまく機能する場合があります(評価が期限切れにならず、問題が存在しないふりをすることさえできます)。しかし、それは最良の選択肢ではありません。もちろん味は進化し、通常の生活の流れであり、かつて正しい過去の評価の余分な知識を使用できない理由はありません。 別のオプションは、何らかの方法でこの追加の知識に対応することです。したがって、現在の興味に合った「インスタントマッチ」を見つけることはできませんでしたが、次に好む可能性のあるもの(今好む可能性のあるものとは対照的に)を提案します。 これを十分に説明しているかどうかはわかりません。基本的に2番目のアプローチに賛成し、味の軌跡の相関を測定し、それに対応する推奨事項を生成する推奨システムについて話します。まあ、それを個人的な成長と呼びましょう-彼らは「テイストの軌跡」(「テイストのスナップショット」だけでなく)はあなたのものに似ています。 ここで質問です。「オプション2」に似たものが既に存在するかどうか、もし存在する場合、どのように機能するのか疑問に思います。そして、それが存在しない場合は、どのように機能するかを議論することを歓迎します!:)


4
Netflixのような映画を推奨するための統計的方法は何ですか?
動的モデルを実装して、映画をユーザーに推奨したいと考えています。推奨事項は、ユーザーが映画を見たり評価したりするたびに更新する必要があります。シンプルにするために、2つの要素を考慮に入れることを考えています。 ユーザーによる他の映画の過去の評価 ユーザーが特定の過去の映画を視聴した時間 そのようなモデルをどのように設定し、学術文献は何を推奨しますか? 私はこの分野で初めてであり、線形推定モデルは、パラメータ推定に不必要な不確実性を課すことを避けるための複雑な方法に興味を持たずに、良い結果を提供できると推測しています。しかし、実際に一般的に使用されている確立された方法はすでにあるのでしょうか?

1
協調フィルタリングの最新技術
私は共同フィルタリング(CF)のプロジェクトに取り組んでいます。つまり、部分的に観測された行列またはより一般的にはテンソルを完成させています。私はこの分野の初心者であり、このプロジェクトでは、最終的に、現在の手法とCFの最新技術を比較する他の有名な手法とこの手法を比較する必要があります。 私の検索では、次の方法が明らかになりました。確かに、これらの論文とその参考文献のいくつかを見たり、比較を行う際に実験セクションを見たりすることで、彼らに出会いました。新しい提案された方法について知り、SoTAと比較したいのですが、次のうちどれが良い選択でしょうか?それらの間でなかったら、私はよい代表を知りたいです。 行列分解に基づく: 加重低ランク近似(ICML 2003) 協調フィルタリングのユーザー評価プロファイルのモデリング(NIPS 2003) 協調フィルタリングの多重乗数因子モデル(ICML 2004) 協調的予測のための高速最大マージンマトリックス因数分解(ICML 2005) 確率的行列因子分解(NIPS 2007) ベイジアン確率行列因子分解(ICML 2008) 回帰ベースの潜在因子モデル(KDD 2009) ガウス過程による非線形行列因子分解(ICML 2009) Dynamic Poission Factorization(Recommender Systems 2015に関するACM会議) テンソル分解に基づく: 多次元アプローチを使用したリコメンダーシステムへのコンテキスト情報の組み込み(ACM Transactions on Information Systems(TOIS)2005) ベイズ確率的テンソル因数分解(SIAMデータマイニング2010) リーマン最適化による低ランクテンソルの完了(BIT Numerical Mathematics 54.2(2014))

2
部分的なランキングのリストをグローバルランキングに変換する
私は次のような問題に取り組んでいます。私はたくさんのユーザーとN本を持っています。各ユーザーは、たとえばBook 1> Book 40> Book 25のように、読んだすべての本(N本のサブセットである可能性が高い)の順序付けられたランキングを作成します。 ここで、これらの個々のユーザーのランキングを、すべての本の単一の順序付けされたランキングに変えたいと思います。 試みる良いまたは標準的なアプローチはありますか?これまでのところ、ブラッドリー・テリーのモデルをペアワイズ比較に適用することを考えていますが、他に何かあるのか疑問に思っています。


3
欠損値を持つ行列のSVD
Netflixスタイルの推奨マトリックスがあり、特定のユーザーの将来の映画評価の可能性を予測するモデルを構築するとします。サイモンファンクのアプローチを使用すると、確率的勾配降下法を使用して、フルマトリックスとアイテムごとの* L2正則化項を組み合わせたユーザーごとのマトリックス間のフロベニウスノルムを最小化できます。 実際には、推奨行列の欠損値を使って人々は何をしますか?これは計算を行うことの全体的なポイントです?サイモンのブログ投稿を読んでの私の推測では、彼は予測するために(ハイパーパラメータと正則化の賢明な選択を伴う)モデルを構築するために、非欠落用語(推奨マトリックスの約1%で構成される)のみを使用している行列の残りの99%は? 実際には、これらすべての値を本当にスキップしますか?または、確率的勾配降下を行う前に、可能な限り推測しますか?欠損値を処理するための標準的なベストプラクティスは何ですか?

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
協調フィルタリング/推奨システムで非否定性が重要なのはなぜですか?
私が見てきたすべての最新の推奨システムでは、マトリックス因数分解に依存しているため、非負のマトリックス因数分解がユーザー映画マトリックスで実行されます。なぜ非負性が解釈可能性にとって重要であるか、および/または疎要素が必要かどうかを理解できます。しかし、たとえばnetflix賞の競争のように、予測のパフォーマンスのみに関心がある場合は、なぜ非否定性の制限を課すのでしょうか。因数分解で負の値を許可するよりも厳密に悪いように思えます。 このペーパーは、協調フィルタリングでの非負行列因数分解の使用の1つの非常に引用された例です。

3
協調フィルタリングとコンテンツ機能の両方を統合する推奨システムを作成するにはどうすればよいですか?
私は推奨システムを作成しており、「類似」ユーザーの評価とアイテムの機能の両方を組み込みたいと考えています。出力は予測評価[0-1]です。ニューラルネットワークを検討しています(そもそも)。 したがって、入力は、アイテムの機能と各ユーザーの評価の組み合わせです。アイテムAとユーザー1の場合、システムは結合されたデータA1でトレーニングできます。これはトレーニングの例の1つです。 ユーザー1が映画Bも評価した場合はどうなりますか?では、データB1もトレーニングの例でしょうか?この方法でユーザー1の機能を使用してトレーニングを繰り返すことに問題はありますか? 問題に取り組むより良い方法について何か提案はありますか?

2
ロジスティック損失関数を使用した行列分解による協調フィルタリング
協調フィルタリングの問題を検討してください。サイズ#users * #itemsの行列あります。ユーザーiがアイテムjを気に入った場合、ユーザーiがアイテムjを嫌い、(i、j)ペアに関するデータがない場合。私たちは予測したい将来のユーザー、アイテムのペアのために。MMMM私、j= 1Mi,j=1M_{i,j} = 1M私、j= 0Mi,j=0M_{i,j} = 0M私、j= ?Mi,j=?M_{i,j}=?M私、jMi,jM_{i,j} 標準の協調フィルタリングアプローチは、が最小になるような2つの行列積としてMを表すことです(たとえば、既知の要素の平均二乗誤差を最小化します)。U× VU×VU \times V| | M− U× V| |2||M−U×V||2||M - U \times V||_2MMM 私にとってロジスティック損失関数の方が適しているようですが、なぜすべてのアルゴリズムがMSEを使用しているのですか

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.