潜在的な特徴の意味?


15

推奨システムの行列因子分解モデルを理解しようとしていますが、常に「潜在機能」を読みますが、それはどういう意味ですか?トレーニングデータセットにとって機能が何を意味するかは知っていますが、潜在的な機能の概念を理解することはできません。私が見つけることができるトピックに関するすべての論文はあまりにも浅いです。

編集:

少なくともアイデアを説明するいくつかの論文を教えていただければ。


ここでは、役立つかもしれない簡単な例であるquuxlabs.com/blog/2010/09/...
Akavall

回答:


9

潜在とは、直接観測できないことを意味します。PCAおよび因子分析でこの用語が一般的に使用されるのは、多数の直接観測可能なフィーチャの次元を、間接的に観測可能なフィーチャの小さなセットに縮小することです。


縮小された次元は潜在的な特徴ですか?PCAの場合、共分散行列の固有ベクトル、つまり主成分ですか?
ジャックトウェイン14

正しい@AlexTwain
samthebest 14

それについて言及したチュートリアル/ペーパーを提供していただけますか?体系的なチュートリアル/論文を見つけることができません!
ジャックトウェイン14

まあwikiページはかなり良いですが、あなたが本当にしたい場合、あなたはそこに参照をたどることができen.wikipedia.org/wiki/Latent_variable
samthebest

1
@JackTwainの正しいPCAの例えは、潜在的な特徴が固有ベクトルであることです。主成分は、主要な固有ベクトルの各観測値に割り当てられた重みです。他の行列分解モデルでは、潜在的な特徴が固有ベクトルの役割を果たします。これはつまらなく聞こえるかもしれませんが、間違いは人々の混乱を終わらせません。
推測

3

因数分解法のコンテキストでは、潜在機能は通常、各次元に沿ってアイテムを特徴付けることを意味します。例で説明させてください。

RRupuTqpあなたはあなたはq

pあなたはq


潜在的な特徴(「ユーザーベクトル」など)を使用していくつかのターゲット変数を予測する論文を読みました。例として性別を使用してみましょう。この方法で予測モデルを構築できるという点で「機能します」。私の質問は、「ユーザーベクトル」と、たとえばユーザーが「訪問した」すべてのアイテムの「アイテムベクトル」の平均の違いは何ですか?IOW、あなたは上記の予測モデルが一方と他方で良くなるか悪くなると期待しますか?ありがとう(これを見たことがあれば)。
thecity2

@ thecity2、ユーザーのアイテムを平均化できます。これは、事前に計算されたユーザーベクトルを持っていない新規参入者を扱う場合に実際に役立つ可能性があります(ただし、それを計算するためにいくつかの最適化反復を実行するのは難しいはずです)。また、単純な平均化にも問題があります。ユーザーが消費するアイテムが多いほど、平均的なアイテムベクトルはゼロに近くなる可能性が高くなります(通常のL2レギュラーと、おそらく高次元空間の他の厄介なプロパティのため)。最後に、独立したベクトルを持つことはより柔軟です。モデルはそのような平均化を学習できます。
アルテムソボレフ

ただし、ユーザーの履歴を使用してユーザーのベクトルをモデル化する試みがあります。たとえば紙「のモデリングインターネットラジオストリームすることにより、独自の音楽推薦の構築」を参照してください
アルテムソボレフ

0

変数の「遅延」/隠蔽性の認識を得るために、要素は主成分よりも代表的であると思います。レイテンシは、行動科学者が感情や悲しみなどの知覚構造を複数の項目/尺度で測定し、直接測定できないこうした隠れた変数の数を導き出す理由の1つです。


0

ここでのデータは、さまざまなユーザーがさまざまな映画に付けた評価です。他の人が指摘したように、潜在は直接観測できないことを意味します。

映画の場合、潜在的な特徴によってアクション、ロマンス、ストーリー、有名な俳優などの量が決まります。同様に、手書き数字で構成される別のデータセットの場合、潜在的な変数はエッジの角度、スキューなどです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.