Amazonでのユーザーの購入行動をモデル化する方法は?


9

データサイエンスの最後のコースプロジェクトでは、次のことを提案しました。

与えるアマゾンのレビューデータセットを、私たちは、Amazonに広告を配置するための戦略的な位置を決定するアルゴリズム(約パーソナライズページランクに基づいてthatsの)を思い付くする予定。たとえば、Amazonには何百万もの商品があります。そして、データセットは、どの製品が関連しているか、どの製品がまとめられ、一緒に表示されたかなどのアイデアを提供します(この情報も表示および購入されたこの情報を使用してグラフを作成できます)。 14年。これらすべての情報を使用して、Amazonで製品を評価/ランク付けします。あなたは、Amazonのベンダーであり、製品ページへのトラフィックを改善したいと考えています。当社のアルゴリズムは、最大のトラフィックを引き出すことができるように広告を配置できるグラフ内の戦略的位置を特定するのに役立ちます。

今、私たちの教授の質問は、実際のユーザーなしでアルゴリズムをどのように検証するのですか?私たちは言った-

ユーザーの固定セットをモデル化できます。一部のユーザーは、第1ホップまたは第5ホップよりも頻繁に第3ホップをフォローalso_boughtしてalso_viewedリンクします。そこにユーザーの行動は通常分散されます。他の一部のユーザーは、最初のホップを超えて移動することはほとんどありません。この一連のユーザーの行動は指数関数的に分散されます。

私たちの教授は言った-ユーザーがどのようなディストリビューションをフォローしても、ユーザーは同様の製品のリンクを使用してナビゲートしています。また、ランク付けアルゴリズムは、類似性b / w 2製品を考慮して製品をランク付けします。そのため、この検証アルゴリズムを使用するのはちょっと簡単cheatingです。アルゴリズムに対してより現実的で直交する、他のユーザーの動作が付属しています。

ユーザーの行動をモデル化する方法に関するアイデアはありますか?アルゴについての詳細を提供させていただきます。

回答:


1

アルゴリズムをどのように検証しますか?

2番目の質問に答えるのではなく、最初の質問への回答に修正が必要になる可能性があることを考慮してください...

データサイエンスクラス全体で学習方法を検証するためにどのような方法を使用しましたか?最初に、特定の数値メトリックのセットを定義して、モデルの成功または失敗を評価します。次に、非常に現実的なテスト母集団を作成するためにどのような方法を使用できますか?私が最初に与えるヒントは、Amazonレビューデータセットが非常に大きいため、データがこのメソッドに非常に修正可能であることです。私が与える2番目のヒントは、この方法が、クラスで取り組んだ教師あり学習問題の95%で使用した方法である可能性が高いということです...

これが役立つことを願っています... OPによって追加されたコメントに基づいて必要に応じてこれを編集しますが、いくつかの有機的な思考を引き出すためにすぐにソリューションを提供したくありません。これはクラスの問題であり、教授はまた、自分で適切な解決策を考え出すのを支援しようとします。


0

使用する必要がある動作モデルには、(1)「より現実的な」要件と(2)アルゴリズムに直交する要件の2つがあります。

(1)現実的には、Amazonでの購入の特定のコンテキスト以外のより広いコンテキストで観察される動作を反映する必要があることを意味すると想定します。

(2)直交の方が理解しやすい。モデル化された動作は、製品間の類似性によって駆動されるべきではありません。

これら2つの要件を満たすための簡単なアプローチは、購買行動が性別、年齢、場所(都市部/農村など)や経済的制約(収入と価格)などの社会人口統計学的特徴によって推進されるという事実に由来します。

ユーザーのセットと製品のセットがあります。単純だが注意深い回帰手法を使用して、社会人口統計変数と製品の需要との関係を推定できます。必要に応じて、外部データソースを使用して、収入などの重要な欠落変数に関する仮定を行うことができます。

次に、ベンダーである場合、社会人口統計モデルは、製品を購入する可能性が最も高いグループを予測します。

それが役に立てば幸いです:)

ベン

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.