それは芸術であり科学でもあります。典型的な研究分野は、データマイニングの分野のサブセットであるマーケットバスケット分析(親和性分析とも呼ばれます)を中心に展開しています。このようなシステムの一般的なコンポーネントには、主要なドライバーアイテムの識別とアフィニティアイテム(アクセサリーのアップセル、クロスセル)の識別があります。
彼らがマイニングしなければならないデータソースを覚えておいてください...
- 購入したショッピングカート=実際のアイテムに費やした実際の人からの実際のお金=強力なデータとその多く。
- カートに追加されたが破棄されたアイテム。
- オンラインでの価格設定実験(A / Bテストなど)。同じ製品を異なる価格で提供し、結果を確認します。
- 異なる「バンドル」で異なる製品を提供したり、アイテムのさまざまな組み合わせを割引したりするパッケージング実験(A / Bテストなど)
- ウィッシュリスト-特にあなたのために何が付いているのか-まとめると、バスケット分析データの別のストリームと同様に扱うことができます
- 紹介サイト(どこから来たのかを特定すると、他の興味のあるアイテムのヒントになる場合があります)
- 滞留時間(クリックして別のアイテムを選択するまでの時間)
- あなたまたはあなたのソーシャルネットワーク/購入サークルの人々による評価-あなたが好きなものを評価すると、あなたはより多くのあなたが好きなものを得て、そして「私はすでにそれを所有している」ボタンで確認すると、彼らはあなたの非常に完全なプロフィールを作成します
- 人口統計情報(配送先住所など)-彼らはあなたの一般的な地域であなたの子供、あなた自身、あなたの配偶者などに人気があることを知っています。
- ユーザーセグメンテーション=幼児向けに3冊の本を別々の月に購入しましたか?子供がいるかもしれません。
- ダイレクトマーケティングのクリックスルーデータ-メールを受け取ってクリックスルーしましたか?彼らはそれがどのメールだったか、あなたが何をクリックしたか、そしてあなたが結果としてそれを買ったかどうかを知っています。
- セッション中のクリックパス-カートに入ったかどうかに関係なく、何を見ましたか
- 最終購入前にアイテムを閲覧した回数
- 実店舗を扱っている場合は、実際の購入履歴も消える可能性があります(例:おもちゃの私たち、またはオンラインであり、実店舗でもあります)。
- などなど
幸いなことに人々は全体として同じように振る舞うので、彼らが全体として購入する人口について知るほど、彼らは何が売れ、何が売れないかをよく理解し、すべてのトランザクションとすべての評価/ウィッシュリストの追加/閲覧は、より個人的に推奨を調整する方法を知っています。これは、推奨事項などに影響する一連の影響のほんの一部にすぎないことに注意してください。
今私はAmazonがどのようにビジネスをしているのか(そこで働いたことはありません)の内部知識がなく、私がしているのはオンラインコマースの問題への古典的なアプローチについて話しているだけです-私は以前、Microsoftのデータマイニングと分析に取り組んだPMでしたCommerce Serverと呼ばれる製品。Commerce Serverには、同様の機能を備えたサイトを構築するためのツールを出荷しましたが、販売量が多いほど、データが優れていて、モデルも優れています。Amazonは非常に優れています。コマース主導のサイトで大量のデータを持つモデルを操作するのがどれほど楽しいか想像できるだけです。現在、これらのアルゴリズムの多く(コマースサーバーで開始された予測子など)は、Microsoft SQL内に直接存在するようになりました。
あなたが持っているべき4つの大きな持ち帰りは次のとおりです:
- Amazon(または任意の小売業者)は、大量のトランザクションと大量の人々の集計データを調べています...これにより、サイトの匿名ユーザーにかなり適切に推奨することもできます。
- Amazon(または洗練された小売業者)は、ログインしているユーザーの行動と購入を追跡し、それを使用して大量の集計データをさらに詳細化しています。
- 多くの場合、蓄積されたデータを乗り越えて、特定のライン(「デジタルカメラ」の垂直または「ロマンス小説」の垂直または類似のものを所有する人など)の製品マネージャーに提案の「編集」制御を行う手段があります。専門家です
- 多くの場合、特定の「提案」が行われるプロモーション取引(つまり、ソニー、パナソニック、ニコン、キヤノン、スプリント、またはベライゾンが小売業者に追加のお金を支払うか、大量の割引を提供するなど)があります。他よりも頻繁にトップ-これには常に、各トランザクションをより多くすることや卸売りコストを削減することなどを目的とした、合理的なビジネスロジックとビジネス上の理由があります。
実際の実装に関しては?ほぼすべての大規模なオンラインシステムは、パイプラインのセット(またはフィルターパターンの実装やワークフローなど)に要約され、何らかの形のモジュールを適用する一連のモジュールによってコンテキストを評価できます。ビジネスの論理。
通常、ページ上の個別のタスクごとに異なるパイプラインが関連付けられます-推奨される「パッケージ/アップセル」を実行するパイプライン(つまり、見ているアイテムでこれを購入)と「代替」を実行するパイプライン(つまり購入これは、あなたが見ているものの代わりに)、ウィッシュリストから最も密接に関連しているアイテムを(製品カテゴリなどによって)プルする別のものです。
これらのパイプラインの結果は、ページのさまざまな部分(スクロールバーの上、スクロールの下、左、右、さまざまなフォント、さまざまなサイズの画像など)に配置でき、どのパフォーマンスを実行するかをテストして確認できます。ベスト。これらのパイプラインのビジネスロジックを定義する、簡単にプラグアンドプレイできる素晴らしいモジュールを使用しているので、別のパイプラインを構築するときに適用したいビジネスロジックから簡単に選択できる、レゴブロックと同等の道徳的なものになります。これにより、より迅速なイノベーション、より多くの実験、そして最終的にはより高い利益が可能になります。
それはまったく役に立ちましたか?これがAmazonだけでなく、ほぼすべてのeコマースサイトで一般的にどのように機能するかについて少し洞察が得られることを願っています。アマゾン(そこで働いていた友人と話すことから)は非常にデータに基づいており、そのユーザーエクスペリエンスと価格設定、プロモーション、パッケージなどの効果を継続的に測定しています-彼らは非常に洗練されたオンライン小売業者であり、彼らが利益を最適化するために使用するアルゴリズムの多く-そしてそれらはおそらく独自の秘密(KFCの秘密のスパイスの公式のように知っています)であり、そのように保証されています。