次の問題が発生したとします。
今後3か月以内に当店で購入を停止する可能性が最も高いクライアントを予測します。
各クライアントについて、ショップで購入を開始した月がわかります。さらに、月次集計で多くの行動機能があります。「最年長」のクライアントは50か月間購入しています。クライアントが購入を開始してからの時間を()で示しましょう。クライアントの数は非常に多いと想定できます。クライアントが3か月間の購入を停止してから戻ってきた場合、その顧客は新しい顧客として扱われるため、イベント(購入の停止)は1回しか発生しません。Tの∈ [ 0 、50 ]
2つの解決策が思い浮かびます。
ロジスティック回帰 -各クライアントおよび各月(最新の3か月を除く)で、クライアントが購入を停止したかどうかを判断できるため、クライアントと月ごとに1回の観測でローリングサンプルを実行できます。カテゴリ変数として開始してからの月数を使用して、基本ハザード関数に相当するものを取得できます。
拡張Coxモデル -この問題は、拡張Coxモデルを使用してモデル化することもできます。この問題は生存分析により適しているようです。
質問:同様の問題における生存分析の利点は何ですか?生存分析は何らかの理由で発明されたため、何らかの重大な利点がなければなりません。
生存分析に関する私の知識はそれほど深くはなく、Coxモデルの潜在的な利点のほとんどは、ロジスティック回帰を使用しても達成できると思います。
- 層化コックスモデルの等価物は、と層化変数の相互作用を使用して取得できます。
- 相互作用コックスモデルは、母集団をいくつかの部分母集団に分割し、すべての部分母集団のLRを推定することで取得できます。
私が見る唯一の利点は、Coxモデルがより柔軟であることです。たとえば、クライアントが6か月後に購入を停止する確率を簡単に計算できます。