解約を予測するための予測モデルを構築し、個人期間トレーニングデータセットに適合した離散時間サバイバルモデルを使用することを検討しています(各顧客およびリスクのある離散期間ごとに1行、イベントのインジケーター-1に等しい)その期間に解約が発生した場合、そうでない場合は0)。
- SingerとWilletの手法を使用して、通常のロジスティック回帰を使用してモデルを近似しています。
- 顧客の解約は、1か月のどこでも発生する可能性がありますが、それは私たちがそれを知っているのは月末(つまり、彼らが去ったその月のいつか)だけです。24か月がトレーニングに使用されています。
- 使用されている時間変数は、サンプルの起点時間です-2008年3月31日の時点でアクティブなすべての顧客-2009年1月の時点ですべてt = 0を受け取ります(これを行う古典的な方法ではありませんが、予測モデルと従来の統計モデル)。使用される共変量は、その時点での顧客の在職期間です。
構築された一連の共変量があります。データセットの行全体で変化しないもの(特定の顧客)と変化するものがあります。
これらの時変共変量が問題であり、解約予測の生存モデルに疑問を投げかけているのは(現在のスナップショットデータに基づいて今後xか月の解約を予測する通常の分類子と比較して)。時不変のものは、前月のアクティビティを表し、重要なトリガーになると予想されます。
この予測モデルの実装は、少なくとも私の現在の考え方に基づいて、毎月末に顧客ベースをスコアリングし、来月中に解約の確率/リスクを計算することです。その後、次の1、2または3か月間。その後、次の1,2,3,4,5,6か月間。3か月および6か月の解約率については、推定生存曲線を使用します。
問題:
スコアリングについて考える場合、時変予測変数をどのように組み込むことができますか?私は時不変の予測子でしかスコア付けできないか、または時不変の予測子を含めることができるようです。それらを時不変にする必要があります。値を「今」に設定します。
生存モデルのこの使用に関する経験や考えはありますか?
@JVMコメントに基づく更新:
問題は、モデルの推定、係数の解釈、トレーニングデータを使用した興味深い共変量値のハザード/生存プロットのプロットなどにはありません。問題は、特定の顧客のリスクを予測するためにモデルを使用することです。今月の終わりに、私はまだこのモデルでアクティブな顧客であるすべての人を獲得したいと考えています。このリスクをx期間のうちに予測します(来月の終わりに口座を閉鎖するリスク。今から2か月の終わりに口座を閉鎖するリスクなど)。時変共変量がある場合、それらの値は将来の期間で不明であるため、モデルの利用方法は?
最終更新:
個人期間のデータセットには、各個人およびリスクのある各期間のエントリがあります。Jの期間があるとしましょう(24か月でJ = 1 ... 24の場合)離散時間生存モデルを構築します。簡単にするために、時間Tを線形として扱い、Xが時間である2つの共変量XとZがあるとします-不変、つまり、i番目の人のすべての期間で一定であり、Zは時間的に変化する、つまりi番目の人の各レコードが異なる値を取ることができることを意味します。たとえば、Xは顧客の性別であり、Zは前月の企業にとってどれだけの価値があるかを示します。j番目の期間におけるi番目の人のハザードのロジットのモデルは次のとおりです。
したがって、問題は、時変共変量を使用し、新しいデータで(まだ見えない未来に)予測する場合、は不明です。
私が考えることができる唯一の解決策は次のとおりです。
- Zのような時変共変量を使用しないでください。たとえば、Zの減少を見ると、顧客が離脱し、おそらく出発する準備ができていることがわかりますので、これはモデルを大幅に弱め、撹拌のイベントを予測します。
- 時変共変量を使用しますが、(Zが上にあるように)それらを遅らせることで、変数に遅れが生じている期間を予測できます(ここでも、新しい現在のデータをスコアリングするモデルを考えます)。
- 時変共変量を使用しますが、予測では定数として保持します(したがって、モデルはさまざまなデータに適合しましたが、予測のためにそれらを一定のままにして、後で実際に観察された場合、これらの値の変化が撹拌のリスクにどのように影響するかをシミュレートします。
- 時変共変量を使用しますが、既知のデータからの予測に基づいて将来の値を補完します。たとえば、各顧客のを予測します。
t=0
か?私はあなたが時間立っていて、を知りたいと思うと思います。つまり、初期生存曲線ではなく、条件付き生存確率を探しています。私は正しいですか、何かが欠けていますか?:私はここに、この上の質問を提案stats.stackexchange.com/questions/346338/...