製品の総売上を予測するモデルの開発に取り組んでいます。約1年半の予約データがあるので、標準の時系列分析を行うことができました。ただし、クローズされたか失われた各「機会」(販売の可能性)に関するデータもたくさんあります。「商談」は、パイプラインのステージに沿って、閉じられるか失われるまで進行します。また、見込み客、営業担当者、インタラクション履歴、業界、予約の推定サイズなどに関するデータも関連付けられています。
私の目標は最終的には総予約数を予測することですが、予約の真の「根本原因」である現在の「機会」に関するこの情報をすべて考慮したいと思います。
私の考えの1つは、次のように2つの異なるモデルを連続して使用することです。
過去の「機会」を使用して、個々の「機会」から生じる予約を予測するモデルを構築します(おそらく、このステップでは、ランダムフォレストまたは単純な古い線形回帰を使用します)。
1からのモデルを使用して、現在パイプラインにあるすべての「機会」の推定予約を予測し、各「機会」が作成された月に基づいてそれらの推定を合計します。
時系列モデル(おそらくARIMA?)を使用し、1.5年間の月次履歴時系列データと、その月に作成されたすべての「機会」の予測(1のモデルを使用)合計予約を使用します。
実際の予約に変換するこれらの機会には遅れがあると考えられますが、時系列モデルはその遅れに対処できるはずです。
この音はどうですか?私は時系列についてたくさん読んだり、売り上げを予測したりしていますが、これからわかるのは、これはややユニークなアプローチです。したがって、私は本当にフィードバックをいただければ幸いです!