見込み客の採点モデルのアイデア


8

クライアントに転向する可能性が高い見込み顧客(企業)を特定するためのモデルについて考えなければならないのですが、どのようなモデルが有用かについてのアドバイスを探しています。

私は私の知る限り、ある必要がありますデータベースは、(私はそれらをまだ持っていない)list of current clients(換言すれば、converted prospectsその機能()とsizerevenueagelocation、および、そのようなもの)list of prospects私はスコアに持っている(ということ)とその機能。ただし、以前は見込み客でしたが、クライアントへの変換に失敗した企業のリストはありません(もしそうだった場合は、ランダムフォレストを選択できたと思います。もちろん、ランダムフォレストを使用しますが、2つのデータベースの結合でランダムフォレストを実行し、クライアントをconverted見込み顧客として扱うことは悪い考えだと思いますnon-converted...)

ですから、見込み客のリストから、既存のクライアントのように見える人を見つける必要があります。それにはどのようなモデルを使用できますか?

(「クライアントの価値を評価し、これを同様の見込み客に適用する」、「各見込み客が廃業する可能性を評価する」などの点についても検討して、スコアリングの価値をさらに絞り込みますが、それはちょっと私の質問の範囲外です)。

ありがとう

回答:


7

私は1年半前にほぼ同じシナリオに直面しました。基本的に、1クラス分類(OCC)問題のバリエーション、具体的にはPU学習(ポジティブデータとラベルなしデータからの学習)です。既知のラベル付けされたポジティブデータセット(クライアント)とラベル付けされていないプロスペクトのデータセット(クライアントに似ているものとクライアントに似ていないものがあります。あなたの仕事はことを前提に...このヒンジを展望のようにほとんどのクライアントを識別し、それらを標的とすることであるクライアントのように、ほとんどを見て見通しがある可能性が高い変換するために、より少ないクライアントのように見える見通し

私たちが解決したアプローチは、スパイテクニックと呼ばれる手順を使用しました。基本的な考え方は、既知の陽性クラスからサンプルを取り、ラベルなしのセットに注入することです。次に、この結合されたデータで分類子をトレーニングし、トレーニングされた分類子を通してラベルなしセットを実行して、各インスタンスに陽性のクラスメンバーである確率を割り当てます。直感は、注射されたポジティブ(いわゆるスパイ))は、ポジティブインスタンスと同様に動作する必要があります(事後確率によって反映されます)。しきい値を設定することで、ラベルなしのセットから信頼できる否定的なインスタンスを抽出できます。これで、ポジティブとネガティブの両方のラベル付きデータが得られ、選択した標準の分類アルゴリズムを使用して分類器を構築できます。本質的には、スパイ手法では、データをブートストラップして、適切なトレーニングに必要なネガティブインスタンスを提供します。

スパイテクニック

手始めに、OCCとPUラーニングのトピックを調査する多数の論文を持っているLiとLiuの研究を検討する必要があります。

OCCおよびPUラーニングペーパー


素晴らしい答え、ありがとう。(1つだけ言うと、最初の段落の最後の文に何か奇妙な点はありませんか?)
FrançoisM.

編集ありがとう-あらかじめパックされたソリューションを調べることもできます...たとえば、1つのクラスのSVM、たとえばcran.r-project.org/web/packages/e1071/vignettes/svmdoc.pdf
Brandon
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.