パレート/ nbdモデルを概念的に理解することは可能ですか?


12

パレート/ NBDモデルを使用して、顧客がいつ戻ってくるかを予測するBTYDパッケージを使用することを学んでいます。ただし、このモデルに関するすべての文献には数学が満載されており、このモデルの動作についての単純な/概念的な説明はないようです。非数学者のパレート/ NBDモデルを理解することは可能ですか?フェーダーのこの有名な論文を読んだ。パレート/ NBDモデルは、次のことを前提としています。

私。アクティブな場合、長さtの期間に顧客によって行われたトランザクションの数は、トランザクションレートλでポアソン分布されます。

ii。顧客間のトランザクションレートの不均一性は、形状パラメーターrとスケールパラメーターαのガンマ分布に従います。

iii。各顧客には、長さτの観察されない「寿命」があります。顧客が非アクティブになるこのポイントは、ドロップアウト率µで指数関数的に分布します。

iv)顧客全体のドロップアウト率の不均一性は、形状パラメーターsとスケールパラメーターβのガンマ分布に従います。

v。トランザクションレートλとドロップアウトレートµは、顧客ごとに独立して変化します。」

仮定(ii)、(iii)、および(iv)の理論的根拠(背後にある直感)がわかりません。なぜこれらのディストリビューションのみで、他のディストリビューションではないのですか?

また、BG / NBDモデルの仮定は次のとおりです。

i。)アクティブになっている間、顧客によって行われたトランザクションの数は、トランザクションレートλでポアソンプロセスに従います。これは、トランザクション間の時間がトランザクションレートλで指数関数的に分布していると仮定するのと同じです。

ii)λの不均一性はガンマ分布に従う

iii)取引後、顧客は確率pで非アクティブになります。したがって、顧客が「ドロップアウト」するポイントは、pmfを使用した(シフトされた)幾何分布に従ってトランザクション全体に分散されます。

iv)ベータ分布に従うpの不均一性

仮定(ii)、(iii)、および(iv)の(直観的な)合理性もまったく明らかではありません。

どんな助けにも感謝します。ありがとう。


難しいと思う文献への参照を追加できますか?
kjetil bハルヴォルセン

私は物事が不明確な場所を詳しく説明しました。直感的にプレイするのは簡単ではないことは知っていますが、もしそれが可能であれば、大きな助けになるでしょう。ありがとう。
user3282777

回答:


13

あなたがフラワーショップの新しく任命されたマネージャーだと想像してください。昨年の顧客の記録があります。これは、彼らが買い物をする頻度と最後の訪問からの時間です。リストされた顧客が今年どのくらいのビジネスをもたらす可能性があるかを知りたいと思います。考慮すべき点がいくつかあります。

[仮定(ii)]顧客は異なる買い物習慣を持っています。

λλ

分布には、いくつかのパラメーター(必ずしも大量のデータがあるわけではありません)、かなり柔軟である(おそらく、心を読む起業家の第一人者ではなく、買い物習慣についてすべてを知らない)必要があります正の実数の値。ガンマ分布はこれらすべてのボックスにチェックマークを付けており、よく研究されており、比較的簡単に操作できます。多くの場合、さまざまな設定で正のパラメーターの事前値として使用されます。

[仮定(iii)]リストの顧客の一部をすでに失っている可能性があります。

アンドレアが去年、毎月約1か月に花を買った場合、今年戻ってくるのはかなり安全です。ベンが毎週花を買っていたのに、何ヶ月もいなかったなら、別のフラワーショップを見つけたのかもしれません。将来のビジネスプランを立てる際に、BenではなくAndreaに頼ることをお勧めします。

顧客は、いつ移動したかを通知しません。これは、両方のモデルで「観察されない寿命」の仮定が始まる場所です。3番目の顧客であるCaryを想像してください。Pareto / NBDモデルとBG / NBDモデルは、Caryが永久に店から脱落することを考える2つの異なる方法を提供します。

パレート/ NBDの場合、どの時点でも、Caryがあなたよりも良いショップに出くわす可能性が少しあると想像してください。この絶え間ない無限のリスクにより、指数関数的な寿命が得られます。そして、Caryが最後に訪れてから長くなるほど、他の(潜在的にはより良い)花屋にさらされる時間が長くなります。

BG / NBDの場合は、もう少し工夫されています。ケアリーがあなたの店に到着するたびに、彼は花を買うことを約束します。ブラウジング中に、彼は最後の訪問以来の価格、品質、および多様性の変化を考慮し、それは最終的に彼が次回戻ってくるか、別の店を探すかを決定するでしょう。したがって、Caryは常にリスクにさらされるのではなく、購入するたびに去ることを決定する確率pを持っています。

[仮定(iv)]すべての顧客があなたの店に等しくコミットしているわけではありません。

一部の顧客は常連客であり、死亡または急激な価格上昇のみが顧客を退職させます。他の人は探検したいかもしれませんし、通りの向こう側の新しい流行に敏感なフラワーショップのために喜んであなたを残すでしょう。すべての顧客のドロップアウト率を1つにするのではなく、ドロップアウト率(またはBG / NBDの場合の確率)を分布させる方が理にかなっています。

μ0;1

これがお役に立てば幸いです。元の論文(Schmittlein et al。、1987)をまだ読んでいない場合は、ご覧ください。


そのような努力と明確な説明をありがとう。ガンマ分布を使用する理由は、操作が比較的簡単であり、さまざまな設定で正のパラメーターの事前条件として使用されることが多いためです。ほとんどのガンマ分布(パラメータ値が異なる)の形状は理解しやすいですが、「顧客間のトランザクションレートの不均一性」を指数関数的に近似するガンマ分布に適合させるため(k = 1、シータ= 2ウィキペディアグラフの場合[ここ] en.wikipedia.org/wiki/Gamma_distribution)を理解するのは少し難しいです。このような動作を除外しますか?
user3282777

1
ガンマパラメータの推定値は、使用しているデータによって異なります。全体のポイントは、ガンマ分布が2つのパラメーターのみに基づいて大幅に異なる形状をとることができることであり、過度に厳密な仮定(多かれ少なかれ)を課すことなく、データ自体に語らせることができます。
リュバB.
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.