ポアソンは指数関数的であり、ガンマポアソンは何に対してですか?


16

ポアソン分布は単位時間あたりのイベントを測定でき、パラメーターはです。指数分布は、パラメーター使用して、次のイベントまでの時間を測定します。イベントまたは時間をモデル化する方が簡単かどうかに応じて、ある分布を別の分布に変換できます。λ1λ

現在、ガンマポアソンは、より大きな分散を持つ「ストレッチ」ポアソンです。ワイブル分布は、より大きな分散を持つ「ストレッチされた」指数関数です。しかし、これら2つはポアソンを指数関数に変換できるのと同じように、簡単に相互変換できますか?

それとも、ガンマポアソン分布と組み合わせて使用​​するのに適した他の分布がありますか?

ガンマポアソンは、負の二項分布、またはNBDとも呼ばれます。

回答:


14

これはかなり単純な問題です。ポアソン分布と負の二項分布の間には関連性がありますが、実際には、負の二項プロセスを考えるように人々を促すため、これは特定の質問には役に立たないと思います。基本的に、一連のポアソンプロセスがあります。

Yt|λPossonλt

ここで、はプロセス、はそれを観察する時間、は個人を示します。そして、これらのプロセスは、分布によってレートを結びつけることで「類似」していると言っています。tは私に私をYt

λGammaαβ

でintegration / mxixingを実行すると、次のことができます。λ

Yt|αβNegBnαpwherep=tt+β

これには以下のpmfがあります。

PrYt=y|αβ=Γα+yΓαypy1pα

待ち時間の分布を取得するには、次のことに注意してください。

= 1 - 1 p i α = 1 1 +

PrTt|αβ=1PrT>t|αβ=1PrYt=0|αβ
=11pα=11+tβα

これを区別すると、PDFがあります。

pTt|αβ=αβ1+tβα+1

これは、一般化パレート分布、タイプIIのメンバーです。これを待ち時間の配分として使用します。

ポアソン分布との関係を確認するには、に注意してください。したがって、そして、取得した制限を取得します。β=ααβ=Eλ|αβ αβ=αλα

リムααβ1+tβα+1=リムαλ1+λtαα+1=λexpλt

これは、を過剰分散パラメーターとして解釈できることを意味します。1α


1
また、おおまかに言えば、待ち時間分布はガンマランダムレートパラメーターを持つ指数分布であり、厳密に言えば、これはガンマランダムレートパラメーターを持つガンマ分布と同様に、第2種のベータ分布です。
ステファンローラン

@probabilityislogicを基礎として使用して、NBDとパレートの関係に関する詳細を提供する次の記事を見つけました。グプタ、スニル、ドナルドG.モリソン。消費者の購入率の不均一性の推定。マーケティングサイエンス、1991、10(3)、264-269。この質問に答えてくれたすべての人に感謝します。
-zbicyclist

+ 1、ではが定数であるため、この素敵な分析形式はもう存在しないと思います。CPoisson(λiti+c)c
ランデル

1
@randel-このrvは2つの独立したrvの合計であることに注目すると、「素敵な」フォームを得ることができますここで、は上記およびと同じです。以下のよう依存しませんまたはのPDF上記負の二項分布PDFとポアソンPDFの畳み込みです。待機時間分布を取得するには、上記の回答のに掛けるだけです。次に、待機時間とY 、I X 、IP 、O 、I 、S 、S 、O 、N C X I λ I Y I Zのi個の PのR Y I = 0 P R X I = 0 = E - c 1 e c 1 + t iZi=Yi+XiYiXipoisson(c)XiλiYiZiPr(Yi=0)Pr(Xi=0)=ecE-Cα1ec(1+tiβ)αecαβ(1+tiβ)(α+1)
確率論的

1
が必要なため(ポアソン平均が負の場合)、混合分布の観点からはこれは機能しません。ガンマ混合分布は切り捨てる必要があります(以前の回答ではであると仮定しました)。これは、nb分布がないことを意味します。 C > 0λi<cti1c>0
確率論的

4

可能性の1つは、負の二項関数が...指数関数的であるのと同じように、ポアソンは指数関数型です!

時間で値が負の二項分布を持つように、負の二項プロセスと呼ばれる純ジャンプ増加レビープロセスがあります。ポアソンプロセスとは異なり、ジャンプはほとんど確実ではありません。代わりに、対数分布に従います。総分散法則により、分散の一部はジャンプの数に由来し(ジャンプの平均サイズでスケーリング)、分散の一部はジャンプのサイズに由来し、これを使用してそれを確認できます過剰に分散しています。1t1

他の有用な説明があるかもしれません。「DNAシーケンスの負の二項分布のフレーミング」を参照してください


上記の負の二項プロセスをどのように構築できるかについて、より明確にしましょう。

  • 選択します。p<1

  • LET対数分布とIIDであるので、P x i = k = 1バツ1バツ2バツ3Pバツ=k=1ログ1ppkk

  • ましょ一定の速度でポアソン過程であるので、Nログ1pNt=ポアtログ1p

  • してみましょういるのでプロセスでありますNBP

NBPt==1Ntバツ

NBPは、対数的に分布したジャンプを持つ純粋なジャンププロセスです。ジャンプ間のギャップは、レート指数分布に従いログ1p

この説明から、が負の二項分布を持っていることは明らかではないと思いますが、Wikipediaの確率生成関数を使用し短い証明があり、フィッシャーは、種の相対頻度を分析するための対数分布。NBPtNBtp


1
ポアλt

NN

2


0

私はまだコメントできないので、これが決定的な解決策ではないことをおaびします。

NBで使用する適切なディストリビューションを求めていますが、適切なものは完全には定義されていません。適切な分布がデータの説明に適していることを意味し、過剰分散ポアソンから始めている場合、過剰分散の原因をさらに調べる必要があります。NBは、異種の平均を持つポアソンと正の発生依存関係(1つのイベントが発生すると別のイベントが発生する確率が高くなる)を区別しません。連続時間では、持続時間依存性もあります。たとえば、持続時間依存性が正の場合、時間の経過により発生確率が増加することを意味します。負の持続時間依存性が漸近的に過剰分散ポアソンを引き起こすことも示されました[1]。これにより、適切な待機時間モデルのリストが追加されます。


1
過剰分散の原因:これは消費者の購入データです。個々の消費者はポアソンであり、それぞれが購入ラムダのレートを持っています。しかし、すべての消費者が同じラムダを持っているわけではありません-それが過剰分散の原因です。ラムダ購入率はガンマとして分配されると見なされます。これは一般的なモデルです(ASC Ehrenbergに遡ります)が、この質問に答える彼の文章には何も見つかりませんでした。
zbicyclist
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.