実際のイベントの分布のポアソン分布はどの程度代表的ですか?


8

私たちは、私たちが実際に観察するイベントへのポアソン分布がどれほど適切であるかを常に疑問に思っていました。ほとんどの場合、イベントの発生のモデリングに使用されるのを見てきました。(たとえば、駐車場への車の到着、ネットワーク上のコンピューターホストが送受信したメッセージの数や数など)

通常、そのようなイベントはポアソン分布でモデル化します。分布は、物事が実際にどのように発生するかを示す最初の近似にすぎませんか?上記の2つの例で車数/日またはメッセージ/日を観察した場合、および「分布から選択」して出力されたものはどれくらい異なるのですか?ポアソンの近似はどれくらい良いですか?(それは概算ですか?)ポアソンの背後にある「魔法」は何ですか(直感的に言えば:)?


4
Googleでポアソン分布を導出する場合、いくつかの良い出発点があります。これは、ポアソンがnが大きく、イベントの可能性が小さい二項分布から魔法のように導出される方法を示しています。そこから、カウントイベントのモデル化にそれを使用することが理にかなっています。私が推測する質問は、実際のカウントイベントが二項状況の滑らかな拡張とどれだけうまく一致するかです。
Peter Ellis、

回答:


5

私が話すことができる1つの例は、消費財(CPG)のスーパーマーケットでの販売です。これらもカウントイベントです。スーパーマーケットは1日0ユニット、または1、2などを販売する可能性があるため、ポアソン分布は最初に適合したように見えます。

ただし、基になる二項分布@PeterEllisのノートは保持されません。はい、私たちは二項式で顧客の数をモデル化できるかもしれません...しかし、一部の顧客は1台を購入し、一部は2台を購入し、一部はパントリーをロードして10台を購入します。

結果は通常、過剰分散されるため、負の二項分布はポアソン分布よりもはるかによく適合します。(たまに、牛乳のように動きの速いものでは分散が不十分になることさえあります)。


3
+1。ポアソンは負の二項式の特殊なケースであり、負の二項式を導出する1つの方法は、さまざまな手段を備えた多くの異なるポアソン分布の混合であることを言及する価値があると思いました。
David J. Harris、

4

カウントされているものが互いに独立していて、速度が一定である場合(またはポアソン回帰のようなモデルに従う場合)、ポアソン分布は一般に非常によく保持されます。ガレージに到着する車のような例はかなりうまく機能する傾向があります(9〜5人の作業員が頻繁に訪れるガレージのラッシュアワーと真夜中の両方を含め、レートがかなり一定の期間にわたってはうまく機能しません)。ガレージに到着する時間は、私が到着する時間にほとんど影響を与えません。ただし、2人が同時に会うように手配した場合、2人が一緒に近づく可能性が高く、一方がもう一方に続く場合は、さらに近くなるという例外があります。また、近くの信号機のようなものは、ポアソンと一致しない到着の塊を引き起こす可能性があります。

特定のデータセットを比較して、ポアソンが適切に一致するかどうかを確認する場合は、ハンギングルートグラムを使用できます。


1
+垂れ下がったルートグラム用!
Mike Dunlavey、2012年

2

@Stephanが言うように、直線ポアソンは、ハザード関数によって管理される実際の非負の整数測定の優れたモデルになるほど十分な分散を持たない場合があります。そのため、過剰分散を決定する追加のパラメーターを持つ負の2項がよく使用されます。パラメーター化すると便利です。過剰分散が0に近づくと、負の2項はポアソンに近づき、負の2項は計算が困難になります。β = LN α αα>0β=ln(α)α

分散を増加させる別の方法は、ゼロインフレーションです。これは、ポアソンまたは負の2項に適用できます。これを使用するには、各測定時間で最初にベルヌーイトライアルを実行します(コインを投げます)。コインが「表」の場合、測定値は0です。それ以外の場合、測定値はポアソン分布または負の二項分布から取得されます。


2

イベントが規則的であることが判明した場合、ポアソンモデルは分散(論理的かつ明白)を過大評価し、イベントがクラスター化されたことが判明した場合、ポアソンモデルは分散を過小評価することを確認しました。ポアソン分布は、ランダムポアソンポイントプロセスから生成されます。

私の古い教科書はコックス、DRおよびミラー、HD(1965)をお勧め確率過程の理論パブ。さらに読むためのワイリー。入門書では、このようなランダムプロセスの1次微分方程式が導出されます。これは、時間でイベントが観測されない確率を与えるために解かれますここでは、イベントの割合とは時間であり、などを考慮することにより、一般的なポアソン公式が検査によって導出されます。C.チャットフィールド統計技術:応用統計コース、第2版。1978、パブ。チャップマンとホール:70-75ページを参照。tP(0,t)=eatatP(1,t),P(2,t),

これらの2つの例は、根本的なランダム性の要件に違反しています。イベントが多かれ少なかれランダムである場合、ポアソンモデルは公正なモデルです。忙しい町の中心部の駐車場に到着する車は、おそらく9〜5人のユーザーのために、クラスター化されたデータセットの例となるでしょう。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.