ポアソンではないプロセスの例?


15

ポアソン分布を学生に説明するのに役立つように、ポアソン分布でモデル化するのに適さない状況の良い例を探しています。

ポアソン分布によってモデル化できる例として、ある時間間隔で店舗に到着する顧客の数を一般的に使用します。私は、同様の脈絡の反例を探しています。つまり、連続時間での正のカウントプロセスと見なすことができ、明らかにポアソンではない状況を探しています。

状況は、学生が把握して覚えやすくするために、理想的にはできるだけシンプルでわかりやすいものにする必要があります。


5
この質問は非常に広範です。スコープを狭めてコンテキストを追加しない限り、最終的には閉じられる可能性が非常に高くなります。不必要に耳障りな音をする意味はありませんが、「赤くない花の例は何ですか?」(キューハリーチャピン。)
枢機

1
取られたポイント。謝罪いたします。もっと具体的にすべきだった。わかりやすくするために編集しました。
ナゲル

1
(+1)質問とコメント。更新ははるかに優れています。:
枢機

2
私はあなたが「人々が少なくとも素朴にポアソンを考慮するかもしれない与えられたプロセス」を意味すると仮定します(例えば、少なくとも、カウントプロセス)。一般的な例は、損害保険料(P&C保険)の保険金請求の数で発生します。これは、保険金請求率の不均一性に最も明確に反映される多くの要因によるものです。クレーム率の分布がガンマ分布によって近似される状況では、クレーム数の分布は負の二項式によって近似されます。
Glen_b-モニカの復職14

回答:


5

一定期間内に喫煙したタバコの数:全員がタバコを吸うわけではないため、これにはゼロ膨張プロセス(ゼロ膨張ポアソンまたはゼロ膨張負の二項式)が必要です。


ありがとう!ここでは多くの人がゼロ膨張プロセスに言及していますが、これは与えられた最も簡単で説明的な例だと思います:一定期間にランダムに選んだ人によって喫煙されたタバコの数。
ナジェル14年

「誰もがタバコを吸うわけではない」という議論には間違いなく問題がありますが、このプロセスはまだポアソンであり、強度パラメーターは各人に固有であり、不明である(非喫煙者は非常に小さい強度)-そうですか?しかし、この状況はポアソンの仮定に違反していると主張することもできます。喫煙は、喫煙するタバコが1日(定期喫煙者の場合)またはクラスター(社会喫煙者の場合)に均等に分散する傾向があり、その結果、ばらばらの時間間隔は独立しません。だから、これはまだ良い例だと思う。
ナゲル14年

1
一定期間に捕獲された魚の数は、ZIPとZINBのより標準的な例だと思います。同様の引数。とはいえ、魚は消費率に中毒性の影響を与える可能性はありません。彼らは原因(私が知っている、私が知っている、 '、あなたのお母さんの魚以外のものは良い:)。
アレクシス14年

8

正のカウントデータを意味しますか?無制限?

負の二項分布が一般的です。

もう1つの優れたモデルは、0が膨らんだポアソンです。そのモデルは、何かが起こっているか、起きていないかを想定しています。私は最近例をみました。エイズ患者を治療した看護師は、エイズ患者との関わりの結果、他人からの非難行為をどのくらいの頻度で経験したかを尋ねられました。おそらく彼らが働いたり住んだりしたために、多くの人がそのような経験をしたことはありませんでした。そうした人々のうち、非難される経験の数はさまざまでした。基本的に、調査対象のグループの特定の割合が単にそのような行動にさらされた環境になかったため、ストレートポアソンから予想されるよりも多くの0が報告されました。

ポアソンの混合物もポイントプロセスを提供します。


(+1)ゼロ膨張ポアソン分布の場合。このモデルに関する議論はここ

1
単なる抽象的な分布ではなく、質問で言及されている状況の実際の例を提供するこれ(およびその他の回答)に+1します。このZIPの例は特に明確です。
whuber

1
答えた人たちの功績として、私の質問は最初はあまりにもずさんで、状況についてまったく言及していなかったことを指摘する必要があります。ゼロ膨張したポアソンが良い例であることに同意します。しかし、私は学部生に説明するのは少し複雑すぎるので、ポアソン分布ではモデル化できない単純な状況の例をまだ見ていません。
ナゲル

4

ポアソンではないプロセスを数えますか?さて、二項または離散ユニフォームのような有限のサンプル空間プロセス。指数関数的に分布する独立した到着間時間を持つイベントをカウントすることでポアソンのカウントプロセスを取得するため、ガンマまたは対数正規またはワイブル分布の到着間時間、またはあらゆる種類の抽象的なノンパラメトリックな到着間時間など、一般化のホスト全体が落ちます分布。


お返事ありがとうございます。最初は私の質問がとても不明瞭だったので非常に残念です。私は今それを明確にしました。非指数関数的および/または依存する到着間時間を持つプロセスについてあなたが言うことは理にかなっていますが、これらの特性を持つ状況の例はありますか?
ナゲル

4
あなたは賭けます!ヘルペスウイルスの発生間隔。実際にウイルスに感染する必要があるため、最初のアウトブレイクまでの時間がはるかに長くなります。その後のアウトブレイク間の到着時間は互いに独立していますが、インデックスのアウトブレイクに比べてはるかに速い速度です。非指数関数的な到着時間は標準です。生存分析で一般的に使用される分析方法は、コックス比例ハザードモデルです。このモデルでは、到着時間に関するパラメータの仮定を取り除きます。
AdamO

良い例え!これは、上記のプラキディアが言及したゼロ膨張ポアソンの別のインスタンスだと思いますか?
ナーゲル

4

プロセスをカウントするかどうかは不明です。

「teaching」タグを解釈して、ポアソンプロセスを教えていることを意味する場合、一般的なプロセスについて教えるために、ベルヌーイプロセスは、ポアソンプロセスに関連する説明および視覚化する簡単なランダムプロセスです。ベルヌーイ・プロセスは離散的なアナログなので、役に立つコンパニオンの概念になるかもしれません。連続時間ではなく、離散的な時間間隔があるというだけです。

例としては、私たちが購入をする家による成功を数えているドアツードアのセールスマンがあります。

  • 最初のn回の試行の成功数には、二項式があります
    、ポアソンではなく分布B(n、p)を持ちます。
  • r回成功するために必要な試行回数は、ガンマ分布ではなく負の二項分布NB(r、p)を持ちます。
  • 1つの成功、待機時間を得るために必要な試行回数には、指数分布の離散アナログである幾何分布NB(1、p)があります。

これが、BertsekasとTsitsiklisが「Introduction To Probability」第2版で使用するアプローチで、ポアソンプロセスの前にベルヌーイプロセスを導入しています。彼らの教科書には、ポアソンプロセスに適用可能なベルヌーイプロセスへの拡張があり、それらのマージやパーティション化、ソリューションの問題セットなどがあります。

ランダムなプロセスの例を探していて、そこに名前を放り出したいだけなら、かなりあります。

ガウス過程は、アプリケーションで重要なものです。特にガウス過程の一種であるワイナー過程は、標準ブラウン運動とも呼ばれ、金融および物理学に応用されています。


ご返信いただきありがとうございます。私の質問が当初はあまりにも不自然で不明瞭でした。私は今それを明確にしようとしました。ベルヌーイからポアソンへのリンクは興味深いものですが、私が探しているのは、ポアソン分布でモデル化するのに適していない連続時間の状況の例です。
ナゲル

3

プロパティ/カジュアルアクチュアリーとして、私は常に非ポアソンである離散プロセスの実例を扱っています。重大度が低く、頻度の低いビジネスラインの場合、ポアソン分布は1の分散対平均比を必要とするため、不適切です。上記の負の二項分布がより一般的に使用され、Delaporte分布は標準的な北米の保険数理実務ではそれほど頻繁ではありませんが、一部の文献で使用されています。

これがなぜそうなのかは、より深い質問です。負の二項式は、平均パラメーター自体がガンマ分布するポアソン過程を表すため、はるかに優れていますか?または、損失の発生は独立に失敗するためです(地震イベントは、地球が滑るのを長く待つほど、圧力の蓄積による可能性が高いという現在の理論の下で行われます)、非定常(間隔シーケンスに細分することはできません。各シーケンスは不均一であるため、不均一なポアソンを使用できます)、確かにいくつかの業種では同時発生が許可されます(たとえば、ポリシーの対象となる複数の医師による医療過誤)。


2

他の人は、ポアソンではないポイントプロセスのいくつかの例を言及しました。ポアソンは指数関数的な到着間時間に対応するため、指数関数的でない到着間時間分布を選択した場合、結果のポイントプロセスはポアソンではありません。AdamOはワイブルを指摘しました。可能な選択肢として、ガンマ、対数正規、またはベータを使用できます。

ポアソンには、平均が分散に等しいという性質があります。平均よりも大きい分散を持つポイントプロセスは、過剰分散と呼ばれることもあり、平均が分散よりも大きい場合は分散が不十分です。これらの用語は、プロセスをポアソンに関連付けるために使用されます。負の二項は、パラメーターに応じて過分散または過分散になる可能性があるため、よく使用されます。

ポアソンには一定の分散があります。一定の速度パラメーターを持たず、結果として時間変動する平均と分散を除いて、ポアソン条件に適合する点プロセスは、不均一ポアソンと呼ばれます。

到着間時間が指数関数的であるが、到着時に複数のイベントを持つことができるプロセスは、複合ポアソンと呼ばれます。ポアソン過程に似ていて、名前にポアソンという単語が含まれていますが、不均一および複合ポアソン過程はポアソン点過程とは異なります。


お返事ありがとうございます。私の質問が最初はあまりにも手間がかかり、不明瞭でした。私は今それを明確にしようとしました。非指数関数的および/または依存する到着間時間を伴うプロセスについて言及し、過剰および過小分散分布についてあなたが言うことは非常に興味深いが、これらの特性を持つ具体的な状況の例はありますか?シンプルな方が良い:)
Nagel

1
私自身の答えをしようとするのではなく、数え上げのプロセスを扱った本の中に、本当にたくさんの例が見つかると思います。負の二項回帰に関するJoe Hilbeの本をご覧になることをお勧めします。
マイケルR.チャーニック

2

非ポアソンカウンティングプロセスの別の興味深い例は、ゼロ切り捨てポアソン分布(ZTPD)で表されます。ZTPDは、被験者が生理学的条件で話すことができる言語の数に関するデータに適合できます。この例では、話されている言語の数は定義により> = 1であるため、ポアソン分布は不適切です。したがって、0は先験的に除外されます。


2

顧客到着ポアソンプロセスを利用して、2つの異なる方法で調整できると考えています。1)顧客到着は24時間測定されますが、実際には終日営業していない、2)競合する2つの店舗を想像してくださいポアソンは顧客の到着時間を処理し、2つの店舗への到着の差を調べます。(例#2は、Springer Handbook of Engineering Statistics、Part A Property 1.4の理解からです。)


1

サッカーの例を再考することをお勧めします。両チームの得点率は試合が進むにつれて増加し、チームが現在のスコアに応じて攻撃/防御の優先順位を変更すると変更されるようです。

むしろ、単純なモデルが驚くほどうまく機能する方法の例として使用し、何らかの現象の統計調査に関心を刺激し、矛盾を調査して詳細を提案するためにより多くのデータを収集する将来の研究のベンチマークを提供します。

ディクソン&ロビンソン(1998)、「協会のサッカーの試合のために誕生プロセスモデル」統計学者47、3。


サッカーの試合はポアソンではなかったという予感がありましたが、参考に感謝します:)
Nagel 14年

1

この質問はポアソン分布をより理解しやすくすることに関連しているので、コールセンターの着信コールパターン(時間の経過とともにメモリのない指数分布に従う)について最近調べたため、試してみます。

ポアソンの知識が本質的に必要な別の接線モデルを掘り下げて、それがどれほど複雑ではないかを理解するのは多少混乱するかもしれませんが、それは私だけです。

ポアソンを理解する上での問題は、継続的な時間軸であると思います--- 1秒ごとにイベントが発生する可能性は低くなります---しかし、あなたが行く先が遠くなるほど、それはより確実になりますハプニング。

本当に、「時間」軸を「試行」または「イベント」と交換するだけで理解が簡単になると思います。

これは簡単な説明だと感じているので、誰かが私を修正することができます、私はそれが簡単な説明だと思うので、私はあなたがコインのフリップまたはサイコロのトスを「電話が到着するまでの時間」(私が通常、Erlang C /コールセンターの人員配置に使用します)。

「電話が届くまでの時間」の代わりに、----「サイコロが6になるまで転がる」に置き換えることができます。

それは同じ一般的な論理に従います。確率(ギャンブルと同様)は、ロール(または分)ごとに完全に独立しており、メモリがありません。ただし、「no 6」の可能性は低下しますが、試行回数が増えるにつれて確実に0に向かっていきます。両方のグラフを見ると簡単です(時間のある呼び出しの可能性と、ロールのある6つの可能性)。

それが理にかなっているかどうかわかりません---それが具体的な用語にまとめるのに役立ちました。現在、ポアソン分布は、「呼び出し間の時間」や「6を出すまでの試行」ではなくカウントですが、この可能性に依存しています。


これが学生を混乱させる可能性があると思いますが、私の考えは、カウンターを持っている場合、時間間隔でレストランに到着する顧客の数がポアソンである理由を簡単に説明できるようにすることでした-連続時間の離散イベントがポアソンではない単純なプロセスの例。
ナゲル14年

1
多くの選択肢があると思います。明らかなパターンの1つは、発生する確率が増減するイベントです。いくつかの例を考えるのは難しい。おそらくあなたのキッチン/ピクニックに到着するアリ。最初のアリが到着するのにかかる時間は、おそらく2番目または3番目のアリよりもはるかに長く、もちろん、より多くのアリの到着は、将来のアリの到着の可能性が高いことを意味します(トレイル/相互の通信がある場合)。それがカウントされるかどうかはわかりません。
ジョンバブソン

1

特定の時間間隔内での個々の顧客による食料品店への訪問数。

食料品店に行った後、計画を間違えない限り、しばらく戻ってこないでしょう。

ここでは負の二項分布を使用できますが、訪問は連続時間であるのに対し、それは離散的です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.