ポアソン分布を学生に説明するのに役立つように、ポアソン分布でモデル化するのに適さない状況の良い例を探しています。
ポアソン分布によってモデル化できる例として、ある時間間隔で店舗に到着する顧客の数を一般的に使用します。私は、同様の脈絡の反例を探しています。つまり、連続時間での正のカウントプロセスと見なすことができ、明らかにポアソンではない状況を探しています。
状況は、学生が把握して覚えやすくするために、理想的にはできるだけシンプルでわかりやすいものにする必要があります。
ポアソン分布を学生に説明するのに役立つように、ポアソン分布でモデル化するのに適さない状況の良い例を探しています。
ポアソン分布によってモデル化できる例として、ある時間間隔で店舗に到着する顧客の数を一般的に使用します。私は、同様の脈絡の反例を探しています。つまり、連続時間での正のカウントプロセスと見なすことができ、明らかにポアソンではない状況を探しています。
状況は、学生が把握して覚えやすくするために、理想的にはできるだけシンプルでわかりやすいものにする必要があります。
回答:
一定期間内に喫煙したタバコの数:全員がタバコを吸うわけではないため、これにはゼロ膨張プロセス(ゼロ膨張ポアソンまたはゼロ膨張負の二項式)が必要です。
正のカウントデータを意味しますか?無制限?
負の二項分布が一般的です。
もう1つの優れたモデルは、0が膨らんだポアソンです。そのモデルは、何かが起こっているか、起きていないかを想定しています。私は最近例をみました。エイズ患者を治療した看護師は、エイズ患者との関わりの結果、他人からの非難行為をどのくらいの頻度で経験したかを尋ねられました。おそらく彼らが働いたり住んだりしたために、多くの人がそのような経験をしたことはありませんでした。そうした人々のうち、非難される経験の数はさまざまでした。基本的に、調査対象のグループの特定の割合が単にそのような行動にさらされた環境になかったため、ストレートポアソンから予想されるよりも多くの0が報告されました。
ポアソンの混合物もポイントプロセスを提供します。
ポアソンではないプロセスを数えますか?さて、二項または離散ユニフォームのような有限のサンプル空間プロセス。指数関数的に分布する独立した到着間時間を持つイベントをカウントすることでポアソンのカウントプロセスを取得するため、ガンマまたは対数正規またはワイブル分布の到着間時間、またはあらゆる種類の抽象的なノンパラメトリックな到着間時間など、一般化のホスト全体が落ちます分布。
プロセスをカウントするかどうかは不明です。
「teaching」タグを解釈して、ポアソンプロセスを教えていることを意味する場合、一般的なプロセスについて教えるために、ベルヌーイプロセスは、ポアソンプロセスに関連する説明および視覚化する簡単なランダムプロセスです。ベルヌーイ・プロセスは離散的なアナログなので、役に立つコンパニオンの概念になるかもしれません。連続時間ではなく、離散的な時間間隔があるというだけです。
例としては、私たちが購入をする家による成功を数えているドアツードアのセールスマンがあります。
これが、BertsekasとTsitsiklisが「Introduction To Probability」第2版で使用するアプローチで、ポアソンプロセスの前にベルヌーイプロセスを導入しています。彼らの教科書には、ポアソンプロセスに適用可能なベルヌーイプロセスへの拡張があり、それらのマージやパーティション化、ソリューションの問題セットなどがあります。
ランダムなプロセスの例を探していて、そこに名前を放り出したいだけなら、かなりあります。
ガウス過程は、アプリケーションで重要なものです。特にガウス過程の一種であるワイナー過程は、標準ブラウン運動とも呼ばれ、金融および物理学に応用されています。
プロパティ/カジュアルアクチュアリーとして、私は常に非ポアソンである離散プロセスの実例を扱っています。重大度が低く、頻度の低いビジネスラインの場合、ポアソン分布は1の分散対平均比を必要とするため、不適切です。上記の負の二項分布がより一般的に使用され、Delaporte分布は標準的な北米の保険数理実務ではそれほど頻繁ではありませんが、一部の文献で使用されています。
これがなぜそうなのかは、より深い質問です。負の二項式は、平均パラメーター自体がガンマ分布するポアソン過程を表すため、はるかに優れていますか?または、損失の発生は独立に失敗するためです(地震イベントは、地球が滑るのを長く待つほど、圧力の蓄積による可能性が高いという現在の理論の下で行われます)、非定常(間隔シーケンスに細分することはできません。各シーケンスは不均一であるため、不均一なポアソンを使用できます)、確かにいくつかの業種では同時発生が許可されます(たとえば、ポリシーの対象となる複数の医師による医療過誤)。
他の人は、ポアソンではないポイントプロセスのいくつかの例を言及しました。ポアソンは指数関数的な到着間時間に対応するため、指数関数的でない到着間時間分布を選択した場合、結果のポイントプロセスはポアソンではありません。AdamOはワイブルを指摘しました。可能な選択肢として、ガンマ、対数正規、またはベータを使用できます。
ポアソンには、平均が分散に等しいという性質があります。平均よりも大きい分散を持つポイントプロセスは、過剰分散と呼ばれることもあり、平均が分散よりも大きい場合は分散が不十分です。これらの用語は、プロセスをポアソンに関連付けるために使用されます。負の二項は、パラメーターに応じて過分散または過分散になる可能性があるため、よく使用されます。
ポアソンには一定の分散があります。一定の速度パラメーターを持たず、結果として時間変動する平均と分散を除いて、ポアソン条件に適合する点プロセスは、不均一ポアソンと呼ばれます。
到着間時間が指数関数的であるが、到着時に複数のイベントを持つことができるプロセスは、複合ポアソンと呼ばれます。ポアソン過程に似ていて、名前にポアソンという単語が含まれていますが、不均一および複合ポアソン過程はポアソン点過程とは異なります。
サッカーの例を再考することをお勧めします。両チームの得点率は試合が進むにつれて増加し、チームが現在のスコアに応じて攻撃/防御の優先順位を変更すると変更されるようです。
むしろ、単純なモデルが驚くほどうまく機能する方法の例として使用し、何らかの現象の統計調査に関心を刺激し、矛盾を調査して詳細を提案するためにより多くのデータを収集する将来の研究のベンチマークを提供します。
ディクソン&ロビンソン(1998)、「協会のサッカーの試合のために誕生プロセスモデル」統計学者、47、3。
この質問はポアソン分布をより理解しやすくすることに関連しているので、コールセンターの着信コールパターン(時間の経過とともにメモリのない指数分布に従う)について最近調べたため、試してみます。
ポアソンの知識が本質的に必要な別の接線モデルを掘り下げて、それがどれほど複雑ではないかを理解するのは多少混乱するかもしれませんが、それは私だけです。
ポアソンを理解する上での問題は、継続的な時間軸であると思います--- 1秒ごとにイベントが発生する可能性は低くなります---しかし、あなたが行く先が遠くなるほど、それはより確実になりますハプニング。
本当に、「時間」軸を「試行」または「イベント」と交換するだけで理解が簡単になると思います。
これは簡単な説明だと感じているので、誰かが私を修正することができます、私はそれが簡単な説明だと思うので、私はあなたがコインのフリップまたはサイコロのトスを「電話が到着するまでの時間」(私が通常、Erlang C /コールセンターの人員配置に使用します)。
「電話が届くまでの時間」の代わりに、----「サイコロが6になるまで転がる」に置き換えることができます。
それは同じ一般的な論理に従います。確率(ギャンブルと同様)は、ロール(または分)ごとに完全に独立しており、メモリがありません。ただし、「no 6」の可能性は低下しますが、試行回数が増えるにつれて確実に0に向かっていきます。両方のグラフを見ると簡単です(時間のある呼び出しの可能性と、ロールのある6つの可能性)。
それが理にかなっているかどうかわかりません---それが具体的な用語にまとめるのに役立ちました。現在、ポアソン分布は、「呼び出し間の時間」や「6を出すまでの試行」ではなくカウントですが、この可能性に依存しています。
特定の時間間隔内での個々の顧客による食料品店への訪問数。
食料品店に行った後、計画を間違えない限り、しばらく戻ってこないでしょう。
ここでは負の二項分布を使用できますが、訪問は連続時間であるのに対し、それは離散的です。