ウィキペディアには、多くの確率分布と各分布の詳細へのリンクをリストしたページがあります。リストを調べてリンクをたどると、さまざまなディストリビューションが一般的に使用されているアプリケーションの種類をよりよく把握できます。
これらの分布は、現実をモデル化するために使用されることを覚えておいてください。Boxが言ったように、「すべてのモデルは間違っています。一部のモデルは有用です」。
一般的なディストリビューションのいくつかと、それらが役立つ理由のいくつかを以下に示します。
通常:これは、CLTがあるため、平均および他の線形の組み合わせ(回帰係数など)を調べるのに役立ちます。それに関連するのは、多くの異なる小さな原因の相加効果により何かが発生することがわかっている場合、正規分布は合理的な分布になる可能性があります。たとえば、多くの生物学的測定値は、複数の遺伝子と複数の環境要因の結果であり、そのため、多くの場合、ほぼ正常です。
ガンマ:0の自然な最小値を持つものに適しています。一般的に経過時間といくつかの金融変数に使用されます。
指数:ガンマの特別な場合。メモリがなく、簡単に拡張できます。
χ2
ベータ:0から1の間で定義されます(ただし、他の値の間になるように変換できます)。0から1の間でなければならないプロポーションまたは他の量に役立ちます。
二項式:同じ数の「成功」の確率を持つ独立した試行の特定の数のうちの「成功」の数。
ポアソン:カウントに共通。期間またはエリア内のイベントの数がポアソンに続く場合、時間またはエリアの2倍の数がまだポアソンに続く(平均が2倍):これは、ポアソンの追加または値以外のスケーリングで機能します2。
イベントが時間の経過とともに発生し、発生間の時間が指数関数に従う場合、期間に発生する数はポアソンに続くことに注意してください。
負の二項:最小0(またはバージョンに応じて他の値)でカウントされ、上限はありません。概念的には、k回の「成功」の前の「失敗」の数です。負の二項分布は、平均がガンマ分布に由来するポアソン変数の混合物でもあります。
幾何学的:負の二項の特別な場合で、最初の「成功」の前の「失敗」の数です。指数変数を切り捨てて(切り捨てて)離散化すると、結果は幾何学的になります。
EstimatedDistribution
関数のヘルプページの「アプリケーション」で説明しています。