回答:
あなたが質問している分布は、かなり複雑なpmfを持つポアソン二項分布と呼ばれます(より広い説明についてはWikipediaを参照してください)
一般に、問題は、いくつかのより多くの試行に対してこの方程式を使用できないことです(通常、試行の数がを超える)。pmfを計算する他の方法、たとえば再帰的な式もありますが、それらは数値的に不安定です。これらの問題を回避する最も簡単な方法は、近似法です(例:Hong、2013年)。定義すると
次に、少数の法則またはルカムの定理を介して、pmfをポアソン分布で近似できます。
しかし、それは一般的に二項近似がより良く振る舞うことを見ています(Choi and Xia、2002)
通常の近似を使用できます
またはcdfは、いわゆる洗練された正規近似を使用して近似できます(Volkova、1996)
ここで、です。
別の代替案は、もちろんモンテカルロシミュレーションです。
単純なdpbinom
R関数は
dpbinom <- function(x, prob, log = FALSE,
method = c("MC", "PA", "NA", "BA"),
nsim = 1e4) {
stopifnot(all(prob >= 0 & prob <= 1))
method <- match.arg(method)
if (method == "PA") {
# poisson
dpois(x, sum(prob), log)
} else if (method == "NA") {
# normal
dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
} else if (method == "BA") {
# binomial
dbinom(x, length(prob), mean(prob), log)
} else {
# monte carlo
tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
tmp <- tmp/sum(tmp)
p <- as.numeric(tmp[as.character(x)])
p[is.na(p)] <- 0
if (log) log(p)
else p
}
}
ほとんどのメソッド(およびそれ以上)は、R poibinパッケージにも実装されています。
チェン、LHY(1974)。ポアソン二項分布のポアソン分布への収束について。確率の記録、2(1)、178-180。
Chen、SXおよびLiu、JS(1997)。ポアソン-二項分布および条件付きベルヌーイ分布の統計的応用。Statistica Sinica 7、875-892。
チェン、SX(1993)。ポアソン二項分布、条件付きベルヌーイ分布、最大エントロピー。テクニカルレポート。ハーバード大学統計学科。
Chen、XH、Dempster、APおよびLiu、JS(1994)。エントロピーを最大化するための加重有限母集団サンプリング。Biometrika 81、457-469。
王、YH(1993)。独立した試験における成功の数について。Statistica Sinica 3(2):295-312。
Hong、Y.(2013)。ポアソン二項分布の分布関数の計算について。計算統計とデータ分析、59、41-51。
Volkova、AY(1996)。独立したランダム指標の合計の中心極限定理の改良。確率論とその応用40、791-794。
Choi、KPおよびXia、A.(2002)。独立した試験での成功数の概算:二項式対ポアソン。応用確率の年報、14(4)、1139-1148。
Le Cam、L.(1960)ポアソン二項分布の近似定理。Pacific Journal of Mathematics 10(4)、1181〜1197。