結婚式に招待される人の決定が独立していると仮定すると、結婚式に来るゲストの数は、必ずしも同一の成功確率とは限らないベルヌーイ確率変数の合計としてモデル化できます。これは、ポアソン二項分布に対応します。
ましょ外のあなたの結婚式に来る者の合計数に対応するランダム変数であるN人物を招待。予想される参加者の数は、実際には個々の「ショーアップ」確率p iの合計、つまり
E (X )= N ∑ i = 1 p iです。
信頼区間の導出は、確率質量関数の形式を考えると簡単ではありません。ただし、モンテカルロシミュレーションでは簡単に近似できます。XNp私
E(X)= ∑i = 1Np私。
次の図は、10000人のシミュレートされたシナリオに基づいた結婚式への参加者数の分布の例を示しています(右)。このシミュレーションの実行に使用されるRコードを以下に示します。信頼区間の近似値を提供します。
## Parameters
N <- 230 # Number of potential guests
nb.sim <- 10000 # Number of simulations
## Create example of groups of guests with same show-up probability
set.seed(345)
tmp <- hist(rbeta(N, 3, 2), breaks = seq(0, 1, length.out = 21))
p <- tmp$breaks[-1] # Group show-up probabilities
n <- tmp$counts # Number of person per group
## Generate number of guests by group
guest.mat <- matrix(NA, nrow = nb.sim, ncol = length(p))
for (j in 1:length(p)) {
guest.mat[, j] <- rbinom(nb.sim, n[j], p[j])
}
## Number of guest per scenario
nb.guests <- apply(guest.mat, 1, sum)
## Result summary
par(mfrow = c(1, 2))
barplot(n, names.arg = p, xlab = "Probability group", ylab = "Group size")
hist(nb.guests, breaks = 21, probability = TRUE, main = "", xlab = "Guests")
par(mfrow = c(1, 1))
## Theoretical mean and variance
c(sum(n * p), sum(n * p * (1-p)))
#[1] 148.8500 43.8475
## Sample mean and variance
c(mean(nb.guests), var(nb.guests))
#[1] 148.86270 43.23657
## Sample quantiles
quantile(nb.guests, probs = c(0.01, 0.05, 0.5, 0.95, 0.99))
#1% 5% 50% 95% 99%
#133.99 138.00 149.00 160.00 164.00