TEDでのPeter Donnellyの講演に触発され、特定のパターンが一連のコイントスに現れるまでにかかる時間について議論し、Rで次のスクリプトを作成しました。これらのパターンのいずれかにヒットするまでに平均で要する時間(つまり、コインを投げる回数)を計算します。
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
要約統計は次のとおりです。
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
トークでは、コイン投げの平均回数は2つのパターンで異なると説明されています。私のシミュレーションからわかるように。何回かこの講演を見ていたのに、なぜそうなのか、まだよくわかりません。「hth」はそれ自体と重なり、直感的には「hth」よりも早く「hth」を打つと思いますが、そうではありません。誰かが私にこれを説明できれば本当に感謝しています。