ましょうλポアソン過程の速度を示すとlet S(x )= 1 − F(x )F(x )魚のサイズ分布の累積分布関数です。
してみましょうt = 0表す一日の終わりにしてみましょうg(t )、T ≤ 0区間で予想キャッチ表し、(t 、0 )最適な戦略を使用している場合、我々は入手を。明らかにg(0 )= 0です。また、時間tでサイズバツ魚を捕まえた場合、それを維持し、それがg (t )よりも大きい場合は釣りを停止する必要があります。これが決定ルールです。したがって、プロセスの実現と実現された決定(グリーンポイント)は次のようになります。tg(t )
確率的動的計画法のアイデアを使用して連続時間で作業すると、時間の逆方向のg(t )変化は、単純な微分方程式で記述されます。極小の時間間隔(t − dt 、t )考えます。我々はサイズの魚をキャッチする確率バツ> g(t )この時間には間隔がある
λ Dt S(g(t ))、
それ以外の場合は私たちの期待キャッチはなりg(t )。
、よりも大きい魚の平均サイズの式を使用g(t )E(X| バツ> g(t ))= g(t )+ 1S(g(t ))∫∞g(t )S(x )dx 。
(t − dt 、0 )g(t − dT )= [ λ Dt S(g(t ))] [ g(t )+ 1S(g(t ))∫∞g(t )S(x )dX ] + [ 1 - λ Dt S(g(t )] g(t )。
整理すると、ことがわかりますg(t)dgdt=−λ∫∞g(t)S(x)dx.(1)
g(t)λ∫∞0S(x)dx
X∼exp(α)S(x)=e−αxdgdt=−λαe−αg(t)
g(t)=1αln(1−λt),
t≤0α=λ=1g(−12)
g <- function(t,lambda, rate) {
1/rate*log(1-lambda*t)
}
catch <- function(daylength=12, lambda=1, rfn=runif, gfn=g, ...) {
n <- rpois(1,daylength*lambda)
starttime <- -daylength
arrivaltimes <- sort(runif(n,starttime,0))
X <- rfn(n,...)
j <- match(TRUE, X > gfn(arrivaltimes,lambda,...))
if (is.na(j))
0
else
X[j]
}
nsim <- 1e+5
catches <- rep(0,nsim)
for (i in 1:nsim)
catches[i] <- catch(gfn=g,rfn=rexp,rate=1,lambda=1)
> mean(catches)
[1] 2.55802
> g(-12,1,1)
[1] 2.564949
X∼U(0,1)g(t)=1−11−λt/2
g(t)t→−∞