デルタ方式の使い方はわかりませんが...
経験的分布関数の収束について読むと、中心極限定理によって次のことが得られることがわかります。
n−−√(F^n(x)−F(x))→N(0,F(x)(1−F(x)))
F^n(x)
F^n(x)±1.96F^n(x)(1−F^n(x))n
E(F^n(x))=F(x)F^n(x)F(x)
次のRコードを使用します。
#confidenc ebands calculation:
sim_norm<-rnorm(100)
plot(sim_norm)
hist(sim_norm)
sim_norm_sort<-sort(sim_norm)
n = sum(!is.na(sim_norm_sort))
plot(sim_norm_sort, (1:n)/n, type = 's', ylim = c(0, 1),
xlab = 'sample', ylab = '', main = 'Empirical Cumluative Distribution')
# Dvoretzky–Kiefer–Wolfowitz inequality:
# P ( sup|F_n - F| > epsilon ) leq 2*exp(-2n*epsilon^2)
# set alpha to 0.05 and alpha=2*exp(-2n*epsilon^2):
# --> epsilon_n = sqrt(-log(0.5*0.05)/(2*n))
#
#lower and upper bands:
L<-1:n
U<-1:n
epsilon_i = sqrt(log(2/0.05)/(2*n))
L=pmax(1:n/n-epsilon_i, 0)
U=pmin(1:n/n+epsilon_i, 1)
lines(sim_norm_sort, U, col="blue")
lines(sim_norm_sort, L, col="blue")
#using clt:
U2=(1:n/n)+1.96*sqrt( (1:n/n)*(1-1:n/n)/n )
L2=(1:n/n)-1.96*sqrt( (1:n/n)*(1-1:n/n)/n )
lines(sim_norm_sort, L2, col="red")
lines(sim_norm_sort, U2, col="red")
我々が得る:
(CLTメソッドからの)赤いバンドは、より狭い信頼バンドを提供することがわかります。
編集:@Kjetil B Halvorsenが指摘したように-これらの2つのタイプのバンドは異なるタイプです。@Glen_bに彼の意味を正確に説明してもらいました。
非常に異なる種類の信頼帯。点ごとの信頼帯を使用すると、たとえそれがデータの抽出元の分布であったとしても、帯の外側に多数の点が予想されます。同時バンドではそうはいきません。95%のポイントワイズバンドがある場合、正しい分布のポイントの平均5%がバンドの外側になります。同時バンドでは、偏差が最大のポイントが外側になる可能性が5%あります。
両方に感謝します!