キュムラント生成関数の特性を利用して、第1原則と基本結果からこの結果を示すことは有益です(正確には、中心極限定理の標準的な証明と同じです)。一般化調和数 の成長率をについて理解する必要があり これらの成長率はよく知られており、積分と比較することで簡単に取得できます。これらは収束し、それ以外の場合は対数的に発散します。
H(n 、s )= ∑k = 1んk− s
S = 1 、2 、... 。∫ん1バツ− sdバツs > 1s = 1
してみましょうと。定義により、のキュムラント生成関数(cgf)はN ≥ 21≤k≤n(Xk−1/k)/Bn
ψk,n(t)=logE(exp(Xk−1/kBnt))=−tkBn+log(1+−1+exp(t/Bn)k).
右辺の級数展開は、周りのの展開から取得され、次の形式を取ります。z = 0log(1+z)z=0
ψk,n(t)=(k−1)2k2B2nt2+k2−3k+26k3B3nt3+⋯+kj−1−⋯±(j−1)!j!kjBjntj+⋯.
分数の分子は、先行項持つ多項式です。ログ展開は完全に収束するため 、この展開は次の場合に絶対的に収束しますkkj−1∣∣−1+exp(t/Bn)k∣∣<1
|exp(t/Bn)−1|<k.
(場合は、どこにでも収束します。)固定と増加する値の、(明白な)発散は、絶対収束の領域が任意に大きくなることを意味します。したがって、固定で十分に大きい、この展開は絶対的に収束します。k=1knBntn
したがって、十分に大きい、項ごとにべき乗で個々のを合計して、 cgfを取得できます。nψk,nktSn/Bn
ψn(t)=∑k=1nψk,n(t)=12t2+⋯+1Bjn(∑k=1n(k−1−⋯±(j−1)!k−j))tjj+⋯.
の合計の項を1つずつ取得するには、次の値に比例する式を評価する必要がありますk
b(s,j)=1Bjn∑k=1nk−s
用及び。はじめに述べた一般化調和数の漸近を使用すると、j≥3s=1,2,…,j
B2n=H(n,1)−H(n,2)∼log(n)
それ
b(1,j)∼(log(n))1−j/2→0
および()s>1
b(s,j)∼(log(n))−j/2→0
大きくなります。その結果、を超えるの展開のすべての項はゼロに収束し、は任意の値について収束します。cgfの収束は特性関数の収束を意味するため、がcgfが 2/2である確率変数に近づくというレビ連続性定理から結論付けます。つまり、標準の正規変数QEDです。nψn(t)t2ψn(t)t2/2tSn/Bnt2/2
この分析は、収束がどれほどデリケートであるかを明らかにします。一方、中心極限定理の多くのバージョンでは、係数は()ですが、ここでは係数は唯一:収束が非常に遅い。この意味で標準の変数の順序は、 "かろうじて"標準となります。tjO(n1−j/2)j≥3O(((log(n))1−j/2)
この遅い収束は、一連のシミュレーションで確認できます。 ヒストグラムは、 4つの値に対して回の独立した反復を表示します。赤い曲線は、視覚的な参照のための標準正規密度関数のグラフです。さらには、明らかに正常に向かって緩やかな傾向があるが(ここで、まだかなりある)歪度で証明されるようにかなりの非正規性が、依然として存在します(このサンプルではに等しい)。(このヒストグラムの歪度がに近いのは当然のことです。これはまさにcgfの項がそうであるためです。)105nn=1000(log(n))−1/2≈0.380.35(log(n))−1/2t3
これは、R
さらに実験したい人のためのコードです。
set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
z <- colSums(x - 1/(1:n)) / B.n
hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}