さらに別の中心極限定理の質問


11

ましょう持つ独立したベルヌーイ・ランダム変数のシーケンスである セット 示すこと分布に収束する標準正規変数にとして無限大になる傾向があります。、P { X K = 1 } = 1 - P { X K = 0 } = 1{Xn:n1}Sn= n k=1Xk1

P{Xk=1}=1P{Xk=0}=1k.
Sn
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
ZnSnBnZn

私の試みはLyapunov CLTを使用することです。したがって、ような が存在することを示す必要がありますδ>0

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

したがって、n k = 1 E | X kk 1 | 3 = n k = 11δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
および
Bn3=(k=1n1k1k2)(k=1n1k1k2)

コンピューターで大きなnを評価することにより、k=1nE|Xkk1|3Bn3 などn。ただし、Bn3B_n ^ 2よりも速く増加するBn2ため、k=1nE|Xkk1|3Bn30ます。誰かがこの収束が成立することを証明するのを手伝ってくれる?


7
これは、Patrick Billingsleyによる確率と測定の例27.3です。
Zhanxiong 2016年

回答:


10

キュムラント生成関数の特性を利用して、第1原則と基本結果からこの結果を示すことは有益です(正確には、中心極限定理の標準的な証明と同じです)。一般化調和数 の成長率をについて理解する必要があり これらの成長率はよく知られており、積分と比較することで簡単に取得できます。これらは収束し、それ以外の場合は対数的に発散します。

H(n,s)=k=1nks
s=1,2,.1nxsdxs>1s=1

してみましょうと。定義により、のキュムラント生成関数(cgf)はn21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

右辺の級数展開は、周りのの展開から取得され、次の形式を取ります。z = 0log(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

分数の分子は、先行項持つ多項式です。ログ展開は完全に収束するため 、この展開は次の場合に絶対的に収束しますkkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

(場合は、どこにでも収束します。)固定と増加する値の、(明白な)発散は、絶対収束の領域が任意に大きくなることを意味します。したがって、固定で十分に大きい、この展開は絶対的に収束します。k=1knBntn

したがって、十分に大きい、項ごとにべき乗で個々のを合計して、 cgfを取得できます。nψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

の合計の項を1つずつ取得するには、次の値に比例する式を評価する必要がありますk

b(s,j)=1Bnjk=1nks

用及び。はじめに述べた一般化調和数の漸近を使用すると、j3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

それ

b(1,j)(log(n))1j/20

および()s>1

b(s,j)(log(n))j/20

大きくなります。その結果、を超えるの展開のすべての項はゼロに収束し、は任意の値について収束します。cgfの収束は特性関数の収束を意味するため、がcgfが 2/2である確率変数に近づくというレビ連続性定理から結論付けます。つまり、標準の正規変数QEDです。nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


この分析は、収束がどれほどデリケートであるかを明らかにします。一方、中心極限定理の多くのバージョンでは、係数は()ですが、ここでは係数は唯一:収束が非常に遅い。この意味で標準の変数の順序は、 "かろうじて"標準となります。tjO(n1j/2)j3O(((log(n))1j/2)

この遅い収束は、一連のシミュレーションで確認できます。 ヒストグラムは、 4つの値に対して回の独立した反復を表示します。赤い曲線は、視覚的な参照のための標準正規密度関数のグラフです。さらには、明らかに正常に向かって緩やかな傾向があるが(ここで、まだかなりある)歪度で証明されるようにかなりの非正規性が、依然として存在します(このサンプルではに等しい)。(このヒストグラムの歪度がに近いのは当然のことです。これはまさにcgfの項がそうであるためです。)105nn=1000(log(n))1/20.380.35(log(n))1/2t3

図:n = 30、100、300、1000のヒストグラム

これは、Rさらに実験したい人のためのコードです。

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}

6

あなたはすでに素晴らしい答えを持っています。自分の証明も完成させたい場合は、次のように主張できます。

のですべてのために収束とするための発散(ここでは)、我々は、書き込むことができますk=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

同じ議論により、

Bn2=k=1n1k+O(1).

その結果、、したがって、S(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

これが私たちが見せたかったものです。


2

まず、分布が依存する場合、確率変数は同じように分布しません;)k

また、私はあなたの表記を次のように使用しません:Bn

  • 通常、大文字は確率変数用に予約されています。
  • これは分散の合計なので、記号を含む表記を使用してこれを明確にします。σ

次に、質問については、これが演習なのか研究なのか、どのツールを使用できるのかわかりません。既知の定理を再証明しようとしないのであれば、これは、同一ではないが均一に制限された独立したRVの中心的な制限定理であり、1日と呼びます。良いソースは手元にありませんが、見つけるのはそれほど難しくありません。たとえば、https://mathoverflow.net/questions/29508/is-there-a-central-limit-theorem-を見てください。 for-bounded-non-identically-distributed-random

編集:私の悪いですが、もちろん均一な境界条件では十分ではありません。も必要です

k=1nσk2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.