中心極限定理が成り立たない例はありますか？

32

ウィキペディアによると-

確率理論では、中心極限定理（CLT）は、ほとんどの場合、独立したランダム変数が追加されると、元の変数自体ではなくても、適切に正規化された合計が正規分布（非公式に「ベル曲線」）になる傾向があることを確立します正規分布しています...

「ほとんどの状況で」と書かれている場合、どのような状況で中心極限定理は機能しませんか？

33

これを理解するには、最初に中央極限定理のバージョンを述べる必要があります。中心極限定理の「典型的な」声明は次のとおりです。

Lindeberg–Lévy CLT。仮定 ${X_1, X_2, \dots}$ とIIDランダム変数のシーケンスである $E[X_i] = \mu$ と $Var[X_i] = \sigma^2 < \infty$ 。してみましょう $S_{n}:={\frac {X_{1}+\cdots +X_{n}}{n}}$ 。次に、 $n$ が無限に近づくと、ランダム変数 $\sqrt{n}(S_n − \mu)$ 正常に分布で収束 $N(0,\sigma^2)$ 、すなわち

$\sqrt{n} ((\frac{1}{n} \sum_{i = 1}^{n} X_{i}) - μ) \overset{d}{\to} N (0, σ^{2}) .$ ${\displaystyle {\sqrt {n}}\left(\left({\frac {1}{n}}\sum _{i=1}^{n}X_{i}\right)-\mu \right)\ {\xrightarrow {d}}\ N\left(0,\sigma ^{2}\right).}$

それで、これは非公式の記述とどのように違いますか、そしてギャップは何ですか？非公式の説明とこの説明にはいくつかの違いがあり、そのいくつかは他の回答で説明されていますが、完全ではありません。したがって、これを3つの特定の質問に変えることができます。

変数が同じように分布していない場合はどうなりますか？
変数が無限分散または無限平均を持っている場合はどうなりますか？
独立はどれほど重要ですか？

これらを一度に取って、

同一の分布ではありません。最良の一般的な結果は、中心極限定理のリンデベルグとリアポノフのバージョンです。基本的に、標準偏差が過度に大きくならない限り、そこから適切な中心極限定理を得ることができます。

リアプノフCLT。[5] 仮定の独立した確率変数の列があり、有限の持つそれぞれが期待値をと分散定義： ${X_1, X_2, \dots}$ $\mu_i$ $\sigma^2$ $s_{n}^{2}=\sum _{i=1}^{n}\sigma _{i}^{2}$

もしいくつかのための、リアプノフの条件 $\delta > 0$ を満足することにより、その後の和標準正規確率変数の分布に収束する、nが無限大に向かうにつれて： $\lim _{n\to \infty }{\frac {1}{s_{n}^{2+\delta }}}\sum_{i=1}^{n}\operatorname {E} \left[|X_{i}-\mu _{i}|^{2+\delta }\right]=0$ $X_i − \mu_i / s_n$

${{\frac {1}{s_{n}}}\sum _{i=1}^{n}\left(X_{i}-\mu_{i}\right)\ {\xrightarrow {d}}\ N(0,1).}$

中心分散定理と同様の無限分散定理は、無限分散を持つ変数に対して存在しますが、条件は通常の中心極限定理よりもかなり狭くなります。本質的に、確率分布のテールはに漸近的でなければなりません用。この場合、適切にスケーリングされた被加数は、レビー-アルファ安定分布に収束します。 $|x|^{-\alpha-1}$ $0 < \alpha < 2$

独立性の重要性非独立シーケンスには、多くの異なる中心極限定理があります。それらはすべて非常に文脈的です。バットマンが指摘しているように、マーティンゲールズに1つあります。この質問は現在進行中の研究分野であり、関心のある特定の状況に応じて多くの異なるバリエーションがあります。この質問数学取引所には、この質問に関連した別のポストです。 $X_i$

— ジョン
ソース

2

クォートシステムのために入り込んだと思われるフォーミュラから、迷っている「>」を削除しました。意図的に編集した場合は、自由に編集を元に戻してください。

— シルバーフィッシュ

三角配列のCLTは、おそらく、説明されているものよりも代表的なCLTです。独立していない場合については、マルチンゲールCLTがかなり一般的に使用されています。

— バットマン

@Batman、三角配列CLTの例は何ですか？回答を自由に編集して追加してください。私はそれをよく知らない。

— ジョン

秒のようなもの。4.2.3 in personal.psu.edu/drh20/asymp/lectures/p93to100.pdf

— バットマン

1

"長いように、標準偏差はあまりにも乱暴に成長しないよう"または縮小（例：

）

σ_{i}^{2} = σ_{i - 1}^{2} / 2

$\sigma_i^2 = \sigma_{i-1}^2/2$

— leonbloy

21

以前に回答されたことは確かですが、もう1つあります。

中心極限定理にはいくつかのバージョンがあります。最も一般的なのは、任意の確率密度関数が与えられると、変数の合計が平均値と平均値の合計に等しい分布になり、分散が合計になることです。個々の分散の。

非常に重要で関連する制約は、与えられたpdfの平均と分散が存在しなければならず、有限でなければならないということです。

したがって、平均値または分散のない任意のpdfを取得するだけで、中心極限定理はもはや成り立たなくなります。たとえば、ローレンツ分布を考えてみましょう。

— 天使
ソース

+1または、ランダムウォークの分布のように、無限分散の分布を取ります。

— アレクシス

2

合計である、あなたが時間内に有限時点でのランダムウォークを見ている、私はそれが有限の分散を持っているだろうと思っているだろうと仮定- @Alexis

有限の分散を持つIIDのステップごと

n

$n$

— ヘンリー

1

@Henry：いいえ、ある時点では想定していませんが、無限の長さのすべての可能なランダムウォークの分布の分散を想定しています。

— アレクシス

1

X_{i}

$X_i$

+ 1

$+1$

- 1

$-1$

Y_{n} = \sum_{1}^{n} X_{i}

$Y_n =\sum_1^n X_i$

n \to \infty

$n \to \infty$

\sqrt{n} (\frac{1}{n} Y_{n}) = \frac{Y_{n}}{\sqrt{n}}

$\sqrt{n}\left(\frac1n Y_n\right) = \frac{Y_n}{\sqrt{n}}$

N (0, 1)

$\mathcal N(0,1)$

1

@AlexisはCLTには関係ありません。個々の分布には依然として有限の分散があるためです。

— キュービック

15

いいえ、CLTはその仮定が成り立つときは常に成り立ちます。「ほとんどの状況で」などの資格は、CLTが適用される条件への非公式の参照です。

たとえば、コーシー分布からの独立変数の線形結合は、正規分布変数に加算されません。理由の1つは、Cauty分布の分散が未定義であるのに対し、CLTは分散に特定の条件を課すことです。たとえば、有限である必要があります。興味深い意味として、モンテカルロシミュレーションはCLTによって動機付けられているため、コーシーなどの太い尾を持つ分布を扱う場合は、モンテカルロシミュレーションに注意する必要があります。

CLTの一般化バージョンがあることに注意してください。コーシー分布など、無限または未定義の分散に対して機能します。多くの良好な動作分布とは異なり、適切に正規化されたコーシー数の合計はコーシーのままです。ガウスに収束しません。

ちなみに、ガウス分布だけでなく、他の多くの分布にはベル型のPDFがあります（例：Student t）。だからあなたが引用した説明は、たぶん故意に、かなりリベラルで不正確です。

— Aksakal
ソース

7

これがケルビムの答えの実例です。1e5のヒストグラムはスケーリングされた（ $\sqrt{n}$ ）分散が存在しないような、2つの自由度を持つt分布のサンプル平均.

CLTが適用された場合、 $n$ as large as $n=1000$ should resemble the density of a standard normal distribution (which, e.g., has density $1/\sqrt{2\pi}\approx0.4$ at its peak), which it evidently does not.

library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")

— Christoph Hanck
ソース

3

You have to be slightly careful here as if you did this with a

t

$t$ -distribution with say

3

$3$ degrees of freedom then the Central Limit theorem would apply but your graph would not have a peak density around

0.4

$0.4$ but instead around

\frac{1}{\sqrt{6 π}} \approx 0.23

$\frac1{\sqrt{6\pi}}\approx 0.23$ because the original variance would not be

1

$1$

— Henry

That is a good point, one might standardize the mean by sd(x) to get something which, if the CLT works, converges by Slutzky's theorem, to a N(0,1) variate. I wanted to keep the example simple, but you are of course right.

— Christoph Hanck

6

A simple case where the CLT cannot hold for very practical reasons, is when the sequence of random variables approaches its probability limit strictly from the one side. This is encountered for example in estimators that estimate something that lies on a boundary.

The standard example here perhaps is the estimation of $\theta$ in a sample of i.i.d. Uniforms $U(0,\theta)$ . The maximum likelihood estimator will be the maximum order statistic, and it will approach $\theta$ necessarily only from below: naively thinking, since its probability limit will be $\theta$ , the estimator cannot have a distribution "around" $\theta$ - and the CLT is gone.

The estimator properly scaled does have a limiting distribution - but not of the "CLT variety".

— Alecos Papadopoulos
ソース

3

You can find a quick solution here.

Exceptions to the central-limit theorem arise

When there are multiple maxima of the same height, and
Where the second derivative vanishes at the maximum.

There are certain other exceptions which are outlined in the answer of @cherub.

The same question has already been asked on math.stackexchange. You can check the answers there.

— Ferdi
ソース

5

By "maxima", do you mean modes? Being bimodal has nothing to do with failing to satisfy CLT.

— Acccumulation

@Acccumulation: The wording here is confusing because it actually refers to the PGF of a discrete r.v.

M (z) = \sum_{n = - \infty}^{\infty} P (X = n) z^{n}

$M(z)=\sum_{n=-\infty}^\infty P(X=n)z^n$

— Alex R.

@AlexR. The answer doesn't make sense at all without reading through the link, and is far from clear even with the link. I'm leaning towards downvoting as being even worse than a link-only answer.

— Acccumulation