ウィキペディアによると-
確率理論では、中心極限定理(CLT)は、ほとんどの場合、独立したランダム変数が追加されると、元の変数自体ではなくても、適切に正規化された合計が正規分布(非公式に「ベル曲線」)になる傾向があることを確立します正規分布しています...
「ほとんどの状況で」と書かれている場合、どのような状況で中心極限定理は機能しませんか?
ウィキペディアによると-
確率理論では、中心極限定理(CLT)は、ほとんどの場合、独立したランダム変数が追加されると、元の変数自体ではなくても、適切に正規化された合計が正規分布(非公式に「ベル曲線」)になる傾向があることを確立します正規分布しています...
「ほとんどの状況で」と書かれている場合、どのような状況で中心極限定理は機能しませんか?
回答:
これを理解するには、最初に中央極限定理のバージョンを述べる必要があります。中心極限定理の「典型的な」声明は次のとおりです。
Lindeberg–Lévy CLT。仮定とIIDランダム変数のシーケンスであると。してみましょう。次に、 が無限に近づくと、ランダム変数正常に分布で収束、すなわち
それで、これは非公式の記述とどのように違いますか、そしてギャップは何ですか?非公式の説明とこの説明にはいくつかの違いがあり、そのいくつかは他の回答で説明されていますが、完全ではありません。したがって、これを3つの特定の質問に変えることができます。
これらを一度に取って、
同一の分布ではありません。最良の一般的な結果は、中心極限定理のリンデベルグとリアポノフのバージョンです。基本的に、標準偏差が過度に大きくならない限り、そこから適切な中心極限定理を得ることができます。
リアプノフCLT。[5] 仮定の独立した確率変数の列があり、有限の持つそれぞれが期待値をμ Iと分散σ 2が 定義:S 2 のn = Σ N iが= 1つの σ 2 Iを
もしいくつかのための、リアプノフの条件 LIM のn → ∞ 1を満足することにより、その後の和 XI-μI/sのN 標準正規確率変数の分布に収束する、nが無限大に向かうにつれて:
中心分散定理と同様の無限分散定理は、無限分散を持つ変数に対して存在しますが、条件は通常の中心極限定理よりもかなり狭くなります。本質的に、確率分布のテールはに漸近的でなければなりません。x | - α - 1用0 < α < 2。この場合、適切にスケーリングされた被加数は、レビー-アルファ安定分布に収束します。
独立性の重要性非独立シーケンスには、多くの異なる中心極限定理があります。それらはすべて非常に文脈的です。バットマンが指摘しているように、マーティンゲールズに1つあります。 この質問は現在進行中の研究分野であり、関心のある特定の状況に応じて多くの異なるバリエーションがあります。 この質問数学取引所には、この質問に関連した別のポストです。
以前に回答されたことは確かですが、もう1つあります。
中心極限定理にはいくつかのバージョンがあります。最も一般的なのは、任意の確率密度関数が与えられると、変数の合計が平均値と平均値の合計に等しい分布になり、分散が合計になることです。個々の分散の。
非常に重要で関連する制約は、与えられたpdfの平均と分散が存在しなければならず、有限でなければならないということです。
したがって、平均値または分散のない任意のpdfを取得するだけで、中心極限定理はもはや成り立たなくなります。たとえば、ローレンツ分布を考えてみましょう。
いいえ、CLTはその仮定が成り立つときは常に成り立ちます。「ほとんどの状況で」などの資格は、CLTが適用される条件への非公式の参照です。
たとえば、コーシー分布からの独立変数の線形結合は、正規分布変数に加算されません。理由の1つは、Cauty分布の分散が未定義であるのに対し、CLTは分散に特定の条件を課すことです。たとえば、有限である必要があります。興味深い意味として、モンテカルロシミュレーションはCLTによって動機付けられているため、コーシーなどの太い尾を持つ分布を扱う場合は、モンテカルロシミュレーションに注意する必要があります。
CLTの一般化バージョンがあることに注意してください。コーシー分布など、無限または未定義の分散に対して機能します。多くの良好な動作分布とは異なり、適切に正規化されたコーシー数の合計はコーシーのままです。ガウスに収束しません。
ちなみに、ガウス分布だけでなく、他の多くの分布にはベル型のPDFがあります(例:Student t)。だからあなたが引用した説明は、たぶん故意に、かなりリベラルで不正確です。
これがケルビムの答えの実例です。1e5のヒストグラムはスケーリングされた( )分散が存在しないような、2つの自由度を持つt分布のサンプル平均.
CLTが適用された場合、 as large as should resemble the density of a standard normal distribution (which, e.g., has density at its peak), which it evidently does not.
library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")
sd(x)
to get something which, if the CLT works, converges by Slutzky's theorem, to a N(0,1) variate. I wanted to keep the example simple, but you are of course right.
A simple case where the CLT cannot hold for very practical reasons, is when the sequence of random variables approaches its probability limit strictly from the one side. This is encountered for example in estimators that estimate something that lies on a boundary.
The standard example here perhaps is the estimation of in a sample of i.i.d. Uniforms . The maximum likelihood estimator will be the maximum order statistic, and it will approach necessarily only from below: naively thinking, since its probability limit will be , the estimator cannot have a distribution "around" - and the CLT is gone.
The estimator properly scaled does have a limiting distribution - but not of the "CLT variety".
You can find a quick solution here.
Exceptions to the central-limit theorem arise
There are certain other exceptions which are outlined in the answer of @cherub.
The same question has already been asked on math.stackexchange. You can check the answers there.