中心極限定理(CLT)の古典的なステートメントは、共通の分布持つ一連の独立した、同一に分布した確率変数を考慮します。このシーケンスは、サンプリングプログラムまたは実験を設計するときに直面する状況をモデル化します。同じ基礎となる現象の独立した観測を取得できる場合、有限コレクションは予想されるデータをモデル化します。シーケンスを無限にすることは、任意の大きなサンプルサイズを想定するのに便利な方法です。F n X 1、X 2、… 、X nバツ1、X2、… 、Xん、…Fんバツ1、X2、… 、Xん
多数の法則により、平均は
m (X1、X2、… 、Xん)= 1ん(X1+ X2+ ⋯ + Xん)
密接の期待近づく、設け、高い確率で、実際に期待を持っています。(すべての分布がそうするわけではありません。)これは、偏差(これらの確率変数の関数として、確率変数でもある)が得られる傾向があることをしますが大きくなるほど小さくなります。CLTはこれをより具体的な方法で追加します:(いくつかの条件下では、以下で説明します)この偏差をで再スケーリングすると、いくつかのゼロに近づく分布関数なると述べていますとしての平均正規分布関数μ (F )FとM (X 1、X 2、... 、X N)- μ (F )N 、N √Fμ(F)Fm(X1,X2,…,Xn)−μ(F)nn F、N、N √n−−√Fnn大きくなる。(https://stats.stackexchange.com/a/3904での私の回答は、これがなぜであり、なぜ係数が使用に適しているのかを説明しようとしています。)n−−√
これはCLTの標準的なステートメントではありません。いつもとつなげましょう。ゼロ平均正規分布の制限は、2番目のパラメーターによって完全に決定されます。これは通常、分散や標準偏差など、その広がりの尺度として(自然に)選択されるものです。してみましょうその分散すること。確かに、同様のプロパティと何らかの関係があるはずです。これが何であるかを発見するために、分散持たせます- ところで、これは無限かもしれません。いずれにしても、は独立しているため、平均の分散を簡単に計算できます。 F F τ 2 X Iσ2FFτ2Xi
Var (m(X1,X2、… 、Xn))= Var (1ん(X1+X2+ ⋯ +Xん))= (1ん)2(Var (X1)+ Var (X2)+ ⋯ + Var (Xん))= (1ん)2(τ2+τ2+ ⋯ +τ2)=τ2ん。
したがって、標準化残差の分散が等しい:それは一定です。 したがって、限界正規分布の分散は自体でなければなりません。(これは、が有限の場合にのみ定理が成り立つことをすぐに示しています。これは、以前に説明した追加の仮定です。)τ2/ n×( n−−√)2= τ2τ2τ2
(私たちはの広がりのいずれかの他の尺度選択した場合は、我々はまだそれを接続することに成功できた、私たちは標準化平均偏差の広がりの対応策は、すべてのために一定であることが判明しなかったであろうあり、美しい-本質的ではない-簡素化。)Fσ2ん
もし望めば、平均偏差を割ったりを掛けたりすることで平均偏差を標準化できたでしょう。これにより、制限分散が標準分散であり、単位分散があります。この方法でによる標準化を選択するかどうかは、実際には好みの問題です。それは、同じ定理であり、最終的には同じ結論です。 重要なのはによる乗算でした。τん−−√τん−−√
偏差に以外の係数を掛けることができることに注意してください。、または、または同じように漸近的に動作するその他のものを使用できます。他の漸近形式は、限界で、をに減らすか、まで爆破します。この観察は、標準化がどのように実行されるかに関してCLTがどの程度柔軟であるかを示すことにより、CLTの評価を向上させます。CLTを次のように記述したい場合があります。ん−−√ん−−√+ exp(− n )ん1 / 2 + 1 / Nん−−√σ20∞
一連のIID変数の平均(共通の分布)と基になる期待値との偏差がによって漸近的にスケーリングされる、このスケーリングされた偏差は、分散がものであるゼロ平均正規制限分布になります。Fん−−√F
分散はステートメントに含まれますが、分散は、限界正規分布を特徴付け、その分散を分散に関連付けるために必要なためにのみ表示されます。これは単なる付随的な側面です。それは、分散がどのような意味でも「最高」であることとは関係ありません。問題の核心はによる漸近的な再スケーリングです。Fん−−√