この答えは、簡単な微積分法(3次のテイラー展開)を使用して、中心極限定理の直感的な意味を与えることを望んでいます。概要は次のとおりです。
- CLTの言うこと
- 単純な計算を使用したCLTの直感的な証明
- なぜ正規分布なのか?
最後に正規分布について言及します。正規分布が最終的に現れるという事実は、あまり直感的ではないからです。
1.中心極限定理は何と言っていますか?CLTのいくつかのバージョン
xX1,⋯,Xn
P(X1+⋯+Xnn−−√≤x)→n→+∞∫x−∞e−t2/22π−−√dt.
X1.,…,XnZ1,…,ZnE[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0
fxf(t)={1 if t<x0 if t≥x.
X1,…,XnZ1,…,Zn、ランダム変数が平均ゼロ、分散1で独立している場合。
kX1,…,XnZ1,…,Znf
E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0(CONV)
以下のステートメント間で同等性(「if and only if」)を確立することができます。
- ff(t)=1t<xf(t)=0t≥xx
- f:R→R
- C∞
- fsupx∈R|f′′′(x)|≤1
上記の4つの各点は、大規模なクラスの関数に対して収束が成立することを示しています。技術的な近似の議論により、上記の4つのポイントが同等であることを示すことができます。DavidPollardの著書Aユーザーガイドの77ページの第7章を参照して、この答えが非常に刺激された理論的確率を測定してください。
この答えの残りの私たちの仮定...
と仮定します 上記のポイント4に対応する定数。また、ランダム変数には有限の制限された3次モーメントがあると仮定しますおよび
は有限です。supx∈R|f′′′(x)|≤CC>0E[|Xi|3]E[|Zi|3]
2.は普遍的です:分布に依存しませんE[f(X1+⋯+Xnn√)]X1,...,Xn
独立したランダム変数のどのコレクションが提供されたかに依存しないという意味で、この量が普遍的であることを示しましょう(小さな誤差項まで)。テイクと独立した確率変数の二つの配列、平均0、分散1、および有限の第三モーメントがそれぞれに。X1,…,XnZ1,…,Zn
アイデアは、量の1つでをで繰り返し置き換え、基本的な計算によって違いを制御することです(このアイデアはLindebergによるものだと思います)。テイラー展開により、で、場合、
ここでおよびXiZiW=Z1+⋯+Zn−1h(x)=f(x/n−−√)h(Z1+⋯+Zn−1+Xn)h(Z1+⋯+Zn−1+Zn)=h(W)+Xnh′(W)+X2nh′′(W)2+X3n/h′′′(Mn)6=h(W)+Znh′(W)+Z2nh′′(W)2+Z3nh′′′(M′n)6
MnM′nは、平均値定理によって与えられる中間点です。と独立性により、および2行目も同様です。再び独立性により、二次項は予想と同じです。残りの用語は3次のものだけであり、2行の差は最大で
ここで、は 3次導関数の上限です。分母が表示されるのは、XnWE[Xnh′(W)]=E[Xn]E[h′(W)]=0
(C/6)E[|Xn|3+|Zn|3](n−−√)3.
Cf′′′(n−−√)3h′′′(t)=f′′′(t/n−−√)/(n−−√)3。
独立性により、合計におけるの寄与は無意味です。これは、上記の表示よりも大きなエラーをことなくに置き換えることができるためです。XnZn
をに置き換えることを繰り返します。もし次いで
の独立性によりと、との独立性により、とXn−1Zn−1W~=Z1+Z2+⋯+Zn−2+Xnh(Z1+⋯+Zn−2+Xn−1+Xn)h(Z1+⋯+Zn−2+Zn−1+Xn)=h(W~)+Xn−1h′(W~)+X2n−1h′′(W~)2+X3n−1/h′′′(M~n)6=h(W~)+Zn−1h′(W~)+Z2n−1h′′(W~)2+Z3n−1/h′′′(M~n)6.
Zn−1W~Xn−1W~、再び、0次、1次、および2次の項は、両方の行の期待値で等しいです。2行間の期待値の差は、多くても
すべてのを置き換えるまで繰り返します。ステップのそれぞれで行われたエラーを追加することにより、を取得します
として
(C/6)E[|Xn−1|3+|Zn−1|3](n−−√)3.
ZiXin∣∣E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]∣∣≤n(C/6)maxi=1,…,nE[|Xi|3+|Zi|3](n−−√)3.
nまたはランダム変数の3番目のモーメントが有限である場合、右辺は任意に小さくなります(そうだと仮定しましょう)。これは、分布がの分布から離れていても、左側の期待値が互いに任意に近いことをます。
独立性により、合計内の各の寄与は、より大きいエラーを発生さことなくに置き換えることができるため、無意味です。
そして、すべての置換「での s」は以上に量を変化させない。
X1,…,XnZ1,…,ZnXiZiO(1/(n−−√)3)XiZiO(1/n−−√)
したがって、期待値は普遍的であり、分布に依存しません。一方、独立性とは、上記の境界にとって最も重要でした。E[f(X1+⋯+Xnn√)]X1,…,XnE[Xi]=E[Zi]=0,E[Z2i]=E[X2i]=1
3.なぜ正規分布なのですか?
期待値は、の分布が何であれ、同じであることがました。オーダー小さなエラー。E[f(X1+⋯+Xnn√)]XiO(1/n−−√)
しかし、アプリケーションの場合、そのような量を計算すると便利です。この量より単純な式を取得することも有用です。E[f(X1+⋯+Xnn√)]
この量はどのコレクションでも同じであるため、分布が計算しやすく、または覚えやすいように、特定のコレクションを1つ選択するだけです。X1,…,Xn(X1+⋯+Xn)/n−−√
正規分布場合、この量は本当に単純になることがあります。実際、が場合、も分布を持ち、依存しません!したがって、場合、
そして独立確率変数の任意のコレクションのための上記の引数によってと、次いでN(0,1)Z1,…,ZnN(0,1)Z1+⋯+Znn√N(0,1)nZ∼N(0,1)
E[f(Z1+⋯+Znn−−√)]=E[f(Z)],
X1,…,XnE[Xi]=0,E[X2i]=1
∣∣∣E[f(X1+⋯+Xnn−−√)]−E[f(Z)∣∣∣≤supx∈R|f′′′(x)|maxi=1,…,nE[|Xi|3+|Z|3]6n−−√.