ここでない中心極限定理(CLT)でから来ますか?


36

以下のような中央限定定理の非常に単純なバージョン これはLindeberg–Lévy CLTです。左側にがある理由がわかりません。そして、リアプノフCLTはと言い が、なぜない?やなど、これらの要因について教えてください。定理でそれらをどのように取得しますか?

n((1ni=1nXi)μ) d N(0,σ2)
n
1sni=1n(Xiμi) d N(0,1)
snn1sn

3
これはstats.stackexchange.com/questions/3734で説明されています。「直観」を要求するため、その答えは長くなります。結論として、「この単純な近似は、元々、普遍的な制限分布があること、その対数が2次関数であり、適切なスケール係数sn\ sqrt {n}に比例する必要があることをde Moivreが疑っていた方法を示唆していますn...。 "
whuber

1
直観的に、すべてのσi=σ場合、sn=σi2=nσで、1行目から2行目が続きます:
n((1ni=1nXi)μ)=1ni=1n(Xiμ)d N(0,σ2)
によって除算 1σ=snn
1ni=1n(Xiμ)snn=1sni=1n(Xiμi)d N(0,1)
(もちろんリアプノフ条件、組み合わせオフall σiは別の質問です)
Sextus Empiricus

回答:


33

いい質問(+1)!!

独立したランダム変数XおよびY場合、Var(X+Y)=Var(X)+Var(Y)およびVar(a \ cdot X)= a ^ 2 \ cdot Var(X)であることを思い出してくださいVar(aX)=a2Var(X)。したがって、\ sum_ {i = 1} ^ n X_iの分散i=1nXii=1nσ2=nσ2であり、\ bar {X} = \ frac {1}の分散です{n} \ sum_ {i = 1} ^ n X_iX¯=1ni=1nXinσ2/n2=σ2/nです。

これは分散のためです。ランダム変数を標準化するには、標準偏差で除算します。ご存じのとおり、の期待値はなので、変数 μX¯μ

N0

X¯E(X¯)Var(X¯)=nX¯μσ
は期待値0と分散1があります。したがって、ガウスになりやすい場合は、標準のガウスでなければなりません。最初の方程式の定式化は同等です。左側にを掛けることで、分散をます。σ σ 2N(0,1)σσ2

あなたの第二の点については、私は上記の式は、あなたが除算に持っていることを示していると信じているではなくあなたが使用理由を説明し、式を標準化する(の推定していない。σ SNσσsnσ)sn

追加: @whuberはによるスケーリングの理由を議論することを提案します。彼はそこでそれをします、答えは非常に長いので、私は彼の議論の本質を捉えようとします(これはド・モアブルの思考の再構成です)。n

+1と-1を多数追加する場合、基本的なカウントによって合計がなる確率を概算できます。この確率の対数は比例します。したがって、が大きくなるにつれて上記の確率が定数に収束するようにするには、正規化係数を使用する必要があります。nj 2 / n n O jj2/nnO(n)

最新の(ポストドモワール)数学的ツールを使用すると、求められる確率が

P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2j)!

これをスターリングの式で近似します

P(j)nnen/2+jen/2j2nen(n/2+j)n/2+j(n/2j)n/2j=(11+2j/n)n+j(112j/n)nj.

log(P(j))=(n+j)log(1+2j/n)(nj)log(12j/n)2j(n+j)/n+2j(nj)/nj2/n.

マイケルC.と男による以前の回答に対する私のコメントをご覧ください。
whuber

最初の方程式(LL CLT)s / b?それは、が分散として現れることも私を混乱させました。σ 2n((1ni=1nXi)μ) d N(0,1)σ2
B_Miner

平均と分散(標準偏差ではない)でガウスをパラメーター化すると、OPの式は正しいと思います。
gui11aume

1
ああ、。我々は乗算場合によって我々は(OPで示されたものを手に入れるキャンセル):つまり。しかし、VAR(aX)= a ^ 2Var(X)で、この場合a =およびVar(X)が1であるため、分布は。ˉ X - E ˉ XX¯E(X¯)Var(X¯)=nX¯μσd N(0,1) σσX¯E(X¯)Var(X¯)σσn((1ni=1nXi)μ)N0 σ2N(0,σ2)
B_Miner

グイ、手遅れではない場合、私はこれが正しいことを確認したかった。我々は仮定した場合そして、定数()、この量の期待値(すなわち)、これはゼロでしたが、E [aX] = a * E [X] => * 0 = 0なので、ゼロのままです。これは正しいです?σ X¯E(X¯)Var(X¯)=n(X¯μ)d N(0,1)σσn(X¯μ)σ
B_Miner

8

ランダム変数の合計の分布を制限できる分布の種類については、素晴らしい理論があります。素晴らしいリソースは、私が個人的に非常に楽しんだペトロフによる次のです。

それはあなたがこのタイプの限界を調査している場合こと、判明 独立した確率変数であるが、限界値の分布があります特定のディストリビューションのみ。

1ani=1nXnbn,(1)
Xi

その後、多くの数学があり、限界で起こることを完全に特徴付けるいくつかの定理に沸騰します。そのような定理の1つはFellerによるものです:

定理レッツ独立確率変数の配列であり、分布関数で、及び 正の定数のシーケンスです。そのためにV nx X n a n{Xn;n=1,2,...}Vn(x)Xnan

max1knP(|Xk|εan)0, for every fixed ε>0

そして

supx|P(an1k=1nXk<x)Φ(x)|0

それが必要かつ十分である

k=1n|x|εandVk(x)0 for every fixed ε>0,

an2k=1n(|x|<anx2dVk(x)(|x|<anxdVk(x))2)1

そして

an1k=1n|x|<anxdVk(x)0.

この定理により、がどのように見えるかがます。an

本の一般理論は、ノルム定数が何らかの形で制限されるように構築されていますが、必要十分条件を与える最終定理は、以外のノルム定数の余地を残しません。n


4

sは、標本平均の標本標準偏差を表します。sは標本平均の標本分散で、S / nに等しくなります。ここで、Sは母分散のサンプル推定です。s = S /√n なので、√nが最初の式にどのように現れるかを説明します。限界が以下の場合、分母にσがあることに注意してくださいn 2 n 2 n 2 nnn2n2n2nn

N(0,1)が、制限はN(0、σ)として与えられます。Sはσの一貫した推定値であるため、σを制限から外すために第2方程式で使用されます。n2n


質問の他の(より基本的で重要な)部分についてはどうでしょうか。なぜであり、他の分散の尺度ではないのですか?sn
whuber

@whuberそれは議論の余地があるかもしれませんが、それは質問の一部ではありませんでした。OP は、CLTの式にsと√nが現れる理由を知りたいだけです。もちろん、Sは、σに対して一貫性があり、CLTのその形式ではσが削除されるため、そこにあります。nnn
マイケルR.チャーニック

1
が存在することは、「一貫している」ため、はまったくわかりません。なぜそれは、を使用して極端な値の統計値を正規化する必要があることを意味しないのでしょうか?シンプルで自明の何かが欠けていますか?そして、OPをエコーするために、なぜ使用しないでください- 結局のところ、それは一貫しています! σsnσsnsnσ
whuber

前述の定理はN(0,1)に収束するため、σを知って使用するか、Slutskyの定理で機能する一貫した推定値を使用する必要があります。私はそれが不明瞭でしたか?
マイケルR.チャーニック

あなたが不明瞭だったとは思わない。重要な点が欠けていると思います。結局、多くの分布では、代わりにIQRを使用して制限正規分布を取得できますが、結果はそれほどきれいではありません(制限分布のSDは開始分布に依存します)。私は、これを呼び出して説明するに値することを提案しているだけです。遭遇するすべてのディストリビューションを標準化した40年によって開発された直感を持たない人には、それほど明白ではありません!sn
whuber

2

直観的に、がいくつかのである場合、はほぼ等しいと予想されるはずです。私はそれが一般的に必要であるとは思わないけれども、それはかなり合理的な期待のように思われる。最初の式のの理由は、の分散がようになるため、が分散を膨張させ、式の分散が。2番目の式では、用語はと定義されますσ 2 ヴァーZのNZnN(0,σ2)σ2Var(Zn)σ2ˉ Xのn-μnX¯nμ101n σ2Snσ2sn n i = 1 VarXii=1nVar(Xi)分子の分散はように増加するため、式全体の分散は定数(この場合は)になります。i=1nVar(Xi)1

基本的に、の分布で何か「面白い」ことが起こっていることを知っていますが、適切におよびスケーリングしないと、それを見ることができません。これは、顕微鏡の調整が必要であると説明されることもあります。私たちが爆破されない場合は(例えば)によって、我々はただ持っている弱い法律で配布中。それ自体が興味深い結果ですが、CLTほど有益ではありません。が支配的な要因で膨張させた場合、が得られますが、を支配する要因 ˉ XX¯n:=1niXiX¯μˉ Xのn-μ0nX¯nμ0anのn ˉ Xのn-μ0nan(X¯nμ)0an、N ˉ X N-μn与え。それは判明のノート(このケースでは何が起こっているかを見ることができるようにちょうど右の倍率である:ここでのすべての収束が分布している、上昇を与え、ほぼ必ず収束に興味深いです倍率の別のレベルがあり、反復対数の法則へ)。an(X¯nμ)n


4
最初に対処する必要があるより基本的な質問は、SDを使用して分散を測定する理由です。なぜ絶対中央のいくつかの他の値に対するモーメント?または、なぜIQRまたはその親relativeのいずれかではありませんか?それに答えると、共分散の単純なプロパティはすぐに依存性を与えます(@ Gui11aumeが最近説明したように)kthkn
whuber

1
@whuber同意します。これが、これをヒューリスティックとして提示した理由です。聞きたいのですが、簡単な説明が受け入れられるかどうかはわかりません。私にとって、「二乗項は、平均値を差し引いた後の特性関数のテイラー展開の関連項だから」という、より単純で説明可能な理由があるかどうかはわかりません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.