これは、あなたが学んでいる定理の直感的な側面について考えていることを示しているので、素晴らしい質問です。これにより、CLTを学ぶほとんどの学生よりも優先されます。ここでは、CLTがサポートが制限された確率変数をどのように保持できるかについて説明します。
古典中心極限定理は、任意のシーケンスに適用されますX1,X2,X3,...∼IID Dist(μ,σ2) 任意の平均値を持つ独立して同一に分布した確率変数からなる μ 有限の非ゼロ分散 0<σ2<∞。今、あなたがそのようなシーケンスを持っていて、それらがxmin⩽Xi⩽xmax、したがって、それらのサポートは実際のライン全体をカバーしていません。
中心極限定理は、サンプル平均分布に関連し、基になる確率変数の制限付きサポートからシーケンス。この統計は、境界も従う必要があり。したがって、プロットは厚くなります-定理の対象である標本平均も制限されます!この場合、CLTはどのように保持できますか?X¯n≡1n∑ni=1Xixmin⩽X¯n⩽xmax
中心極限定理(CLT):まかせ標準正規分布関数であっても、我々は持っています:Φ
limn→∞P(X¯n−μσ/n−−√⩽z)=Φ(z).
CLTから生じる近似:大きな、近似分布があります。n
X¯n∼N(μ,σ2n).
あなたの問題は、この定理から生じる分布の近似が有界のサポートのある分布を非有界のサポートのある分布で近似するという事実に起因しているため、正しくありません。あなたはそれについて正しいです---大きな分布近似は単なる近似であり、サンプルの平均が範囲外である確率を実際に誤って指定しています(この正の確率を与えることにより)。n
ただし、CLTは有限分布近似に関する記述ではありません。これは、標準化された標本平均の限定分布についてです。この数量の上限は次のとおりです。n
zmin=xmin−μσ/n−−√⩽X¯n−μσ/n−−√⩽xmax−μσ/n−−√=zmax.
今、として我々有する制限及びの範囲ことどの手段標準サンプル平均が広くなるとより広く、実線全体の限界に収束します。(または、もう少し形式的に言えば、実線の任意の点について、境界はその点を十分に大きいの範囲で包含するようになります。)これの結果は、法線によって境界の外側の部分に起因する確率です。分布はとしてゼロに収束します。n→∞zmin→−∞zmax→∞nn→∞
ここでは、CLTに対する不安についての問題の中心にいます。任意の有限について、サンプル平均の分布への正規近似は、真のサポートの境界外にある値のサブセットに正の確率を与えることは事実です。ただし、という制限を使用すると、この誤った正の確率はゼロに収束します。正規化された標本平均への分布近似は、有限に対して近似が正確に成立しない場合でも、制限内でこの量の真の分布に収束します。nn→∞n