確率変数に制限がある分布の中心極限定理はどのように成り立つのでしょうか?


10

中心極限定理-サンプルの分布が正規性に近づく古典的なバージョン-がポアソン分布またはガンマ分布に当てはまる可能性があるため、私は常に問題に取り組み、良い答えは得られていません。 P(x<0)=0。または、さらに言えば、X:X,F(X)=0、 多分 X:X,1F(X)=0

例として、サンプル数としてのガンマ分布を考える nP(X¯=α)1α0、 いくつかのための X¯iしかし、もしα<0P(X¯=α)=0。決してそこには決して、決してありませんX¯i<0。これは、X¯ 次の理由から、 f(X¯) 必ずである必要があります 0X¯<0、正規分布の要件を満たしていない場合 f(y)>0,yR

誰かが私のロジックがどこに迷ったのかを理解してくれるとしたら、CLTに基づく人生や何かについてはずっと気分が良くなるでしょう。


6
ベルヌーイ変数に適用されるCLTの元の定式化:可能な限り最も厳しい制限のある例!では、ロジックのエラーを検索する際に、その特定のケースを検討してください。答えがすぐに明らかにならない場合(ヒント:平均を標準化することについて考えてください)、おそらくstats.stackexchange.com/questions/3734/の私のアカウントがいくつかのアイデアを示唆しています。
whuber

4
これは、中心極限定理の基本バージョンが実際に言っていることを見て、そこから標準化された平均の境界がどのように見えるかを検討するのに役立つ場合があります。
Glen_b-モニカを復活させる

回答:


14

これは、あなたが学んでいる定理の直感的な側面について考えていることを示しているので、素晴らしい質問です。これにより、CLTを学ぶほとんどの学生よりも優先されます。ここでは、CLTがサポートが制限された確率変数をどのように保持できるかについて説明します。

古典中心極限定理は、任意のシーケンスに適用されますX1,X2,X3,...IID Dist(μ,σ2) 任意の平均値を持つ独立して同一に分布した確率変数からなる μ 有限の非ゼロ分散 0<σ2<。今、あなたがそのようなシーケンスを持っていて、それらがxminXixmax、したがって、それらのサポートは実際のライン全体をカバーしていません。

中心極限定理は、サンプル平均分布に関連し、基になる確率変数の制限付きサポートからシーケンス。この統計は、境界も従う必要があり。したがって、プロットは厚くなります-定理の対象である標本平均も制限されます!この場合、CLTはどのように保持できますか?X¯n1ni=1nXixminX¯nxmax

中心極限定理(CLT):まかせ標準正規分布関数であっても、我々は持っています:Φ

limnP(X¯nμσ/nz)=Φ(z).

CLTから生じる近似:大きな、近似分布があります。n

X¯nN(μ,σ2n).

あなたの問題は、この定理から生じる分布の近似が有界のサポートのある分布を非有界のサポートのある分布で近似するという事実に起因しているため、正しくありません。あなたはそれについて正しいです---大きな分布近似は単なる近似であり、サンプルの平均が範囲外である確率を実際に誤って指定しています(この正の確率を与えることにより)。n

ただし、CLTは有限分布近似に関する記述ではありません。これは、標準化された標本平均の限定分布についてです。この数量の上限は次のとおりです。n

zmin=xminμσ/nX¯nμσ/nxmaxμσ/n=zmax.

今、として我々有する制限及びの範囲ことどの手段標準サンプル平均が広くなるとより広く、実線全体の限界に収束します。(または、もう少し形式的に言えば、実線の任意の点について、境界はその点を十分に大きいの範囲で包含するようになります。)これの結果は、法線によって境界の外側の部分に起因する確率です。分布はとしてゼロに収束します。nzminzmaxnn

ここでは、CLTに対する不安についての問題の中心にいます。任意の有限について、サンプル平均の分布への正規近似は、真のサポートの境界外にある値のサブセットに正の確率を与えることは事実です。ただし、という制限を使用すると、この誤った正の確率はゼロに収束します。正規化された標本平均への分布近似は、有限に対して近似が正確に成立しない場合でも、制限内でこの量の真の分布に収束します。nnn


3

混乱の原因は次の2つです。

1)CLTは正規化されたサンプル平均に適用されます。

Zn=Sn/nμσ/n=Snnμσn

これは0を中心としているため、正の確率で負の値を受け入れます。極端な例として、場合、はポアソンに対して負になる可能性があります。実際、が負にならない場合、は定数でなければならない(したがって)と簡単に結論付けることができます。n=1X1μσX1ZnXiσ=0

2)有限 のCLTは、平均の周りの局所的な結果にすぎません。言い換えると、が約(通常のCDF)であるという事実は、0に近い法線がより真実になる傾向がありますがに対して十分に大きくない場合、この近似が壊れます。nP(Znx)ϕ(x)xnx

人の身長を測定する場合、標準の正規近似は、負の高さが正の確率であることを意味する場合があります。ほとんどの成人の身長は4〜7フィートであるため、これは誤りですが小さい場合、近似はこれらの制限を超えて崩れます。n

または、および場合、が負である状況を推測するには、多くの実現が必要になるため、はほとんどが正になります。誤って)それは決して否定的ではあり得ないと結論付けます。P(Xi=1)=0.99999P(Xi=1)=0.00001XiXiZn

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.