タグ付けされた質問 「central-limit-theorem」

「特定の条件が与えられると、それぞれが明確に定義された平均と明確に定義された分散を持つ、独立した確率変数の十分に多数の反復の平均は、ほぼ正規分布します。」(ウィキペディア)

1
t検定の「ほぼ正常」の評価
Welchのt検定を使用して平均の等価性をテストしています。基礎となる分布は、通常とはほど遠いです(関連する議論の例よりも歪んでいます)。より多くのデータを取得できますが、その範囲を決定する原則的な方法が必要です。 サンプルの分布が許容可能であるという評価を行うための優れたヒューリスティックはありますか?正規性からの逸脱が最も懸念されるのはどれですか? サンプル統計のブートストラップ信頼区間に依存する他のアプローチがありますか?

1
中心極限定理が単一のサンプルで機能するのはなぜですか?
私は常に、各サンプルが十分な大きさで、サンプリングを繰り返したときにCLTが機能することを教えられてきました。たとえば、私が100万人の国民の国を想像してみてください。CLTについての私の理解は、高さの分布が正常でなかったとしても、50人のサンプルを1000個取り(つまり、それぞれ50人の市民を1000回調査し)、各サンプルの平均高さを計算すると、これらのサンプルの分布であると理解しています。手段は正常です。 しかし、研究者が繰り返しサンプルを採取した実際のケースを見たことがありません。代わりに、彼らは1つの大きなサンプル(つまり、身長について50,000人の市民を調査する)を取得し、そこから作業します。 統計の本が繰り返しサンプリングを教えており、現実の世界では研究者が単一のサンプルしか実施していないのはなぜですか? 編集:私が考えている現実のケースは、50,000人のTwitterユーザーのデータセットで統計を行うことです。そのデータセットは明らかに繰り返されるサンプルではなく、50,000の1つの大きなサンプルにすぎません。


1
二次形式の漸近正規性
ましょうから引き出されたランダムベクトルである。サンプル考えます。と定義し。ましょう= \ mathbb {E} _ {\ mathbf {X} \ SIM P} [\ mathbf {X}]:\ boldsymbol {\ MU}およびC = \ mathrm {COV} _ {\ mathbf {X} \シムP} [\ mathbf {x}、\ mathbf {x}]。xx\mathbf{x}PPP{xi}ni=1∼i.i.d.P{xi}i=1n∼i.i.d.P\{ \mathbf{x}_i \}_{i=1}^n \stackrel{i.i.d.}{\sim} Px¯n:=1n∑ni=1xix¯n:=1n∑i=1nxi\bar{\mathbf{x}}_n := \frac{1}{n} \sum_{i=1}^n \mathbf{x}_iC^:=1n∑ni=1(xi−x¯n)(xi−x¯n)⊤C^:=1n∑i=1n(xi−x¯n)(xi−x¯n)⊤\hat{C} := \frac{1}{n} \sum_{i=1}^n (\mathbf{x}_i - \bar{\mathbf{x}}_n) (\mathbf{x}_i - \bar{\mathbf{x}}_n)^\topμ:=Ex∼P[x]μ:=Ex∼P[x]\boldsymbol{\mu} := \mathbb{E}_{\mathbf{x}\sim …


3
さらに別の中心極限定理の質問
ましょう持つ独立したベルヌーイ・ランダム変数のシーケンスである セット 示すこと分布に収束する標準正規変数にとして無限大になる傾向があります。、P { X K = 1 } = 1 - P { X K = 0 } = 1{Xn:n≥1}{Xn:n≥1}\{X_n:n\ge1\}Sn= n ∑ k=1(Xk−1P{Xk=1}=1−P{Xk=0}=1k.P{Xk=1}=1−P{Xk=0}=1k.P\{X_k=1\}=1-P\{X_k=0\}=\frac{1}{k}. SnSn=∑k=1n(Xk−1k), B2n=∑k=1nk−1k2Sn=∑k=1n(Xk−1k), Bn2=∑k=1nk−1k2S_n=\sum^{n}_{k=1}\left(X_k-\frac{1}{k}\right), \ B_n^2=\sum^{n}_{k=1}\frac{k-1}{k^2} ZnSnBnSnBn\frac{S_n}{B_n}ZZZnnn 私の試みはLyapunov CLTを使用することです。したがって、ような が存在することを示す必要がありますδ>0δ>0\delta>0リムn → ∞1B2 + δんΣk = 1んE[ | バツk− 1k|2 + δ] = 0。limn→∞1Bn2+δ∑k=1nE[|Xk−1k|2+δ]=0.\lim_{n\rightarrow \infty}\frac{1}{B_n^{2+\delta}}\sum_{k=1}^{n}E[|X_k-\frac{1}{k}|^{2+\delta}]=0. したがって、n ∑ k …

3
情報理論の中心極限定理
情報理論CLTの最も単純な形式は次のとおりです。 ましょう平均でIIDさ、分散。ましょう正規化された和の密度であると標準ガウス密度です。次に、情報理論CLTは、がいくつかのnに対して有限である場合、D(f_n \ | \ phi)\ to 0はn \ to \ infty。0 1 f n ∑ n i = 1 X iX1,X2,…X1,X2,…X_1, X_2,\dots000111fnfnf_n∑ni=1Xin√∑i=1nXin\frac{\sum_{i=1}^n X_i}{\sqrt{n}}ϕϕ\phiN D (F N ‖ φ )→ 0 、N → ∞D (fん∥ φ )= ∫fんログ(fん/ ϕ)dバツD(fn‖ϕ)=∫fnlog⁡(fn/ϕ)dxD(f_n\|\phi)=\int f_n \log(f_n/\phi) dxんnnD (fん∥はφ )→ 0D(fn‖ϕ)→0D(f_n\|\phi)\to 0n → ∞n→∞n\to \infty 確かに、この収束は、ある意味では、文献で確立されている収束、分布の収束、L1L1L_1メトリックでの収束よりも「強力」です。これは、Pinskerの不等式( …

1
サンプルの算術平均が同じ分布に従うコーシー以外の分布はありますか?
場合次いで、コーシー分布に従うY = ˉ X = 1バツXXまた、全く同じ分布次Xを、このスレッドを参照してください。Y= X¯= 1んΣんi = 1バツ私Y=X¯=1n∑i=1nXiY = \bar{X} = \frac{1}{n} \sum_{i=1}^n X_iバツXX この物件に名前はありますか? これが当てはまる他のディストリビューションはありますか? 編集 この質問をする別の方法: せ確率密度を有するランダム変数であるF (X )。バツXXf(x )f(x)f(x) 聞かせて、Xiはi番目の観測表すXを。Y= 1んΣんi = 1バツ私Y=1n∑i=1nXiY=\frac 1 n\sum_{i=1} ^n X_iバツ私XiX_iバツXX 自体は、 Xの特定の値を条件とせずに、確率変数と見なすことができます。YYYバツXX がコーシー分布に従う場合、Yの確率密度関数はf (x )です。バツXXYYYf(x)f(x)f(x) 用(非自明*)確率密度関数の他の種類がありでその結果Yは、の確率密度関数を有するF (xは)?f(x)f(x)f(x)YYYf(x)f(x)f(x) *私が考えることができる唯一の些細な例は、ディラックのデルタです。つまり、確率変数ではありません。

3
最大項の数
考えてみましょう ここで、X 1、… 、X Nはiidで、CLTが保持されます。 どれだけ多くの最大の用語を合計すると、合計の半分になりますか? たとえば、10 + 9 + 8≈(10 + 9 + 8 … + 1)/ 2:用語の30%が合計の約半分に達します。∑Ni=1|Xi|∑i=1N|Xi|\sum_{i=1}^N |X_i|X1,…,XNX1,…,XNX_1, \ldots, X_N≈≈\approx……\dots 定義する sumbiggest( j;X1…XN)≡sum of the j biggest of |X1|…|XN|sumbiggest( j;X1…XN)≡sum of the j biggest of |X1|…|XN| \qquad\text{sumbiggest( j}; X_1 \dots X_N ) \equiv \text{sum of the j biggest …

1
iid確率変数の和の平方根の中心極限定理
math.stackexchangeでの質問に興味をそそられ、それを経験的に調査すると、iid確率変数の和の平方根に関する次のステートメントについて疑問に思っています。 仮定有限の非ゼロのiid確率変数平均値であるμ、分散σ 2、およびY = N Σ iの= 1 X Iを。中心極限定理は述べていますY - N μをバツ1、X2、… 、XんX1,X2,…,XnX_1, X_2, \ldots, X_nμμ\muσ2σ2\sigma^2Y= ∑i = 1んバツ私Y=∑i=1nXi\displaystyle Y=\sum_{i=1}^n X_iとしてNが増加します。Y- nはμnはσ2−−−√ →d N(0 、1 )Y−nμnσ2 →d N(0,1)\displaystyle \dfrac{Y - n\mu}{\sqrt{n\sigma^2}} \ \xrightarrow{d}\ N(0,1)んnn Z = √の場合、私はまた、のような何かを言うことができ Zを- √Z= | Y|−−−√Z=|Y|Z=\sqrt{|Y|}としてNが増加?Z− n | μ | - σ24 | μ …

1
MLEである
仮定(X,Y)(X,Y)(X,Y) PDFを有します fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0f_{\theta}(x,y)=e^{-(x/\theta+\theta y)}\mathbf1_{x>0,y>0}\quad,\,\theta>0 試料の密度(X,Y)=(Xi,Yi)1≤i≤n(X,Y)=(Xi,Yi)1≤i≤n(\mathbf X,\mathbf Y)=(X_i,Y_i)_{1\le i\le n}この集団から引き出され、したがってあります gθ(x,y)=∏i=1nfθ(xi,yi)=exp[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0gθ(x,y)=∏i=1nfθ(xi,yi)=exp⁡[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp⁡[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0\begin{align} g_{\theta}(\mathbf x,\mathbf y)&=\prod_{i=1}^n f_{\theta}(x_i,y_i) \\&=\exp\left[{-\sum_{i=1}^n\left(\frac{x_i}{\theta}+\theta y_i\right)}\right]\mathbf1_{x_1,\ldots,x_n,y_1,\ldots,y_n>0} \\&=\exp\left[-\frac{n\bar x}{\theta}-\theta n\bar y\right]\mathbf1_{x_{(1)},y_{(1)}>0}\quad,\,\theta>0 \end{align} θθ\thetaの最尤推定量は、次のように導出できます。 θ^(X,Y)=X¯¯¯¯Y¯¯¯¯−−−√θ^(X,Y)=X¯Y¯\hat\theta(\mathbf X,\mathbf Y)=\sqrt\frac{\overline X}{\overline Y} このMLEの制限分布が正常かどうかを知りたいです。 のための十分統計ことは明らかであるθθ\thetaサンプルに基づいている(X¯¯¯¯,Y¯¯¯¯)(X¯,Y¯)(\overline X,\overline Y)。 さて、MLEが通常の1パラメータ指数ファミリーのメンバーであれば、疑いもなくMLEは漸近的に正常であると私は言ったでしょう。1次元のパラメーター(たとえば、N(θ,θ2)N(θ,θ2)N(\theta,\theta^2)分布のように)に対して2次元の十分な統計量があるため、そうではないと思います。 事実を使用していることをXXXとYYY実際の独立した指数変数であり、私がすることができます示しての正確な分布というθはそのようになっていますθ^θ^\hat\theta θ^θ=dF−−√, where F∼F2n,2nθ^θ=dF, where F∼F2n,2n\frac{\hat\theta}{\theta}\stackrel{d}{=} \sqrt F\quad,\text{ where }F\sim F_{2n,2n} ここから限界分布を見つけることはできません。 代わりに、私はそのWLLNで主張することができX¯¯¯¯⟶PθX¯⟶Pθ\overline X\stackrel{P}\longrightarrow\thetaとY¯¯¯¯⟶P1/θY¯⟶P1/θ\overline Y\stackrel{P}\longrightarrow 1/\thetaので、そのθθ^⟶Pθθ^⟶Pθ\hat\theta\stackrel{P}\longrightarrow\theta。 これは、と言われますθ分布の収束をしますθ。以来、しかし、これは、驚きと来ないθはの「良い」推定量ですθ。そして、この結果は√のようなものがθ^θ^\hat\thetaθθ\thetaθ^θ^\hat\thetaθθ\thetan−−√(θ^−θ)n(θ^−θ)\sqrt n(\hat\theta-\theta)で漸近的に正常かではありません。CLTを使用しても妥当な議論を思い付くことはできませんでした。 …

1
2サンプルのカイ2乗検定
この質問は、ファンデルファールトの本、漸近統計、pg。253.#3: その仮定とYを n個のパラメータと独立多項ベクターである(M 、1、... 、K)と(N 、B 1、... 、BのK)。帰無仮説の下で、私は = bが、私はあることを示しますXmバツメートル\mathbf{X}_mYnYん\mathbf{Y}_n(m,a1,…,ak)(メートル、a1、…、ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(ん、b1、…、bk)(n,b_1,\ldots,b_k)ai=bia私=b私a_i=b_i 有するχ 2 K - 1つの分布。ここで、C I=を(XはM、I+YN、I)/(M+N)。∑i=1k(Xm 、私− m c^私)2m c^私+ ∑i = 1k(Yn 、i− n c^私)2n c^私Σ私=1k(バツメートル、私−メートルc^私)2メートルc^私+Σ私=1k(Yん、私−んc^私)2んc^私\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i}χ2k − 1χk−12\chi^2_{k-1}c^私= (Xm 、私+ Yn 、i)/(m + n )c^私=(バツメートル、私+Yん、私)/(メートル+ん)\hat{c}_i = (X_{m,i} + Y_{n,i})/(m+n) 始めるのに助けが必要です。ここの戦略は何ですか?2つの加数を次のように組み合わせることができました。 Σi …

1
がが無限大に近づくにつれて正規分布に収束するという定理はありますか?
レッツ、定義された平均値との任意の分布で、および標準偏差、。中心極限定理は、 が標準正規分布に分布で収束することを示しています。をサンプル標準偏差で置き換える場合、 がt分布に収束して収束するという定理はあり ますか?大きなためXXXμμ\muσσ\sigman−−√X¯−μσnX¯−μσ \sqrt{n}\frac{\bar{X} - \mu}{\sigma} σσ\sigmaSSSn−−√X¯−μSnX¯−μS \sqrt{n}\frac{\bar{X} - \mu}{S} nnnt分布が正規分布に近づくと、定理は、存在する場合、制限が標準正規分布であると述べることができます。したがって、t分布はあまり有用ではないように思えますがほぼ正常な場合にのみ有用です。これは事実ですか? XXX 可能であれば、が置き換えられたときに、このCLTの証明を含む参照を示しますか?そのような参照は、測定理論の概念を使用することができます。しかし、この時点で私にとって何でも素晴らしいことです。σσ\sigmaSSS

2
変数が完全な同時依存性を示す場合、多変量中心極限定理(CLT)は成り立ちますか?
タイトルは私の質問を要約したものですが、明確にするために、次の簡単な例を検討してください。ましょう、I = 1、...、N。定義: \ begin {equation} S_n = \ frac {1} {n} \ sum_ {i = 1} ^ n X_i \ end {equation} および \ begin {equation} T_n = \ frac {1} {n} \ sum_ ^ N(X_I ^ 2 - 1の){I 1 =} \端{式} 私の質問:にもかかわらずS_NとT_Nがときに完全に依存しており、N = 1、DO \ SQRT {N} …

1
相関確率変数の加重和の「中央極限定理」
私はそれを主張する論文を読んでいます X^k=1N−−√∑j=0N−1Xje−i2πkj/N,X^k=1N∑j=0N−1Xje−i2πkj/N,\hat{X}_k=\frac{1}{\sqrt{N}}\sum_{j=0}^{N-1}X_je^{-i2\pi kj/N}, つまり離散フーリエ変換、CFTによるDFT)は、(複雑な)ガウス確率変数になる傾向があります。しかし、私はこれが一般的に正しくないことを知っています。この(誤った)議論を読んだ後、私はネットで検索し、Peligrad&Wuによるこの2010年の論文を見つけました。彼らは、いくつかの定常プロセスについて、「CLT定理」を見つけることができることを証明しています。 私の質問は:(シミュレーションまたは理論の両方によって)与えられたインデックス付きシーケンスのDFTの制限分布を見つける問題に対処しようとする他の参照がありますか?私は特に、時系列分析のコンテキストでの共分散構造、または非定常系列への導出/アプリケーションでの収束率(つまり、DFTが収束する速さ)にがあります。XjXjX_j

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.