タグ付けされた質問 「central-limit-theorem」

「特定の条件が与えられると、それぞれが明確に定義された平均と明確に定義された分散を持つ、独立した確率変数の十分に多数の反復の平均は、ほぼ正規分布します。」(ウィキペディア)

3
CLTでは、なぜ
ましょ平均有する分布から独立して観察することがμ及び分散σ 2 &lt; ∞、場合N →を∞次いで、X1,...,XnX1,...,XnX_1,...,X_nμμ\muσ2&lt;∞σ2&lt;∞\sigma^2 < \inftyn→∞n→∞n \rightarrow \infty n−−√X¯n−μσ→N(0,1).nX¯n−μσ→N(0,1).\sqrt{n}\frac{\bar{X}_n-\mu}{\sigma} \rightarrow N(0,1). なぜこれがその意味するものではない X¯n∼N(μ,σ2n)?X¯n∼N(μ,σ2n)?\bar{X}_n \sim N\left(\mu, \frac{\sigma^2}{n}\right)?

2
マルコフ連鎖の中心極限定理
\newcommand{\E}{\mathbb{E}}\newcommand{\P}{\mathbb{P}}中心極限定理(CLT)は、X1,X2,…X1,X2,…X_1,X_2,\dots独立しており、E[Xi]=0E[Xi]=0\E[X_i]=0およびVar(Xi)&lt;∞Var⁡(Xi)&lt;∞\operatorname{ Var} (X_i)<\infty、合計はn \ to \ inftyとして正規分布に収束しn→∞n→∞n\to\inftyます: ∑i=1nXi→N(0,n−−√).∑i=1nXi→N(0,n). \sum_{i=1}^n X_i \to N\left(0, \sqrt{n}\right). 代わりに、X_1、X_2、\ dotsが、期待値0と有界分散のX1,X2,…X1,X2,…X_1,X_2,\dotsある定常分布\ P_ \ inftyの有限状態マルコフ連鎖を形成するP∞P∞\P_\inftyと仮定します。この場合のCLTの単純な拡張はありますか? マルコフ連鎖のCLTで見つけた論文は、一般に、はるかに一般的なケースを扱っています。関連する一般的な結果へのポインタとそれがどのように適用されるかの説明に非常に感謝します。

3
中心極限定理とパレート分布
誰かがパレート分布と中心極限定理の間の関係について簡単な(素人)説明を提供できますか?私は次の声明を理解しようとしています: 「中心極限定理はすべての分布で機能するわけではありません。これは1つの卑劣な事実によるものです。サンプル平均は、基礎となる分布が存在する場合、その平均の周りにクラスター化されます。しかし、分布にどういう意味がないのですか?これはパレート分布という意味ではありません。通常の方法で計算しようとすると、無限に発散します。」

4
中心極限定理における分散の役割
分散を計算するときに絶対値をとるのではなく、差を二乗する理由は、通常の方法で定義された分散が、分母が二乗であり、中心極限定理で独特の役割を果たすことをどこかで読んだことがあります。 では、CLTにおける分散の役割とは正確には何でしょうか。私はこれについてこれ以上見つけることも、それを正しく理解することもできませんでした。 また、分散とは、一連の数値がどこまで分散しているかの尺度であると私たちに思わせるものを尋ねることもできます。分散と同様に他の量を定義して、それらが数値の広がりを測定していることを納得させることができます。これが起こるためには、数値の広がりが何を意味するのか、スプレッドの測定からどのような振る舞いを期待するのかなどを述べる必要があります。スプレッドの正式な定義はないため、分散を定義として扱う場合があります。ただし、何らかの理由で、分散は「最良の」広がりの尺度と見なされます。

2
確率変数に制限がある分布の中心極限定理はどのように成り立つのでしょうか?
中心極限定理-サンプルの分布が正規性に近づく古典的なバージョン-がポアソン分布またはガンマ分布に当てはまる可能性があるため、私は常に問題に取り組み、良い答えは得られていません。 P(x&lt;0)=0P(x&lt;0)=0P(x<0)=0。または、さらに言えば、∃X:X≠−∞,F(X)=0∃X:X≠−∞,F(X)=0\exists X:X \neq -\infty ,F(X)=0、 多分 ∃X:X≠∞,1−F(X)=0∃X:X≠∞,1−F(X)=0\exists X:X \neq \infty, 1-F(X)=0。 例として、サンプル数としてのガンマ分布を考える n→∞n→∞n \rightarrow \infty、 P(X¯=α)→1P(X¯=α)→1P( \bar{X} = \alpha) \rightarrow 1、 ∀α≥0∀α≥0\forall \alpha \geq 0、 いくつかのための X¯iX¯i\bar{X}_i。しかし、もしα&lt;0α&lt;0\alpha<0、 P(X¯=α)=0P(X¯=α)=0P(\bar{X}=\alpha)=0。決してそこには決して、決してありませんX¯i&lt;0X¯i&lt;0\bar{X}_i<0。これは、X¯X¯\bar{X} 次の理由から、 f(X¯)f(X¯)f(\bar{X}) 必ずである必要があります 000、 ∀X¯&lt;0∀X¯&lt;0\forall \bar{X}<0、正規分布の要件を満たしていない場合 f(y)&gt;0,∀y∈Rf(y)&gt;0,∀y∈Rf(y)>0, \forall y \in R。 誰かが私のロジックがどこに迷ったのかを理解してくれるとしたら、CLTに基づく人生や何かについてはずっと気分が良くなるでしょう。

2
独立した二乗均一確率変数の合計の平方根の期待
ましょX1,…,Xn∼U(0,1)X1,…,Xn∼U(0,1)X_1,\dots,X_n \sim U(0,1)独立したidenticallly標準一様確率変数を分散させること。 Let Yn=∑inX2iI seek: E[Yn−−√]Let Yn=∑inXi2I seek: E[Yn]\text{Let }\quad Y_n=\sum_i^nX_i^2 \quad \quad \text{I seek: } \quad \mathbb{E}\big[\sqrt{Y_n } \big] YnYnY_nの予想は簡単です。 E[X2]E[Yn]=∫10y2y√=13=E[∑inX2i]=∑inE[X2i]=n3E[X2]=∫01y2y=13E[Yn]=E[∑inXi2]=∑inE[Xi2]=n3\begin{align} \mathbb{E}\left[X^2\right] &=\int_0^1\frac{y}{2\sqrt{y}}=\frac{1}{3}\\ \mathbb{E}\left[Y_n\right] &=\mathbb{E}\left[\sum_i^nX_i^2\right] = \sum_i^n\mathbb{E}\left[X_i^2\right]=\frac{n}{3} \end{align} 退屈な部分です。LOTUSを適用するには、YnYnY_n pdfが必要です。もちろん、2つの独立確率変数の和の確率密度関数は、それらの確率密度関数のたたみ込みです。しかし、ここにはnnn確率変数があり、たたみ込みは...複雑な式(恐ろしいしゃれが意図されたもの)につながると思います。もっと賢い方法はありますか? 私は正しい解決策を見たいと思いますが、それが不可能であるか複雑すぎる場合は、大きなnnn漸近近似は許容できる可能性があります。ジェンセンの不平等によって、私はそれを知っています E[Yn]−−−−−√=n3−−√≥E[Yn−−√]E[Yn]=n3≥E[Yn]\sqrt{\mathbb{E}[Y_n]}=\sqrt{\frac{n}{3}}\geq\mathbb{E}\left[\sqrt{Y_n}\right] しかし、自明ではない下限も見つけられない限り、これはあまり役に立ちません。独立したRVの合計だけでなく、独立したRVの合計の平方根があるため、CLTはここでは直接適用されないことに注意してください。たぶん、ここで役立つかもしれない他の限界定理(私は無視します)があるかもしれません。

1
正規分布エラーと中心極限定理
ウォルドリッジの導入計量経済学では、引用があります: エラーの正規分布を正当化する引数は通常、次のようなものですはに影響を与える多くの異なる観測されていない要因の合計であるため、中心極限定理を呼び出して、が近似正規分布であると結論付けることができます。uuuyyyuuu この引用は、線形モデルの仮定の1つに関連しています。 u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2) ここで、uuuは母集団モデルの誤差項です。 さて、私の知る限りでは、中心極限定理は、 Zi=(Yi¯¯¯¯¯−μ)/(σ/√n)Zi=(Yi¯−μ)/(σ/√n)Z_i=(\overline{Y_i}-μ)/(σ/√n) (ここで、Yi¯¯¯¯¯Yi¯\overline{Y_i} は、平均μμμと分散σ^ 2を持つ任意の母集団から抽出されたランダムサンプルの平均ですσ2σ2σ^2) n \ rightarrow \ inftyとして標準の標準変数に近づきn→∞n→∞n \rightarrow \inftyます。 質問: Z_iの漸近正規性ZiZiZ_iがu \ sim N(μ、σ^ 2)をどのように意味するかを理解するu∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2)


1
確率分布のアンサンブルが完了しているトポロジ
私は、確率分布に関する直感的な理解と、確率分布のほとんどすべてのトポロジーが持っている奇妙な特性との調整にかなり苦労しています。 たとえば、混合確率変数考えます。0を中心とし、分散1、確率1のガウスを選択します。XnXnX_n、結果にnを追加します。このような確率変数のシーケンスは、分散が1で、0を中心とするガウス分布に(弱く、全体的に)収束しますが、Xnの平均は常に1であり、分散は+∞に収束します。そのため、このシーケンスが収束するとは言いたくありません。1n1n\frac{1}{n}nnnXnXnX_n111+∞+∞+\infty トポロジーについて忘れていたすべてのことを覚えるのにかなりの時間を費やしましたが、最終的に、そのような例について非常に不満な点を見つけました。シーケンスの制限は従来の分布ではありません。上記の例では、限界は奇妙な「平均1と無限分散のガウス」です。トポロジーの観点から見ると、確率分布のセットは弱点(およびTV、および私が調べた他のすべてのトポロジー)では完全ではありません。 次に、次の質問に直面します。 確率分布のアンサンブルが完了するようなトポロジは存在しますか? いいえの場合、その不在は確率分布のアンサンブルの興味深い特性を反映していますか?それとも退屈ですか? 注:「確率分布」についての質問をしました。これらは、PDFを持たないディラックスなどに収束する可能性があるため、閉じることができません。しかし、対策は弱いトポロジーではまだ閉じられていないので、私の質問は残っています mathoverflowにクロスポスト /mathpro/226339/topologies-for-which-the-ensemble-of-probability-measures-is-complete?noredirect=1#comment558738_226339

1
t検定の正規性の仮定に関する質問
t検定の場合、ほとんどのテキストによれば、母集団データは正規分布しているという仮定があります。なぜだかわかりません。t検定は、標本平均の標本分布が母集団ではなく正規分布であることのみを要求しませんか? t検定が最終的にサンプリング分布の正規性のみを必要とする場合は、母集団は任意の分布のように見えますか?適切なサンプルサイズがある限り。それは中心極限定理が述べていることではありませんか? (ここでは1標本または独立標本のt検定を参照しています)

3
もし、
:次の設定を想定し ましょZi=min{ki,Xi},i=1,...,nZi=min{ki,Xi},i=1,...,nZ_i = \min\{k_i, X_i\}, i=1,...,n。また、Xi∼U[ai,bi],ai,bi&gt;0Xi∼U[ai,bi],ai,bi&gt;0X_i \sim U[a_i, b_i], \; a_i, b_i >0。さらに、ki=cai+(1−c)bi,0&lt;c&lt;1ki=cai+(1−c)bi,0&lt;c&lt;1k_i = ca_i + (1-c)b_i,\;\; 0 k_i) = 1- \Pr(X_i \le k_i) =1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c=1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c= 1- \frac {k_i - a_i}{b_i-a_i} = 1-\frac {(1-c)(b_i-a_i)}{b_i-a_i} =c したがって、全体として FZi(zi)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪0zi&lt;aizi−aibi−aiai≤zi&lt;ki1ki≤ziFZi(zi)={0zi&lt;aizi−aibi−aiai≤zi&lt;ki1ki≤ziF_{Z_i}(z_i) = \begin{cases} 0\qquad z_i0zi=kizi=kiz_i = k_i 総じて、それは現実を統一することを意味します。 確率変数S_n \ equiv \ sum_ {i = …

2
Distribution \ CLTの収束
その所与の、条件競合製品。です。は限界的な歪みがあります。Poisson()の場合、は正の定数です。N=nN=nN = nYYYχ2(2n)χ2(2n)\chi ^2(2n)NNNθθ\thetaθθ\theta 、それを示すよう、分布です。(Y − E (Y ))/ √θ→∞θ→∞\theta \rightarrow \infty (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1) 誰かがこれを解決するための戦略を提案できますか?CLT(Central Limit Theorem)を使用する必要があるようですが、に関する情報を独自に取得するのは難しいようです。サンプルを取り、を生成するために導入できるrvはありますか?YYYYYY これは宿題なのでヒントをいただければ幸いです。

1
モーメントが存在しない場合のCLTの例
考慮してくださいXn=⎧⎩⎨1−12kw.p. (1−2−n)/2w.p. (1−2−n)/2w.p. 2−k for k&gt;nXn={1w.p. (1−2−n)/2−1w.p. (1−2−n)/22kw.p. 2−k for k&gt;nX_n = \begin{cases} 1 & \text{w.p. } (1 - 2^{-n})/2\\ -1 & \text{w.p. } (1 - 2^{-n})/2\\ 2^k & \text{w.p. } 2^{-k} \text{ for } k > n\\ \end{cases} これには無限のモーメントがあるにもかかわらず、あることを示す必要がありn−−√(X¯n)→dN(0,1)n(X¯n)→dN(0,1)\sqrt{n}(\bar{X}_n) \overset{d}{\to} N(0,1) 私は、リービーの連続性定理を使用してこれを表示しようとしました。つまり、左側の特性関数が標準法線の特性関数に収束することを示してみました。しかし、これを示すのは不可能のようでした。 この問題に対するヒントは、各を切り捨てることでした。つまり、とし、リンデバーグ条件を使用して、。XiXiX_iYni=XiI{Xi≤n}Yni=XiI{Xi≤n}Y_{ni} = X_i I\{X_i \leq n\}n−−√Y¯n→dN(0,1)nY¯n→dN(0,1)\sqrt{n} \bar{Y}_n …

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn &lt;- function(data, indices){ data &lt;- data[indices, ] mod &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out &lt;- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.