タグ付けされた質問 「convergence」

収束とは、一般に、サンプルサイズが無限大になる傾向があるため、特定のサンプル量のシーケンスが定数に近づくことを意味します。収束は、いくつかの目標値で安定させるための反復アルゴリズムの特性でもあります。

1
ゲルマンとルービンの収束診断、ベクトルで動作するように一般化する方法は?
Gelman and Rubin診断は、並行して実行される複数のmcmcチェーンの収束を確認するために使用されます。チェーン内の分散をチェーン間分散と比較します。説明は以下のとおりです。 ステップ(パラメーターごと): 過分散した開始値から長さ2nのm≥2チェーンを実行します。 各チェーンの最初のn個のドローを破棄します。 チェーン内およびチェーン間分散を計算します。 チェーン内およびチェーン間分散の加重和として、パラメーターの推定分散を計算します。 潜在的な縮尺率を計算します。 リストアイテム この統計を使用したいのですが、使用したい変数はランダムなベクトルです。 この場合、共分散行列の平均を取ることは理にかなっていますか?

4
一貫性のあるものと漸近的に偏らないものの違いを直感的に理解する
私は、一貫性のある用語と漸近的に偏りのない用語の違いと実際的な違いを直感的に理解し、感じるようにしています。私はそれらの数学的/統計的定義を知っていますが、私は直感的な何かを探しています。私には、それぞれの定義を見ると、ほとんど同じように見えます。違いは微妙なはずだと思いますが、わかりません。私は違いを視覚化しようとしていますが、それはできません。誰か助けてもらえますか?

1
収束速度が速いため、という仮説検定にを使用しますか?
私が持っていると仮定し IIDされていると私は、という仮説のテストをしたい 0が、私は大きなNを持っており、中心極限定理を使用することができるとしています。私はまた、テストを行うことができその試験と同等であるべきである0である、 0またある、収束をカイ二乗、ここには法線に収束します。のでより速い収束率を持って、私は、検定統計量のためにすることを使用してはならないので、私はより速い収束率を取得し、テストをより効率的になりますか?X1,…,XnX1,…,XnX_1,\ldots,X_nμμ\muμ2μ2\mu^2μμ\mun(X¯2−0)n(X¯2−0)n(\bar{X}^2 - 0)n−−√(X¯−0)n(X¯−0)\sqrt{n}(\bar{X} - 0)X¯2X¯2\bar{X}^2 私はこの論理が間違っていることを知っていますが、私は長い間考え、検索してきましたが、理由を理解することはできません。

2
Slutskyの定理は、2つのシーケンスの両方が非縮退ランダム変数に収束する場合でも有効ですか?
Slutskyの定理に関するいくつかの詳細について混乱しています。 ましょう{Xn}{Xn}\{X_n\}、{Yn}{Yn}\{Y_n\}スカラー/ベクトル/行列ランダム要素の二つの配列です。 もしXnXnX_nランダム要素に分布収束XXX及びYnYnY_n 収束定数に確率でcccは、Xn+Yn XnYn Xn/Yn →d X+c→d cX→d X/c,Xn+Yn →d X+cXnYn →d cXXn/Yn →d X/c,\eqalign{ X_{n}+Y_{n}\ &{\xrightarrow {d}}\ X+c\\ X_{n}Y_{n}\ &{\xrightarrow {d}}\ cX\\ X_{n}/Y_{n}\ &{\xrightarrow {d}}\ X/c, } ことを条件cccここで、可逆である→d→d{\xrightarrow {d}}分布の収束を表します。 Slutskyの定理の両方のシーケンスが非縮退ランダム変数に収束する場合、定理はまだ有効であり、有効でない場合(誰かが例を提供できますか?)、有効にするための追加条件は何ですか?

3
確率の収束について
ましょう{Xn}n≥1{Xn}n≥1\{X_n\}_{n\geq 1}ランダム変数STの配列であるXn→aXn→aX_n \to a確率で&gt; 0は固定された定数です。私は次を見せようとしています: √a&gt;0a&gt;0a>0Xn−−−√→a−−√Xn→a\sqrt{X_n} \to \sqrt{a} と aXn→1aXn→1\frac{a}{X_n}\to 1 両方の確率。私の論理が健全かどうかを確認するためにここにいます これが私の仕事です 試行 最初の部分については、我々は持っています |Xn−−−√−a−−√|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn−−−√+a−−√|=ϵ|(Xn−−−√−sqrta)+2a−−√||Xn−a|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn+a|=ϵ|(Xn−sqrta)+2a||\sqrt{X_n}-\sqrt{a}|<\epsilon \impliedby |X_n-a|<\epsilon|\sqrt{X_n}+\sqrt{a}|=\epsilon|(\sqrt{X_n}-sqrt{a})+2\sqrt{a}| ≤ϵ|Xn−−−√−a−−√|+2ϵa−−√&lt;ϵ2+2ϵa−−√≤ϵ|Xn−a|+2ϵa&lt;ϵ2+2ϵa\leq \epsilon|\sqrt{X_n}-\sqrt{a}|+2\epsilon\sqrt{a}<\epsilon^2+2\epsilon\sqrt{a} お知らせ ϵ2+2ϵa−−√&gt;ϵa−−√ϵ2+2ϵa&gt;ϵa\epsilon^2+2\epsilon\sqrt{a}>\epsilon\sqrt{a} その後、 P(|Xn−−−√−a−−√|≤ϵ)≥P(|Xn−a|≤ϵa−−√)→1asn→∞P(|Xn−a|≤ϵ)≥P(|Xn−a|≤ϵa)→1asn→∞P(|\sqrt{X_n}-\sqrt{a}|\leq \epsilon)\geq P(|X_n-a|\leq \epsilon\sqrt{a})\to 1 \;\;as\;n\to\infty ⟹Xn−−−√→a−−√inprobability⟹Xn→ainprobability\implies \sqrt{X_n}\to\sqrt{a} \;\;in\;probability 第二部については、 |aXn−1|=|Xn−aXn|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn||aXn−1|=|Xn−aXn|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn||\frac{a}{X_n}-1|=|\frac{X_n-a}{X_n}|<\epsilon \impliedby |X_n-a|<\epsilon|X_n| ここで、Xn→aXn→aX_n \to a asn→∞n→∞n \to \infty、XnXnX_nは有界シーケンスです。つまり、実数が存在するM&lt;∞M&lt;∞M<\infty STは|Xn|≤M|Xn|≤M|X_n|\leq M。したがって、 確率で見ると、 P (| a|Xn−a|&lt;ϵ|Xn|⟸|Xn−a|&lt;ϵM|Xn−a|&lt;ϵ|Xn|⟸|Xn−a|&lt;ϵM|X_n-a|<\epsilon|X_n|\impliedby |X_n-a|<\epsilon MP(|aXn−1|&gt;ϵ)=P(|Xn−a|&gt;ϵ|Xn|)≤P(|Xn−a|&gt;ϵM)→0asn→∞P(|aXn−1|&gt;ϵ)=P(|Xn−a|&gt;ϵ|Xn|)≤P(|Xn−a|&gt;ϵM)→0asn→∞P(|\frac{a}{X_n}-1|>\epsilon)=P(|X_n-a|>\epsilon|X_n|)\leq …

2
より多くのデータが収集されると、尤度比はどうなりますか?
ましょう、及び密度も、あなたが持っていると仮定し、。尤度比 はどうなりますか?(収束しますか?何に?)GのHは、xはiは〜H I ∈ N N Πは iは= 1 fは(X I)fffggghhhxi∼hxi∼hx_i \sim hi∈Ni∈Ni \in \mathbb{N} n→∞∏i=1nf(xi)g(xi)∏i=1nf(xi)g(xi) \prod_{i=1}^n \frac{f(x_i)}{g(x_i)} n→∞n→∞n \rightarrow \infty たとえば、と仮定します。一般的なケースも興味深いです。h=gh=gh = g

3
さらに別の中心極限定理の質問
ましょう持つ独立したベルヌーイ・ランダム変数のシーケンスである セット 示すこと分布に収束する標準正規変数にとして無限大になる傾向があります。、P { X K = 1 } = 1 - P { X K = 0 } = 1{Xn:n≥1}{Xn:n≥1}\{X_n:n\ge1\}Sn= n ∑ k=1(Xk−1P{Xk=1}=1−P{Xk=0}=1k.P{Xk=1}=1−P{Xk=0}=1k.P\{X_k=1\}=1-P\{X_k=0\}=\frac{1}{k}. SnSn=∑k=1n(Xk−1k), B2n=∑k=1nk−1k2Sn=∑k=1n(Xk−1k), Bn2=∑k=1nk−1k2S_n=\sum^{n}_{k=1}\left(X_k-\frac{1}{k}\right), \ B_n^2=\sum^{n}_{k=1}\frac{k-1}{k^2} ZnSnBnSnBn\frac{S_n}{B_n}ZZZnnn 私の試みはLyapunov CLTを使用することです。したがって、ような が存在することを示す必要がありますδ&gt;0δ&gt;0\delta>0リムn → ∞1B2 + δんΣk = 1んE[ | バツk− 1k|2 + δ] = 0。limn→∞1Bn2+δ∑k=1nE[|Xk−1k|2+δ]=0.\lim_{n\rightarrow \infty}\frac{1}{B_n^{2+\delta}}\sum_{k=1}^{n}E[|X_k-\frac{1}{k}|^{2+\delta}]=0. したがって、n ∑ k …

1
MLEである
仮定(X,Y)(X,Y)(X,Y) PDFを有します fθ(x,y)=e−(x/θ+θy)1x&gt;0,y&gt;0,θ&gt;0fθ(x,y)=e−(x/θ+θy)1x&gt;0,y&gt;0,θ&gt;0f_{\theta}(x,y)=e^{-(x/\theta+\theta y)}\mathbf1_{x>0,y>0}\quad,\,\theta>0 試料の密度(X,Y)=(Xi,Yi)1≤i≤n(X,Y)=(Xi,Yi)1≤i≤n(\mathbf X,\mathbf Y)=(X_i,Y_i)_{1\le i\le n}この集団から引き出され、したがってあります gθ(x,y)=∏i=1nfθ(xi,yi)=exp[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn&gt;0=exp[−nx¯θ−θny¯]1x(1),y(1)&gt;0,θ&gt;0gθ(x,y)=∏i=1nfθ(xi,yi)=exp⁡[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn&gt;0=exp⁡[−nx¯θ−θny¯]1x(1),y(1)&gt;0,θ&gt;0\begin{align} g_{\theta}(\mathbf x,\mathbf y)&=\prod_{i=1}^n f_{\theta}(x_i,y_i) \\&=\exp\left[{-\sum_{i=1}^n\left(\frac{x_i}{\theta}+\theta y_i\right)}\right]\mathbf1_{x_1,\ldots,x_n,y_1,\ldots,y_n>0} \\&=\exp\left[-\frac{n\bar x}{\theta}-\theta n\bar y\right]\mathbf1_{x_{(1)},y_{(1)}>0}\quad,\,\theta>0 \end{align} θθ\thetaの最尤推定量は、次のように導出できます。 θ^(X,Y)=X¯¯¯¯Y¯¯¯¯−−−√θ^(X,Y)=X¯Y¯\hat\theta(\mathbf X,\mathbf Y)=\sqrt\frac{\overline X}{\overline Y} このMLEの制限分布が正常かどうかを知りたいです。 のための十分統計ことは明らかであるθθ\thetaサンプルに基づいている(X¯¯¯¯,Y¯¯¯¯)(X¯,Y¯)(\overline X,\overline Y)。 さて、MLEが通常の1パラメータ指数ファミリーのメンバーであれば、疑いもなくMLEは漸近的に正常であると私は言ったでしょう。1次元のパラメーター(たとえば、N(θ,θ2)N(θ,θ2)N(\theta,\theta^2)分布のように)に対して2次元の十分な統計量があるため、そうではないと思います。 事実を使用していることをXXXとYYY実際の独立した指数変数であり、私がすることができます示しての正確な分布というθはそのようになっていますθ^θ^\hat\theta θ^θ=dF−−√, where F∼F2n,2nθ^θ=dF, where F∼F2n,2n\frac{\hat\theta}{\theta}\stackrel{d}{=} \sqrt F\quad,\text{ where }F\sim F_{2n,2n} ここから限界分布を見つけることはできません。 代わりに、私はそのWLLNで主張することができX¯¯¯¯⟶PθX¯⟶Pθ\overline X\stackrel{P}\longrightarrow\thetaとY¯¯¯¯⟶P1/θY¯⟶P1/θ\overline Y\stackrel{P}\longrightarrow 1/\thetaので、そのθθ^⟶Pθθ^⟶Pθ\hat\theta\stackrel{P}\longrightarrow\theta。 これは、と言われますθ分布の収束をしますθ。以来、しかし、これは、驚きと来ないθはの「良い」推定量ですθ。そして、この結果は√のようなものがθ^θ^\hat\thetaθθ\thetaθ^θ^\hat\thetaθθ\thetan−−√(θ^−θ)n(θ^−θ)\sqrt n(\hat\theta-\theta)で漸近的に正常かではありません。CLTを使用しても妥当な議論を思い付くことはできませんでした。 …

3
2つの類似した時系列がいつ分岐し始めるかを検証する統計的テスト
タイトルから、2つの類似した時系列間の有意差を特定するのに役立つ統計的検定が存在するかどうかを知りたいと思います。具体的には、下の図を見て、系列が時間t1で分岐し始めたこと、つまり、系列間の差が大きくなり始めたことを検出したいと思います。さらに、シリーズ間の差が有意でない場合も検出します。 これを行うのに役立つ統計的検定はありますか?

2
反例を証明または提供します。 もし、次いで、XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, (∏ n i = 1 X i )1 / nXXX(∏ni=1Xi)1/n(∏i=1nXi)1/n(\prod_{i=1}^{n}X_i)^{1/n} →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, XXX 私の試み: FALSE:が負の値のみを取ることができると仮定し、と仮定しますX N ≡ X ∀ n個XXXXn≡XXn≡XX_n \equiv X ∀∀\forall nnn THEN、但しもため、厳密に負ではありません。代わりに、ネガティブからポジティブおよびネガティブへと切り替わります。したがって、はほぼ確実に収束しません。XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, n (∏ n i = 1 X i )1 / n(∏ n i …

1
がが無限大に近づくにつれて正規分布に収束するという定理はありますか?
レッツ、定義された平均値との任意の分布で、および標準偏差、。中心極限定理は、 が標準正規分布に分布で収束することを示しています。をサンプル標準偏差で置き換える場合、 がt分布に収束して収束するという定理はあり ますか?大きなためXXXμμ\muσσ\sigman−−√X¯−μσnX¯−μσ \sqrt{n}\frac{\bar{X} - \mu}{\sigma} σσ\sigmaSSSn−−√X¯−μSnX¯−μS \sqrt{n}\frac{\bar{X} - \mu}{S} nnnt分布が正規分布に近づくと、定理は、存在する場合、制限が標準正規分布であると述べることができます。したがって、t分布はあまり有用ではないように思えますがほぼ正常な場合にのみ有用です。これは事実ですか? XXX 可能であれば、が置き換えられたときに、このCLTの証明を含む参照を示しますか?そのような参照は、測定理論の概念を使用することができます。しかし、この時点で私にとって何でも素晴らしいことです。σσ\sigmaSSS

1
注文統計を介して推定値がパーセンタイルに収束することを示します
LET からサンプリングIIDランダム変数のシーケンスであるアルファ安定分布パラメータで、α = 1.5 、バツ1、X2、… 、X3 nX1,X2,…,X3nX_1, X_2, \ldots, X_{3n}。α = 1.5 、β= 0 、c = 1.0 、μ = 1.0α=1.5,β=0,c=1.0,μ=1.0\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0 今配列検討、Y J + 1 = X 3 J + 1 X 3 J + 2 X …

1
K-means:実際の状況での反復回数は?
私はデータマイニングやビッグデータの業界での経験がないので、いくつかの経験を共有してほしいと思います。 人々は実際に本当に大きなデータセットでk-means、PAM、CLARAなどを実行していますか?または、ランダムにサンプルをランダムに選択しますか?データセットのサンプルを取得するだけの場合、データセットが正常に分散されていなければ、結果は信頼できますか? これらのアルゴリズムを実行する実際の状況では、収束が発生するまでに通常何回の反復が必要かを知ることができますか?または、反復の数は常にデータサイズとともに増加しますか? 収束する前に反復アルゴリズムを終了するアプローチを開発しようと考えていますが、結果はまだ許容範囲なので、これを求めています。計算のコストと時間を節約できるように、反復数が1,000を超える場合は、試してみる価値があると思います。どう思いますか?

1
ほぼ確実な収束は完全な収束を意味するものではない
すべての場合は完全に収束すると言い。X1,X2,…X1,X2,…X_1, X_2, \ldotsXXXϵ&gt;0ϵ&gt;0\epsilon>0 ∑∞n=1P(|Xn−X|&gt;ϵ)&lt;∞∑n=1∞P(|Xn−X|&gt;ϵ)&lt;∞\sum_{n=1}^\infty \text{P}\left(|X_n-X|>\epsilon\right) <\infty ボレル・カンテッリの補題は、完全な収束がほぼ確実な収束を意味することを証明するのは簡単です。 ボレルカンテッリでは収束を証明できない場合の例を探しています。これはほぼ完全にではなく確実に収束する一連の確率変数です。

1
R線形回帰のカテゴリ変数「非表示」の値
これは私が何度か遭遇した例にすぎないため、サンプルデータはありません。Rで線形回帰モデルを実行する: a.lm = lm(Y ~ x1 + x2) x1は連続変数です。x2カテゴリ型で、「低」、「中」、「高」の3つの値があります。ただし、Rによって与えられる出力は次のようになります。 summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 私は、Rがそのような要因(要因x2であること)に何らかのダミーコーディングを導入していることを理解しています。私はただ疑問に思っていx2ます。「高」の値をどのように解釈しますか?たとえば、ここで示した例の「High」x2は応答変数にどのような影響を与えますか? これの例を他の場所(例:ここ)で見ましたが、理解できる説明は見つかりませんでした。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.