自己相関時間の定義(有効なサンプルサイズの場合)


23

文献には、弱定常時系列の自己相関時間に関する2つの定義があります。

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

ここで、はラグでの自己相関です。 kρk=Cov[Xt,Xt+h]Var[Xt]k

自己相関時間の1つの用途は、「有効なサンプルサイズ」を見つけることです。時系列の観測値があり、その自己相関時間がわかっている場合、τnτ

neff=nτ

平均を求めるために、相関するサンプルの代わりに独立したサンプル。データからを推定することは簡単ではありませんが、その方法はいくつかあります(Thompson 2010を参照)。τnτ

絶対値なしの定義は、文献ではより一般的です。しかし、可能性を認めています。Rと「coda」パッケージの使用:τ A < 1τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

「coda」の「effectiveSize」関数は、上記のと同等の自己相関時間の定義を使用します。負のAR係数とAR(1)プロセスが持っている:いくつかの他のRパッケージは、計算有効サンプルサイズまたは自己相関時間、私はこれと矛盾所与の結果を試したすべてのものということがそこにいるより多くの相関より効果的なサンプルを時系列。これは奇妙に思えます。 τa

明らかに、これは自己相関時間の定義では決して起こり得ません。τb

自己相関時間の正しい定義は何ですか?有効なサンプルサイズの理解に何か問題がありますか?上記の結果は間違っているように思われます...何が起きているのでしょうか?neff>n


私が誤解していないことを確認するために、それはではなくあると想定されていませんか?hCov(Xt,Xt+k)h
sachinruk

2
2番目の定義、つまります。あなたが見つけた文献を提供してもらえますか?τb
ハリー

回答:


17

まず、「有効なサンプルサイズ」の適切な定義は、非常に具体的な質問にリンクされたIMOです。場合は同一の平均値と一緒に配布されているμ、分散1の経験的平均 μ = 1X1,X2,μμの不偏推定量です。しかし、その分散はどうですか?以下のための独立した変数の分散は、N-1。弱い定常時系列の場合は、の分散 μは、ある 1

μ^=1nk=1nバツk
μn1μ^ 近似は、十分に大きいnに対して有効です。我々は定義する場合、NEFF=N/τA、弱定常時系列のための経験的な平均値の分散はおよそN - 1 EFF我々が持っていた場合と同じ分散であり、nはEFF独立したサンプルを。従って、nはEFF=N/τ我々は経験的な平均値の分散を求める場合には適切な定義です。他の目的には不適切かもしれません。
1n2kl=1ncovバツkバツl=1n1+2n1nρ1+n2nρ2++1nρn1τan
nneff=n/τaneff1neffneff=n/τa

n1neff>n


2
モンテカルロシミュレーションでの負の相関の使用について詳しく知りたい場合は、「antithetic variates」をググリングしてみてください。コースノートの詳細は、こちらまたはこちらをご覧ください
アンドリューティンカ

1

http://arxiv.org/pdf/1403.5536v1.pdfを参照

そして

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

有効なサンプルサイズのため。サンプル分散とバッチ平均による漸近マルコフ連鎖分散の比を使用する代替定式化がより適切な推定量であると思います。


4
これらのリンクの内容を詳しく説明していただけますか?現状では、これは私たちの基準で答えるには短すぎます!
kjetil bハルヴォルセン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.