文献には、弱定常時系列の自己相関時間に関する2つの定義があります。
ここで、はラグでの自己相関です。 k
自己相関時間の1つの用途は、「有効なサンプルサイズ」を見つけることです。時系列の観測値があり、その自己相関時間がわかっている場合、τ
平均を求めるために、相関するサンプルの代わりに独立したサンプル。データからを推定することは簡単ではありませんが、その方法はいくつかあります(Thompson 2010を参照)。τ
絶対値なしの定義は、文献ではより一般的です。しかし、可能性を認めています。Rと「coda」パッケージの使用:τ A < 1
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
「coda」の「effectiveSize」関数は、上記のと同等の自己相関時間の定義を使用します。負のAR係数とAR(1)プロセスが持っている:いくつかの他のRパッケージは、計算有効サンプルサイズまたは自己相関時間、私はこれと矛盾所与の結果を試したすべてのものということがそこにいるより多くの相関より効果的なサンプルを時系列。これは奇妙に思えます。
明らかに、これは自己相関時間の定義では決して起こり得ません。
自己相関時間の正しい定義は何ですか?有効なサンプルサイズの理解に何か問題がありますか?上記の結果は間違っているように思われます...何が起きているのでしょうか?