タグ付けされた質問 「autocorrelation」

自己相関(シリアル相関)は、一連のデータとそれ自体との遅延の相関です。これは時系列分析の重要なトピックです。

1
連結された独立したAR(1)プロセスの自己相関
ましょう IIDは各ドローすなわち長さ10のベクトルであるAR(1)プロセスから描画連結することによって形成された確率論的プロセスであり、はAR(1)プロセスの実現です。は同じプロセスから描画されますが、最初の10個の観測から独立しています。など。{ X 1、X 2、… 、X 10 } { X 11、X 12、… 、X 20 }{ Xt}{Xt}\left\{X_t\right\}{ X1、X2、… 、X10}{バツ1、バツ2、…、バツ10}\left\{X_1, X_2, \ldots, X_{10}\right\}{ X11、X12、… 、X20}{バツ11、バツ12、…、バツ20}\left\{X_{11}, X_{12}, \ldots, X_{20}\right\} ACF何をします -それを呼び出すのように見て- ?仮定により、10個の観測値の各ブロックは他のすべてのブロックから独立しているため、長さラグの場合、はゼロであると期待していました。ρ (L ) ρ (L ) L ≥ 10バツバツXρ (l )ρ(l)\rho\left(l\right)ρ (l )ρ(l)\rho\left(l\right)L ≥ 10l≥10l \geq 10 しかし、データをシミュレートすると、次のようになります。 simulate_ar1 <- function(n, burn_in=NA) …

1
MCMCによってサンプリングされた共分散行列の自己相関を計算できますか?
MCMCがWishart分布から共分散行列をサンプリングするとします。 すべての反復で、Wishart分布から新しいサンプル行列を取得します。SiSiS_i 質問:すべてのサンプルを含むトレースがある場合、これらのサンプルの自己相関をプロットできますか?S1,...SnS1,...SnS_1,...S_n の自己相関を使用している人を見たことがありが、正当な理由は見つかりませんでした。log(det(S))log⁡(det(S))\log(\det(S))

1
複数のARIMAモデルはデータによく適合します。順序を決定する方法は?正しいアプローチ?
2つの時系列(男性と女性のモデルのパラメーター)があり、予測を行うために適切なARIMAモデルを特定することを目指しています。私の時系列は次のようになります。 プロットとACFは非定常を示しています(ACFのスパイクは非常にゆっくりとカットオフします)。したがって、私は差分を使用して取得します: このプロットは、系列が静止している可能性があり、kpssテストとadfテストの適用がこの仮説をサポートしていることを示しています。 男性シリーズから始めて、以下の観察を行います。 ラグ1、4、5、26および27での経験的自己相関は、ゼロとは有意に異なります。 ACFはカットオフ(?)しますが、ラグ26と27での比較的大きなスパイクが心配です。 ラグ1と2での経験的部分自己相関のみが、ゼロと有意に異なります。 これらの観察のみに基づいて、差分時系列に純粋なARモデルまたはMAモデルを選択する必要がある場合、次のように主張してAR(2)モデルを選択する傾向があります。 ラグが2より大きい場合、部分的な自己相関はありません。 ACFは、27ラグ付近の領域を除いてカットオフします(これらの少数の外れ値だけが指標であり、混合ARMAモデルが適切であることを示しますか?) または以下のように主張することによりMA(1)モデル: PACFは明らかにカットオフ ラグには、マグニチュードの臨界値を超える1〜4のスパイクがあります。これは、点線領域の外にあることが許可されている3つのスパイク(60のうち95%)より1つ多い「唯一の」ものです。 ARIMA(1,1,1)モデルの特性はなく、p + q> 2のACFおよびPACFに基づいてARIMAモデルのpおよびqの次数を選択することは困難になります。 auto.arima()をAIC基準で使用すると(AICまたはAICCを使用する必要がありますか)、次の結果が得られます。 ドリフトのあるARIMA(2,1,1)。AIC = 280.2783 ドリフト付きARIMA(0,1,1)。AIC = 280.2784 ドリフト付きARIMA(2,1,0)。AIC = 281.437 検討した3つのモデルすべてがホワイトノイズの残差を示しています。 要約した質問は次のとおりです。 時系列のACFは、26ラグ前後の急上昇にもかかわらず、まだ切断されていると説明できますか? これらの外れ値は、混合ARMAモデルがより適切である可能性があることを示す指標ですか? どの情報基準を選択すればよいですか?AIC?AICC? AICが最も高い3つのモデルの残差はすべてホワイトノイズ動作を示しますが、AICの差はごくわずかです。パラメータが最も少ないもの、つまりARIMA(0,1,1)を使用する必要がありますか? 私の議論は一般的にもっともらしいですか? どちらのモデルが優れているかを判断する可能性はありますか?たとえば、AICが最も高い2つのモデルでバックテストを実行して予測の妥当性をテストする必要がありますか? 編集:ここに私のデータがあります: -5.9112948202 -5.3429985122 -4.7382340534 -3.1129015623 -3.0350910288 -2.3218904871 -1.7926701792 -1.1417358384 -0.6665592055 -0.2907748318 0.2899480865 0.4637205370 0.5826312749 0.3869227286 …

1
Local Moran's Iのp値が有意である場合、Zスコアを確認する必要がありますか?
私が使用しているデータセットには、エリアごとの収入データが含まれています。次の図に示すように、値は通常は分散されません。Global Moran's Iは有意な空間パターンを示し、Local Moran's Iは有意なホットスポットとコールドスポットを検出します(p値による)。Zスコアを確認すると、コールドスポットが有意なレベルに達していないことがわかります。これは所得の分布に起因するのでしょうか?別にやるべきことはありますか?たぶん、ログ収入を使うのでしょうか? または、p値に問題がない限り(=有意、<0.05)、Zスコアを単に無視できますか? (PySALを使用してグローバルとローカルの両方のモランIを計算します。) これはログ収入のヒストグラムです: 更新: 私は最近、収入値が通常分布している別の国から別の収入データセットを取得しました。このデータセットのローカルモランのI計算では、p値とzスコアの両方に従って、重要なホットスポットとコールドスポットが生じます。

1
移動標準偏差の計算から生じる時系列の自己相関関数とは何ですか?
たとえば、観測の時系列があり、その時系列の分散の測定値を、幅ローリングウィンドウの標準偏差(SD)として計算し、そのウィンドウが系列上で単一の時間ステップで移動するとします。さらに仮定するW = ⌈ N / 2 ⌉、ここでnは観測の数であり、ウィンドウが右に整列されます。私が観察する必要がありwは= ⌈ N / 2 ⌉私は、時系列のSDの移動ウィンドウ推定値を得始める前に、系列の値。wwwW = ⌈ N / 2 ⌉w=⌈n/2⌉w = \left \lceil{n/2}\right \rceilんnnW = ⌈ N / 2 ⌉w=⌈n/2⌉w = \left \lceil{n/2}\right \rceil SD値の新しい時系列のACFに期待される形式はありますか?以前の値への依存はのウィンドウに関連していると思いますが、そのようなシリーズのACFはM A(w )プロセスのACFに関連していますか?wwwM A(w)MA(w)\mathrm{MA}(w) バックグラウンド 移動するウィンドウを介して、元の時系列の分散の時系列を導出することの影響を検討しようとしています。SD値の派生シリーズを計算したら、通常適用される次のステップは、SD値の派生シリーズに何らかの傾向があるかどうかを確認することです。派生シリーズの各値は、元のシリーズの以前の値にある程度依存するため、派生シリーズの値は独立していません。したがって、頻繁に発生する問題は、独立性の欠如をどのように説明するかです。 そのような計算(移動ウィンドウ)は、切迫したしきい値応答(いわゆるクリティカル遷移)のインジケーター(分散の増加、AR(1)係数の増加)の証拠を探すために時系列で行われることがよくあります。

1
通常のクリギングの問題
私は通常のクリギングに関連するこのウィキの記事をフォローしていました これで、4つの変数の共分散行列は次のようになります。 1 0.740818220681718 0.548811636094027 0.406569659740599 0.740818220681718 1 0.740818220681718 0.548811636094027 0.548811636094027 0.740818220681718 1 0.740818220681718 0.406569659740599 0.548811636094027 0.740818220681718 1 まあ、semvariogramとvariogramの関係は γ(h )/(C0 )= 1 − C(h )/ C(0 )γ(h)/(C0)=1−C(h)/C(0)\gamma(h)/(C0) = 1 - C(h)/C(0) そこで、も計算しました。次のように重みを計算しようとするとγ(h )γ(h)\gamma(h) A = 1.0000 0.7408 0.5488 1.0000 0.7408 1.0000 0.7408 1.0000 0.5488 0.7408 1.0000 1.0000 1.0000 1.0000 …

1
断面データでOLS回帰を実行する場合、残差の自己相関をテストする必要がありますか?
時間に関係なく、一連の観察結果があります。自己相関テストを実行する必要があるかどうか疑問に思っていますか?私のデータには時間コンポーネントがないので、それは意味がないように思えます。しかし、実際にシリアル相関LMテストを試したところ、残差の強い自己相関が示されました。それは意味がありますか?私が考えていることは、実際にデータセット内の観測値を可能な限り任意の順序に並べ替えることができ、これにより残差の自己相関が変化することです。だから問題は-この場合、自己相関についてまったく気にする必要がありますか?また、テストで示されている場合、Newey-Westを使用してSEを調整する必要がありますか?ありがとう!


1
MCMCサンプラーで自己相関を引き起こしているものは何ですか?
ベイジアン分析を実行するときに確認する必要があるのは、MCMCサンプルの自己相関です。しかし、この自己相関を引き起こしている原因がわかりません。 ここでは、彼らはそれを言っています [MCMCからの]高い自己相関サンプルは、変数間の強い相関によって引き起こされることがよくあります。 MCMCの高い自己相関サンプルの他の原因は何でしょうか。 JAGS出力で自己相関が観察されたときに確認するもののリストはありますか? ベイジアン分析で自己相関をどのように管理できますか?一部の人が痩せると言っているのを知っていますが、他の人はそれが悪いと言っています。より長い期間モデルを実行することは別の解決策であり、残念ながら時間がかかり、MCMC内のサンプルのトレースにも影響を与える場合があります。なぜ一部のアルゴリズムは、探索して無相関にするのにはるかに効果的ですか?最初にチェーンの初期値を変更する必要がありますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.