タグ付けされた質問 「autocorrelation」

自己相関(シリアル相関)は、一連のデータとそれ自体との遅延の相関です。これは時系列分析の重要なトピックです。

3
ARMA(2,1)プロセスの自己共分散-解析モデルの導出
次のように示されるARMA(2,1)プロセスの自己共分散関数の分析式を導出する必要があります。γ(k)γ(k)\gamma\left(k\right) yt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵtyt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵty_t=\phi_1y_{t-1}+\phi_2y_{t-2}+\theta_1\epsilon_{t-1}+\epsilon_t だから、私はそれを知っています: γ(k)=E[yt,yt−k]γ(k)=E[yt,yt−k]\gamma\left(k\right) = \mathrm{E}\left[y_t,y_{t-k}\right] だから私は書くことができます: γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]\gamma\left(k\right) = \phi_1 \mathrm{E}\left[y_{t-1}y_{t-k}\right]+\phi_2 \mathrm{E}\left[y_{t-2}y_{t-k}\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_{t-k}\right]+\mathrm{E}\left[\epsilon_{t}y_{t-k}\right] 次に、自己共分散関数の分析バージョンを導出するには、ある整数より大きいすべてのに対して有効な再帰が得られるまで、 -0、1、2 ...の値を代入する必要があります。kkkkkkk したがって、を代入し、これを実行して以下を取得します。k=0k=0k=0 γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt]γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt] \gamma \left(0\right) = \mathrm{E}\left[y_t,y_t\right] = \phi_1 \mathrm{E}\left[y_{t-1}y_t\right] + \phi_2 \mathrm{E}\left[y_{t-2}y_t\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_t\right]+\mathrm{E}\left[\epsilon_ty_t\right]\\ これで、これらの用語の最初の2つを単純化して、前と同じように置き換えることができます。ytyty_t γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)] \gamma\left(0\right) = \phi_1 \gamma\left(1\right) + \phi_2 \gamma\left(2\right)\\ + \theta_1 \mathrm{E}\left[\epsilon_{t-1} \left(\phi_1 y_{t-1} +\phi_2 y_{t-2} +\theta_1 \epsilon_{t-1} + \epsilon_t \right)\right]\\ …

2
自己相関とは何ですか?
これに先立ち、私はかなり深い数学的背景を持っていますが、時系列や統計モデリングを実際に扱ったことはありません。だからあなたは私にとても優しくする必要はありません:) 私は商業ビルでのエネルギー使用のモデリングに関するこの論文を読んでおり、著者はこの主張をしています: [自己相関が存在する]モデルは、本質的に自己相関のエネルギー使用の時系列データから開発されたためです。時系列データの純粋に決定論的なモデルには、自己相関があります。[より多くのフーリエ係数]がモデルに含まれている場合、自己相関が減少することがわかります。ただし、ほとんどの場合、フーリエモデルのCVは低くなります。したがって、このモデルは、高い精度を要求しない(本来の)実用的な目的に適している場合があります。 0.)「時系列データの純粋に決定的なモデルには自己相関がある」とはどういう意味ですか?これが何を意味するか、漠然と理解できます。たとえば、自己相関が0だった場合、時系列の次のポイントをどのように予測しますか。確かにこれは数学的な議論ではないので、これが0である理由です:) 1.)自己相関は基本的にあなたのモデルを殺したという印象を受けましたが、考えてみると、なぜそうなるべきなのか理解できません。では、なぜ自己相関が悪い(または良い)ものなのでしょうか? 2.)自己相関を扱うために聞いた解決策は、時系列を比較することです。著者の心を読もうとせずに、無視できない自己相関が存在する場合、なぜ差分を行わないのでしょうか? 3.)モデルに無視できない自己相関はどのような制限を課しますか?これはどこかの仮定ですか(つまり、単純な線形回帰でモデリングする場合の正規分布の残差)。 とにかく、これらが基本的な質問であればごめんなさい。助けてくれてありがとう。

1
線形回帰と空間的自己相関
リモートセンシングで取得したいくつかの変数を使用して、特定のエリアのツリーの高さを予測したい。おおよそのバイオマスなどと同様に、まず線形回帰を使用します(最良のアイデアではないことはわかっていますが、これは私のプロジェクトの必須ステップです)。私は空間的自己相関がどれほどひどく影響するか、それが可能な場合にこれを修正する最も簡単な方法は何かを知りたかった。ちなみに私はRですべてをやっています。

1
データが重複する時系列回帰
同じ株価指数、信用スプレッド(リスクフリー債と社債の月平均の差)の前年(12か月)の前年同期の株価収益率を回帰する回帰モデルを見ています利回り)、前年比インフレ率、鉱工業生産指数。 このように見えます(ただし、この場合はインド固有のデータを置き換えます)。 SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) + b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2) SP500YOYはSP500インデックスの前年比リターンです。これを計算するために、SP500値の月間平均が計算され、各月の前年比リターンに変換されます(つまり、Jan'10-Jan'11、Feb'10- 2月11日、3月10日〜3月11日、…)。説明変数の側では、SP500YOYの12か月の遅れた値が、時間TのCREDITSPREADおよびINFLATIONおよびINDUSTRIALPRODUCTIONの2期間前に使用されます。INFLATIONASYMMは、インフレが5.0%のしきい値を超えているかどうかのダミーです。括弧内のインデックスは、各変数の時間インデックスを示しています。 これは、標準のOLS線形回帰によって推定されます。このモデルを使用して、SP500のYOYリターンの1、2および3か月先を予測するには、インフレおよび鉱工業生産指数の3、4および5か月先の予測を生成する必要があります。これらの予測は、ARIMAモデルを2つのそれぞれに個別に適合させた後に行われます。1、2、3か月先のCreditSpread予測は、精神的な推定値として投入されています。 このOLS線形回帰が正しい/正しくない、効率的/非効率的、または一般的に有効な統計的実践であるかどうかを知りたい。 私が見る最初の問題は、重複するデータを使用することです。すなわち、株価指数の毎日の値は毎月平均化され、毎月ロールオーバーされる年間リターンの計算に使用されます。これにより、エラー用語が自己相関されます。次のいずれかの行で「修正」を使用する必要があると思います。 ホワイトの不均一分散共分散推定量 Newey&Westの不均一分散および自己相関整合(HAC)推定量 Hansen&Hodrickの不均一分散一貫バージョン このような重複データに標準のOLS線形回帰(補正なし)を適用することは本当に意味がありますか?さらに、SP500YOYを予測するために元のOLS線形回帰で使用する説明変数に3期間先のARIMA予測を使用しますか?私は以前にそのようなフォームを見たことがないので、重複する観測の使用を修正することを除いて、実際にそれを判断することはできません。

1
RのlmオブジェクトなしでNewey-West標準誤差を計算します
昨日、StackOverflowでこの質問をして回答を得ましたが、少しハックが多いようで、より良い見方があるかもしれません。 質問:ベクトル(この場合は株式の返品のベクトル)のNewey-West(HAC)標準誤差を計算したいと思います。パッケージNeweyWest()内の関数sandwichはこれを行いますがlm、入力としてオブジェクトを受け取ります。Joris Meysが提供する解決策は、ベクトルを1に射影することNeweyWest()です。これにより、私のベクトルが残差に変換され、に供給されます。あれは: as.numeric(NeweyWest(lm(rnorm(100) ~ 1))) 平均の分散。 私はこのようにするべきですか?または、私が望むことをより直接行う方法はありますか?ありがとう!

3
残差自己相関とラグ付き従属変数
時系列をモデル化するとき、(1)AR(1)プロセスなどのエラー項の相関構造をモデル化する可​​能性があります(2)説明変数として遅延従属変数を含む(右側) 私は彼らが(2)に進むべき実質的な理由であることを理解しています。 ただし、(1)または(2)のいずれか、あるいはその両方を行う方法論的な理由は何ですか?

1
自己相関の解釈方法
魚の動きのパターンに関する時系列データの自己相関を、その位置に基づいて計算しました:X(x.ts)およびY(y.ts)。 Rを使用して、次の関数を実行し、次のプロットを作成しました。 acf(x.ts,100) acf(y.ts,100) 私の質問は、これらのプロットをどのように解釈すればよいですか?あらゆる種類のパターンを報告するには、どのような情報が必要ですか?私はインターネットをサーフィンしてきましたが、それを効果的に説明する簡潔な方法をまだ見つけていません。 また、使用するラグの正しい量をどのように決定しますか?100を使用しましたが、多すぎるかどうかはわかりません。

2
RとExcelの自己相関の式
Rがlag-k自己相関を計算する方法を理解しようとしています(明らかに、MinitabとSASで使用されているのと同じ式です)ので、シリーズとそのk-lagedバージョンに適用されるExcelのCORREL関数の使用と比較できます。RとExcel(CORRELを使用)は、わずかに異なる自己相関値を提供します。 また、ある計算が他の計算よりも正しいかどうかを調べることにも興味があります。
13 r  sas  autocorrelation  excel 

1
ACF関数の信頼区間はどのように計算されますか?
たとえば、Rでacf()関数を呼び出すと、デフォルトでコレログラムがプロットされ、95%の信頼区間が描画されます。コードを見て、を呼び出すとplot(acf_object, ci.type="white")、次のように表示されます。 qnorm((1 + ci)/2)/sqrt(x$n.used) タイプホワイトノイズの上限として。誰かがこの方法の背後にある理論を説明できますか?なぜ1 + 0.95のqnormを取得してから2で割り、その後、観測数で割りますか?

1
MCMCで自己相関プロットを解釈する方法
「子犬の本」としても知られるジョンK.クルシュケの本Doing Bayesian Data Analysisを読んで、ベイジアン統計に精通しています。第9章では、この単純な例で階層モデルを紹介します: 及びベルヌーイ観察は3枚のコイン、それぞれ10のフリップあります。1つは9つのヘッド、他の5つはヘッド、もう1つは1つのヘッドです。yj iθjμκ〜BのEのR 、N 、O 、U 、L L I(θj)〜BのEのトン(μκ、(1-μ)κ)〜BのE T(Aμ、Bμ)〜G A M M A(Sκ、Rκ)yj私〜Bernoあなたはll私(θj)θj〜Beta(μκ、(1−μ)κ)μ〜Beta(Aμ、Bμ)κ〜Gamma(Sκ、Rκ)\begin{align} y_{ji} &\sim {\rm Bernoulli}(\theta_j) \\ \theta_j &\sim {\rm Beta}(\mu\kappa, (1-\mu)\kappa) \\ \mu &\sim {\rm Beta}(A_\mu, B_\mu) \\ \kappa &\sim {\rm Gamma}(S_\kappa, R_\kappa) \end{align} ハイパーパラメーターを推測するためにpymcを使用しました。 with pm.Model() as model: # define the mu = …

1
空間コレログラムでU字型のパターンが発生する原因は何ですか?
私は自分の作品で、このパターンがさまざまな距離で空間コレログラムを調べるときに、相関関係のU字型パターンが現れることに気付きました。より具体的には、近距離ビンでの強い正の相関は、距離とともに減少し、特定のポイントでピットに到達し、その後上昇します。 これは、保全エコロジーブログ、マクロエコロジープレイグラウンド(3)–空間的自己相関の例です。 これらのより強い距離でのより強い正の自己相関は、理論的にはToblerの最初の地理法則に違反しているため、データの他のパタ​​ーンが原因であると考えられます。私は、それらが特定の距離でゼロに到達し、その後さらに遠くで0にホバリングすることを期待します(これは、通常、低次のARまたはMA項を持つ時系列プロットで発生します)。 これを行うと、Googleの画像を検索する(参照あなたは、パターンのこの同じタイプの他のいくつかの例を見つけることができ、ここで一つの他の例のため)。パターンがモーラン私のために表示されますが、ゲーリーのC(のために表示されない場合GISサイト上のユーザーは、2つの例を掲載している1、2)。私自身の作業と組み合わせて、これらのパターンは元のデータで観察可能ですが、モデルに空間条件を適合させ、残差を確認すると、それらのパターンは持続していないようです。 私は、時系列分析で似たようなACFプロットを表示する例に出会ったことがないので、元のデータのどのパターンがこれを引き起こすのかわかりません。このコメントのScortchiは、正弦パターン がその時系列で省略された季節パターンによって引き起こされる可能性があると推測しています。同じタイプの空間トレンドが空間コレログラムでこのパターンを引き起こす可能性はありますか?それとも、相関関係の計算方法の他のアーティファクトですか? これが私の作品の例です。サンプルは非常に大きく、薄い灰色の線は、参照分布を生成するための元のデータの19個の順列のセットです(したがって、赤い線の分散はかなり小さいと予想されます)。したがって、プロットは最初のプロットほど劇的ではありませんが、ピットとその後の距離での上昇は、プロットにかなり容易に現れます。(また、他の例と同様に、私の落とし穴は否定的ではないことに注意してください。もしそれによって例が大きく異なる場合、私にはわかりません。) これは、上記のコレログラムを生成した空間分布を確認するためのデータのカーネル密度マップです。

2
完全に分散した点パターンでモランの私が「-1」に等しくないのはなぜですか
ウィキペディアは間違っていますか...それとも理解できませんか? ウィキペディア:白と黒の正方形(「チェスパターン」)は完全に分散しているため、モランのIは-1になります。白い四角がボードの半分に積み重ねられ、黒い四角がもう一方に積み重ねられた場合、モランのIは+1に近くなります。正方形の色のランダムな配置は、Moran's Iに0に近い値を与えます。 # Example data: x_coor<-rep(c(1:8), each=8) y_coor<-rep(c(1:8), length=64) my.values<-rep(c(1,0,1,0,1,0,1,0,0,1,0,1,0,1,0,1), length=64) rbPal <- colorRampPalette(c("darkorchid","darkorange")) my.Col <- rbPal(10)[as.numeric(cut(my.values,breaks = 10))] # plot the point pattern... plot(y_coor,x_coor,col = my.Col, pch=20, cex=8, xlim=c(0,9),ylim=c(0,9)) ご覧のとおり、ポイントは完全に分散しています # Distance matrix my.dists <- as.matrix(dist(cbind(x_coor,y_coor))) # ...inversed distance matrix my.dists.inv <- 1/my.dists # diagonals are "0" diag(my.dists.inv) …

2
残差がグラフィックから自己相関しているかどうかを確認する方法
OLS回帰を実行し、結果の残差をプロットする場合、残差が自己相関しているかどうかをどのように確認できますか?これについてのテストがあることは知っていますが(Durbin、Breusch-Godfrey)、プロットを見て、自己相関が問題になるかどうかを判断できるかどうか疑問に思っていました(異分散性のため、これはかなり簡単です)。

1
(パンダ)自己相関グラフは何を示していますか?
私は初心者で、自己相関グラフが何を示しているかを理解しようとしています。 このページや関連するウィキペディアのページなど、ここでは引用していないさまざまなソースからの説明をいくつか読んだことがあります。 私はこの非常に単純なコードを使用しており、1年間のインデックスに日付があり、値はインデックスごとに0から365に単純に増加しています。(1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365) import numpy as np import pandas as pd from pandas.plotting import autocorrelation_plot import matplotlib.pyplot as plt dr = pd.date_range(start='1984-01-01', end='1984-12-31') df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"]) autocorrelation_plot(df) plt.show() 印刷されるグラフがどこにあるか 私はなぜグラフが始まったのかを理解して見ることができます1.00: ラグゼロの自己相関は常に1です。これは、各項とそれ自体の間の自己相関を表すためです。値と遅延ゼロの値は常に同じになります。 これはいいですが、なぜこのラグ50のグラフの値が約0.65なのですか?そして、なぜそれが0を下回るのですか?私が持っているコードを示していなかった場合、この自己相関グラフが増加する値の時系列を示していると推定することは可能ですか?もしそうなら、それをどのように推論できるかを初心者に説明してみてください。

2
Rの多重線形回帰のフィッティング:自己相関残差
私はこのような方程式でRの多重線形回帰を推定しようとしています: regr <- lm(rate ~ constant + askings + questions + 0) 質問と質問は、で構成された四半期ごとのデータ時系列askings <- ts(...)です。 問題は、自己相関残差を得たことです。gls関数を使用して回帰を適合させることができることは知っていますが、gls関数に実装する必要がある正しいARまたはARMAエラー構造を識別する方法はわかりません。 私は今、再び推定しようとします、 gls(rate ~ constant + askings + questions + 0, correlation=corARMA(p=?,q=?)) しかし、残念ながら、pとqを特定するRの専門家でも統計の専門家でもありません。 誰かが私に有用なヒントを与えてくれたら嬉しいです。事前にどうもありがとうございました! ジョー

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.