タグ付けされた質問 「stationarity」

厳密に定常的なプロセス(または時系列)とは、時間シフトにわたってジョイント分布が一定であるプロセスです。弱定常(または共分散定常)プロセスまたは系列は、平均および共分散関数(分散および自己相関関数)が時間とともに変化しないものです。

10
時系列が静止している必要があるのはなぜですか?
定常時系列とは、その平均と分散が時間とともに一定であることを理解しています。別のARIMAまたはARMモデルを実行する前に、データセットが静止していることを確認する必要がある理由を誰かが説明できますか?これは、自己相関および/または時間が要因ではない通常の回帰モデルにも適用されますか?

5
時系列を静止させる方法は?
違いをとる以外に、非定常時系列を静止にする他の手法は何ですか? 通常、ラグ演算子介して静止させることができる場合、シリーズは「オーダーpの積分」と呼ばれます。(1−L)PXt(1−L)PXt(1-L)^P X_t

3
時系列が定常か非定常かを知る方法は?
私はRを使用しています、私はGoogleで検索していることを学んだkpss.test()、PP.test()とadf.test()時系列の定常性について知るために使用されています。 しかし、私は彼らの結果を解釈できる統計学者ではありません > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01 > kpss.test(b$V1) KPSS Test for Level Stationarity data: b$V1 KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1 Warning message: In kpss.test(b$V1) : p-value greater than …

2
ランダムウォークが相互相関しているのはなぜですか?
平均して、ピアソン相関係数の絶対値は、ウォークの長さに関係なく、任意のペアの独立したランダムウォークに近い定数であることがわかりました。0.560.42 誰かがこの現象を説明できますか? ランダムなシーケンスのように、歩行の長さが長くなるにつれて相関が小さくなると予想しました。 私の実験では、ステップ平均0とステップ標準偏差1のランダムガウスウォークを使用しました。 更新: データをセンタリングするのを忘れていたので、0.56代わりにでした0.42。 相関を計算するPythonスクリプトは次のとおりです。 import numpy as np from itertools import combinations, accumulate import random def compute(length, count, seed, center=True): random.seed(seed) basis = [] for _i in range(count): walk = np.array(list(accumulate( random.gauss(0, 1) for _j in range(length) ))) if center: walk -= np.mean(walk) basis.append(walk / np.sqrt(np.dot(walk, walk))) …

2
相関はデータの定常性を前提としていますか?
市場間分析は、異なる市場間の関係を見つけることにより、市場の行動をモデル化する方法です。多くの場合、相関関係は、S&P 500と30年物米国債などの2つの市場間で計算されます。これらの計算は多くの場合、価格データに基づいていないため、定常時系列の定義に適合しないことは誰にとっても明らかです。 (代わりにリターンを使用して)可能な解決策はありませんが、データが非定常である相関の計算は有効な統計計算でもありますか? このような相関計算はやや信頼できない、または単なるナンセンスだと思いますか?


2
ARMAを使用した非定常プロセスのモデリングの結果は?
非定常時系列のモデリングにはARIMAを使用する必要があることを理解しています。また、ARMAは定常時系列にのみ使用されるべきだと私が読んだことすべてがあります。 私が理解しようとしているのは、モデルを誤分類し、d = 0非定常の時系列を仮定したときに実際に何が起こるかです。例えば: controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44) 制御データは次のようになります。 [1] 0.0000000 0.1240838 -1.4544087 -3.1943094 -5.6205257 [6] -8.5636126 -10.1573548 -9.2822666 -10.0174493 -11.0105225 [11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414 [16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267 [21] -22.6155812 -21.9189036 -20.2064343 -18.2516852 -15.5822178 [26] …

3
単位根のないシリーズが非定常である素晴らしい例?
拡張されたDickey-Fullerテストでnullを拒否する人が数回いるのを見て、シリーズが静止していることを主張しています(残念ながら、これらの主張の出所を示すことはできませんが、 1つまたは別のジャーナル)。 私はそれが誤解であると主張します(ユニットルートのヌルの拒否は、特にそのようなテストが行​​われたときに非定常性の代替形式がめったに調査または検討さえされないため、必ずしも定常級数を持つことと同じではありません)。 私が求めるのは次のいずれかです。 a)主張に対する良い明確な反例(私は今、カップルを想像することができますが、私以外の誰かが私が考えているものよりも良いものを持っていると確信しています)。おそらくデータ(シミュレーションまたは実物。両方とも利点があります)を使用した特定の状況の説明です。または b)増強されたディッキーフラーでの拒絶が定常性の確立と見なされるべきである理由を説得力のある議論 (または、(a)と(b)の両方が賢いと感じている場合)

2
自己回帰時系列モデルが非線形の場合でも、定常性が必要ですか?
時系列予測にリカレントニューラルネットワークを使用することについて考えます。基本的に、線形自動回帰を使用するARMAモデルとARIMAモデルと比較して、一種の一般化された非線形自動回帰を実装しています。 非線形自己回帰を実行している場合、時系列が静止している必要があり、ARIMAモデルで行う方法と異なる方法で実行する必要がありますか? または、モデルの非線形特性は、非定常時系列を処理する能力を与えますか? 別の言い方をすれば、ARMAモデルとARIMAモデルの定常性要件(平均および分散)は、これらのモデルが線形であるという事実によるものですか、それとも何か別のものによるものですか?

1
AR(2)の定常性の証明
平均中心のAR(2)プロセス考えます。ここで、ϵ tは標準のホワイトノイズプロセスです。ただ、単純化のために、私は呼ぶことにしましょうφ 1 = Bとφ 2 = Aを。特性の根に着目し、私が得た方程式Z 1 、2 = - B ± √バツt= ϕ1バツt − 1+ ϕ2バツt − 2+ ϵtXt=ϕ1Xt−1+ϕ2Xt−2+ϵtX_t=\phi_1X_{t-1}+\phi_2X_{t-2}+\epsilon_tϵtϵt\epsilon_tϕ1= bϕ1=b\phi_1=bϕ2= aϕ2=a\phi_{2}=a 教科書では、古典的な条件は以下の通りであります:{ | | < 1 a ± b < 1 根の不等式、つまりシステム{ | - B - √z1 、2= − b ± b2+ 4 a−−−−−−√2 az1,2=−b±b2+4a2az_{1,2}=\frac{-b\pm\sqrt{b^2+4a}}{2a}{ | | …

2
拡張ディッキーフラーテストとの混乱
私はelectricityRパッケージで利用可能なデータセットに取り組んでいますTSA。私の目的は、arimaモデルがこのデータに適切であり、最終的に適合するかどうかを調べることです。私は進んように、次: 第1回:次のグラフ場合は結果の時系列プロット 第二は:私のログを撮りたかったelectricity分散を安定化させ、その後、必要に応じて、一連の差分を取ったが、ちょうどその前に、私は上の定常性について試験をadf(Augmented Dickey Fuller)テストを使用した元のデータセットと、驚くべきことに、次のようになりました。 コードと結果: adf.test(electricity) Augmented Dickey-Fuller Test data: electricity Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 alternative hypothesis: stationary Warning message: In adf.test(electricity) : p-value smaller than printed p-value さて、私の初心者の時系列の概念によると、データが定常的であることを意味すると思います(小さなp値、非定常性の帰無仮説を棄却)。しかし、tsプロットを見ると、これが静止している可能性はありません。誰にもこれについて有効な説明がありますか?

2
推論にARIMAエラーを使用した回帰を使用する場合の定常性の要件は何ですか?
ARIMAエラーを伴う回帰(動的回帰)を推論に使用する場合の定常性の要件は何ですか? 具体的には、非定常連続結果変数、非定常連続予測変数およびダミー変数処理シリーズます。治療が、変化がゼロから2標準誤差以上離れた結果​​変数の変化と相関していたかどうかを知りたい。yyyバツaバツax_aバツbバツbx_b ARIMAエラーモデリングを使用して回帰を実行する前に、これらのシリーズを区別する必要があるかどうかはわかりません。別の質問への回答で、IrishStatは、while the original series exhibit non-stationarity this does not necessarily imply that differencing is needed in a causal model.それを追加すること を続けていると述べていunwarranted usage [of differencing] can create statistical/econometric nonsenseます。 SASユーザーガイドを示唆している、それはそう長く残差が非定常されているような差分せずに非定常シリーズへのARIMAエラーのフィット回帰モデルに罰金であること: 定常性の要件はノイズシリーズに適用されることに注意してください。入力変数がない場合、応答シリーズ(差分の後、平均項を引いたもの)とノイズシリーズは同じです。ただし、入力がある場合、入力の効果が除去された後のノイズ系列は残差です。 入力系列が静止している必要はありません。入力が非定常の場合、ノイズプロセスが定常的である場合でも、応答シリーズは非定常になります。 非定常入力シリーズを使用する場合、まずエラーのARMAモデルを使用せずに入力変数を近似し、次にノイズ部分のARMAモデルを特定する前に残差の定常性を考慮することができます。 一方、Rob HyndmanとGeorge Athanasopoulosは次のように主張しています。 ARMAエラーを含む回帰を推定する際の重要な考慮事項は、モデル内のすべての変数が最初に定常でなければならないことです。そのため、最初にytとすべての予測子が静止しているように見えることを確認する必要があります。これらのいずれかが非定常であるときにモデルを推定すると、推定係数が不正確になる可能性があります。(x1 、t、… 、xk 、t)(バツ1、t、…、バツk、t)(x_{1,t},\dots,x_{k,t}) ytyty_t これらのアドバイスは相互に排他的ですか?適用されたアナリストはどのように進めますか?

3
切片/ドリフトと線形トレンドでモデル化された時系列のどのDickey-Fullerテストですか?
短縮版: 定常性をテストしている時系列の気候データがあります。以前の調査に基づいて、データの基礎となる(または「生成」と呼ばれる)モデルには、インターセプト項と正の線形時間傾向があると予想しています。これらのデータの定常性をテストするには、インターセプトと時間トレンドを含むDickey-Fullerテストを使用する必要がありますか。方程式#3か? ∇yt=α0+α1t+δyt−1+ut∇yt=α0+α1t+δyt−1+ut\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t または、モデルの基礎となる方程式の最初の違いはインターセプトのみを持っているため、インターセプトのみを含むDFテストを使用する必要がありますか? ロングバージョン: 上記のように、定常性をテストする気候データの時系列があります。以前の調査に基づいて、データの基礎となるモデルには、切片項、正の線形時間傾向、および正規分布の誤差項があると予想しています。つまり、基礎となるモデルは次のようになります。 yt=a0+a1t+βyt−1+utyt=a0+a1t+βyt−1+uty_t = a_0 + a_1t + \beta y_{t-1} + u_t ここで、ututu_tは正規分布です。基礎となるモデルには切片と線形時間トレンドの両方があると仮定しているため、以下に示すように、単純なDickey-Fullerテストの等式#3で単位根をテストしました。 ∇yt=α0+α1t+δyt−1+ut∇yt=α0+α1t+δyt−1+ut\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t この検定は、帰無仮説を棄却し、基礎となるモデルが非定常であると結論付けることにつながる臨界値を返します。しかし、私の質問にもかかわらず、以来、私は、これを正しく適用していた場合に基礎となるモデルは、インターセプトとタイムトレンドを持っていると想定されるが、これは意味するものではありません。最初の違いその∇yt∇yt\nabla y_t同様になります。実際、私の数学が正しければ、まったく逆です。 モデルの基礎となる仮定の式に基づいて第1の差を計算する与える: ∇yt=yt−yt−1=[a0+a1t+βyt−1+ut]−[a0+a1(t−1)+βyt−2+ut−1]∇yt=yt−yt−1=[a0+a1t+βyt−1+ut]−[a0+a1(t−1)+βyt−2+ut−1]\nabla y_t = y_t - y_{t-1} = [a_0 + a_1t + \beta y_{t-1} + u_t] - [a_0 + a_1(t-1) + \beta …


2
定常性の直感的な説明
私はしばらくの間、頭の中で静止状態と格闘していました...これについてあなたはどう思いますか?ご意見やご感想をいただければ幸いです。 定常プロセスは、分布の平均と分散が一定に保たれるように時系列値を生成するプロセスです。厳密に言えば、これは弱い形式の定常性または共分散/平均定常性として知られています。 定常性の弱い形式は、時系列が時間全体にわたって一定の平均と分散を持っている場合です。 簡単に言えば、実務者は定常時系列はトレンドのない時系列であると言います-一定の平均を中心に変動し、一定の分散を持ちます。 異なるラグ間の共分散は一定であり、時系列の絶対位置に依存しません。たとえば、tとt-1(一次遅れ)の間の共分散は常に同じである必要があります(1960年から1970年までの期間、1965年から1975年までの期間、またはその他の期間)。 非定常プロセスでは、系列が元に戻る長期的な意味はありません。したがって、非定常時系列は復帰を意味しないと言います。その場合、分散は時系列の絶対位置に依存し、時間の経過とともに分散は無限になります。技術的に言えば、自己相関は時間とともに減衰しませんが、小さなサンプルではそれらは消えますが、ゆっくりではあります。 定常プロセスでは、衝撃は一時的なものであり、時間とともに消散します(エネルギーを失います)。しばらくすると、それらは新しい時系列値に寄与しません。たとえば、第二次世界大戦のようにログ時間前に発生した(十分に長い)何かが影響を及ぼしましたが、今日の時系列は第二次世界大戦が発生しなかった場合と同じであり、ショックはエネルギーを失ったと言えますまたは散逸した。多くの古典的な計量経済学の理論は定常性の仮定の下で導出されるため、定常性は特に重要です。 定常性の強い形式は、時系列の分布がまったく同じ谷時間である場合です。言い換えれば、元の時系列の分布は、時系列のラグ(任意の数のラグによる)または時系列のサブセグメントとまったく同じです。たとえば、強い形式は、サブセグメント1950〜1960、1960〜1970、または1950〜1960と1950〜1980などの重複期間でも、分布が同じであることを示唆しています。この形式の定常性は、分布を仮定しないため、強いと呼ばれます。それは、確率分布が同じであるべきだと言うだけです。弱い定常性の場合、その平均と分散によって分布を定義しました。暗黙的に正規分布を仮定したため、この単純化を行うことができました。正規分布は、その平均と分散または標準偏差によって完全に定義されます。これは、(時系列内の)シーケンスの確率測度は、同じ時系列内の値の時間差/シフトシーケンスの確率測度と同じであると言うことに他なりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.