タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

7
短い時系列はモデリングする価値がありますか?
ここにいくつかのコンテキストがあります。2つの環境変数(温度、栄養素レベル)が11年間の応答変数の平均値にどのように影響するかを調べることに興味があります。毎年、10万を超える場所からのデータがあります。 目標は、11年間で、応答変数の平均値が環境変数の変化に応答したかどうかを判断することです(たとえば、気温が上がる+栄養素が増える=応答が大きくなる)。 残念なことに、応答は平均値であるため(平均値を見ずに、定期的な経年変動だけで信号が圧倒される)、回帰は2つの説明変数を持つ11データポイント(1年に1平均値)になります。私にとって、線形の正の回帰でさえ、データセットが非常に小さいことを考えると、意味があると考えるのは難しいでしょう(関係が非常に強い場合を除き、名目上の40ポイント/変数さえ満たしません)。 私はこの仮定をする権利がありますか?誰かが私が見逃しているかもしれない他の考え/視点を提供できますか? PS:いくつかの警告:追加の年を待たずに、より多くのデータを取得する方法はありません。したがって、利用可能なデータは、私たちが本当に取り組まなければならないものです。

2
時系列のペア間の相関(および上記相関の有意性)の計算
2つの時系列SとTがあります。それらは同じ周波数と同じ長さを持っています。 (Rを使用して)このペア間の相関(SとT)を計算し、相関の有意性も計算できるようにしたいので、相関が偶然によるものかどうかを判断できます。 私はRでこれをやりたいと思っており、私を始めるためのポインタ/骨格フレームワークを探しています。

2
機械学習のための時系列の順序付け
クロスバリデーションと時系列に関するRJ Hyndman の「研究のヒント」の1つを読んだ後、ここで定式化しようとする古い質問に戻りました。分類または回帰の問題では、データの順序は重要ではないため、k分割交差検証を使用できるという考え方です。一方、時系列では、データの順序が明らかに非常に重要です。 予測時系列のモデルを機械学習を使用する場合しかし、一般的な方法は、一連再形成することである{y1,...,yT}{y1,...,yT}\{y_1, ..., y_T\}を一連の「入出力ベクトル」に変換します。これは、時間に対して。ttt(yt−n+1,...,yt−1,yt;yt+1)(yt−n+1,...,yt−1,yt;yt+1)(y_{t-n+1}, ..., y_{t-1}, y_{t}; y_{t+1}) さて、この再整形が完了したら、結果の「入出力ベクトル」のセットを順序付ける必要がないと考えることができますか?たとえば、これらのデータを「学習」するためにn入力のフィードフォワードニューラルネットワークを使用すると、モデルにベクトルを表示する順序に関係なく、同じ結果に到達します。したがって、毎回モデルを再適合させる必要なしに、k分割交差検証を標準的な方法で使用できますか?

4
時系列データの平滑化
私は睡眠中に加速度計データを記録するアンドロイドアプリケーションを構築します。これにより、睡眠の傾向を分析し、必要に応じて、浅い睡眠中に希望する時間近くにユーザーを起床します。 アラームと同様に、データを収集して保存するコンポーネントをすでに構築しています。睡眠データを本当に意味のある明確な方法で表示して保存するという獣に取り組む必要があります。これは、分析にも役立つことが望ましい方法です。 数枚の写真が2000語を言います:(担当者が少ないため、リンクは1つしか投稿できません) これは、30秒間隔で収集された、フィルタリングされていないデータ、つまり移動の合計です。 そして、移動平均平滑化の私自身の明示によって平滑化された同じデータ 編集)両方のチャートにキャリブレーションが反映されます-最小の「ノイズ」フィルターと最大カットオフフィルター、およびアラームトリガーレベル(白い線)があります 残念ながら、これらはどちらも最適なソリューションではありません。1つ目は平均的なユーザーにとって少しわかりにくいもので、2つ目は理解しやすいもので、実際に起こっていることの多くを隠しています。特に、平均化により動きのスパイクの詳細が削除されます。これらは意味があると思います。 では、なぜこれらのチャートはそれほど重要なのでしょうか?これらの時系列は、ユーザーへのフィードバックとして一晩中表示され、後で確認/分析するために保存されます。スムージングは​​、理想的にはメモリコスト(RAMとストレージの両方)を削減し、これらのリソース不足の携帯電話/デバイスでのレンダリングを高速化します。 明らかにデータを平滑化するより良い方法があります。線形回帰を使用して動きの「シャープ」な変化を見つけ出し、移動平均平滑化を修正するなど、漠然としたアイデアがあります。より最適に解決できるものに真っ先に飛び込む前に、私は本当にいくつかのガイダンスと入力が本当に必要です。 ありがとう!

1
負のACF(自己相関関数)の解釈方法は?
そのため、石油リターンのACF / PACFをプロットし、いくつかの正の自己相関があると予想していましたが、驚いたことに、負の有意な自己相関しか得られませんでした。上記のグラフをどのように解釈すればよいですか?彼らは、オイルが以前に減少したときにオイルリターンが増加する傾向があり、逆もまた同様であることを示しているようです。したがって、振動の振る舞いです。私が間違っている場合は修正してください。

4
ARMA-GARCHを適用するには、定常性が必要ですか?
財務時系列にARMA-GARCHモデルを使用する予定であり、このモデルを適用する前にシリーズを固定する必要があるかどうか疑問に思っていました。私はARMAモデルを適用することを知っていますが、シリーズは定常でなければなりませんが、揮発性クラスタリングと非一定の分散を意味するGARCHエラーを含むため、ARMA-GARCHについてはわかりません。 金融時系列は通常、定常的ですか、それとも非定常ですか?いくつかの揮発性シリーズにADFテストを適用してみたところ、p値<0.01が得られました。これは定常性を示しているようですが、揮発性シリーズ自体の原理から、シリーズは静止ではないことがわかります 誰かが私のためにそれをクリアできますか?私は本当に混乱しています

3
2つの離散フーリエ変換の類似性?
気候モデリングでは、地球の気候を適切に描写できるモデルを探しています。これには、半周期的なパターン(エルニーニョ南方振動など)の表示が含まれます。ただし、モデル検証は通常、比較的短い期間にわたって行われ、そこには適切な観測データがあります(過去150年以内)。これは、モデルが適切なパターンを表示しているが、位相がずれている可能性があることを意味します。そのため、相関などの線形比較では、モデルのパフォーマンスは良好ではありません。 このような周期的なパターンを検出するために、一般的に離散フーリエ変換が気候データの分析に使用されます(ここに例を示します)。検証ツールとして使用できる2つのDFTの類似性の標準的な尺度はありますか(つまり、モデルのDFTと観測のDFTの比較)。 2つの面積正規化DFTの最小値の積分を取ることは理にかなっていますか(絶対実数値を使用)。私はこのスコアをもたらすであろうと思う、X = 1X ∈ [ 0 、1 ]バツ∈[0、1]x\in[0,1]x = 1⟹バツ=1⟹x=1\impliesまったく同じパターン、およびx = 0⟹バツ=0⟹x=0\implies全く異なるパターン。そのような方法の欠点は何でしょうか?

2
MAプロセスが可逆的である場合、なぜ気にするのですか?
MAプロセスが可逆的であるかどうかを気にする理由を理解できません。 私が間違っている場合は修正してください、しかし、ARプロセスが因果関係であるかどうかを気にする理由を理解することができます。すなわち、移動平均プロセス。その場合、ARプロセスが因果関係にあることが簡単にわかります。 ただし、MAプロセスを可逆的であることを示すことでARプロセスとして表すことができるかどうかを気にする理由を理解するのに苦労しています。どうして私たちが気にするのか本当に理解していません。 どんな洞察も素晴らしいでしょう。

1
Rに複数の外生変数がある有馬時系列予測(auto.arima)
複数の外生変数を持つ複数の時系列ARIMAモデルに基づいて予測を実行したいと思います。私は統計もRIも維持したくないという点に関しては、十分なスキルを持っているわけではないので、可能な限り簡単です(3ヶ月のトレンド予測で十分です)。 1つの依存時系列と3〜5の予測時系列、すべて月間データ、ギャップなし、同じ時間「水平線」があります。 auto.arima関数に遭遇し、これが私の問題の適切な解決策であるかどうかを自問しました。私は異なる商品価格とそれらから作られた製品の価格を持っています。すべての生データは非定常ですが、1次差分によりすべて定常データになります。ADF、KPSSはこれを示します。(これは、統合のテストを行ったことを意味しますか?) 私の質問は次のとおりです:auto.arima関数でこれをどのように適用し、ARIMAはとにかく正しいアプローチですか?一部の人々はすでにVARを使用するようにアドバイスしてくれましたが、ARIMAでも可能ですか? 次の表は私のデータです。実際、データセットは105回の観測まで増加しますが、最初の50回は増加します。ここでは、トレンドと季節性が明らかに重要です。 アドバイスや助けをありがとう!ゲオルグ
14 r  time-series  arima 

1
循環データの時系列モデリング
風/波データのARIMAモデルを構築しています。変数ごとに個別のモデルを作成しています。 モデル化する必要がある変数の2つは、波と風の方向です。値は度(0-360°)です。値の間隔が循環するこのタイプのデータをモデル化することは可能ですか?そうでない場合、どの種類のモデルがこの種のデータに最適ですか?

1
長期分散とは何ですか?
時系列分析の分野での長期分散はどのように定義されますか? データに相関構造がある場合に利用されることを理解しています。したがって、確率過程はX1,X2…X1,X2…X_1, X_2 \dots iidのランダム変数のファミリーではなく、同じようにのみ分布していますか? 概念の概観とその推定に伴う困難について、標準的な参考資料を入手できますか?

2
Rを使用した時系列分析の手順と方法
私は、今後6か月間、商品(石油、アルミニウム、錫など)の価格を予測しようとする小さなプロジェクトに取り組んでいます。予測するそのような変数は12個あり、2008年4月から2013年5月までのデータがあります。 予測についてはどうすればいいですか?私は次のことをしました: Timeseriesデータセットとしてインポートされたデータ すべての変数の季節性はトレンドによって異なる傾向があるため、乗法モデルを使用します。 加算モデルに変換する変数のログを取りました 各変数について、STLを使用してデータを分解しました Holt Winters指数平滑法、ARIMAおよびニューラルネットを使用して予測する予定です。トレーニングとテストとしてデータを分割しました(80、20)。MAE、MPE、MAPE、MASEの少ないモデルを選択する計画。 私はそれを正しくやっていますか? また、ARIMAまたはニューラルネットに渡す前に、データを平滑化する必要がありましたか?はいの場合、何を使用しますか?データは、季節性と傾向の両方を示しています。 編集: 時系列のプロットとデータの添付 Year <- c(2008, 2008, 2008, 2008, 2008, 2008, 2008, 2008, 2008, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2011, 2011, 2011, …

1
Engle–Granger 2ステップ法を使用して、2つの時系列間の共積分をテストします
2つの時系列間の共和分をテストしようとしています。両方のシリーズには、約3年にわたる週次データがあります。 Engle-Granger Two Step Methodをやろうとしています。私の操作の順序は次のとおりです。 Augmented Dickey-Fullerを介してユニットルートの各時系列をテストします。 両方に単位根があると仮定し、OLSを介して関係の線形近似を見つけます。次に、一連の残差を作成します。 Augmented Dickey-Fullerを介してユニットルートの残差をテストします。 3の結果により、共和分を終了します(またはしない)。 質問: この方法は大丈夫ですか?(私は学部生であり、データを正当な方法で分析したいと考えています。必ずしも最も厳密な既知の方法でデータを分析する必要はありません。) ステップ1で1つのシリーズが ADFを使用して帰無仮説を拒否できない(したがって、単位根がない)場合、1つのデータセットが非定常であるため、2つのシリーズは共和化しないと結論付けるのは合理的ですか?私はそうは思わないだろうが、私は確信したい。 両方のデータセットは「確率論的」に見えるため、OLSを使用して関係を測定して残差を取得することが適切かどうか疑問に思っています。

5
時系列をトレンド除去するにはどうすればよいですか?
時系列をトレンド除去するにはどうすればよいですか?最初の違いを取得してDickey Fullerテストを実行しても大丈夫ですか?それが静止している場合は問題ありませんか? また、オンラインで、Stataでこれを行うことで時系列をトレンドダウンできることを発見しました。 reg lncredit time predict u_lncredit, residuals twoway line u_lncredit time dfuller u_lncredit, drift regress lags(0) 時系列をトレンド除去するための最良のアプローチは何ですか?

2
時系列計量経済学における微計量経済学の因果関係とグレンジャー因果関係
ミクロ経済学(特にIVまたは回帰の不連続性の設計)で使用される因果関係と、時系列計量経済学で使用されるグレンジャーの因果関係を理解しています。どうやって相互に関連付けるのですか?たとえば、パネルデータに両方のアプローチが使用されているのを見ました(たとえば、T = 20)。この点に関する論文への参照は歓迎されます。N=30N=30N=30T=20T=20T=20

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.