タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

2
時系列と異常検出
時系列の異常を検出するためのアルゴリズムをセットアップしたいので、そのためにクラスタリングを使用する予定です。 生の時系列データではなく、クラスタリングに距離行列を使用する必要があるのはなぜですか? 異常の検出には、密度ベースのクラスタリング、DBscanとしてのアルゴリズムを使用しますが、この場合、それは機能しますか?データをストリーミングするためのオンラインバージョンはありますか? 異常を発生する前に検出したいので、トレンド検出アルゴリズム(ARIMA)を使用するのが良い選択でしょうか?

4
時系列の統計的に有意な差のテスト?
同じ期間に2つの証券AとBの価格の時系列があり、同じ頻度でサンプリングされています。2つの価格の間に統計的に有意な差があるかどうかをテストしたいと思います(私の帰無仮説は差がヌルであるということです)。具体的には、価格効率を市場効率のプロキシとして使用しています。AとBが証券であり、それらと同等の合成物であると想像してください(つまり、両方ともまったく同じキャッシュフローに対する主張です)。市場が効率的である場合、両方ともまったく同じ価格(異なる取引コストなどを除く)にするか、価格差をゼロにする必要があります。これは私がテストしたいものです。そうするための最良の方法は何ですか? 私は直感的にABの時系列上、すなわち、「違い」を時系列に両側t検定を実行し、テストのためかもしれません = 0。しかし、ホモロスケスティクスエラーの可能性や外れ値の存在などを考慮した、より堅牢なテストがあるかもしれないという疑いがあります。一般的に、証券の価格を扱う際に注意すべきことはありますか?μ0μ0\mu_0

6
「ポリシー」の変更による時系列データの大幅な変更を検出する方法
これがこれを投稿するのにふさわしい場所であることを願っています。懐疑論者に投稿することを検討しましたが、研究が統計的に間違っていると彼らは言うだろうと思います。どのようにそれを正しく行うかという質問の裏側に興味があります。 ウェブサイトQuantified Selfで、著者は、時間の経過とともに自分自身で測定され、コーヒーを飲むのを突然止める前後で比較された出力のメトリックの実験結果を投稿しました。結果は主観的に評価され、著者は時系列に変化があり、それが政策の変化に関連しているという証拠があると信じていました(コーヒーを飲む) これが私に思い出させるのは、経済のモデルです。経済は1つしかありません(現時点では重要です)。そのため、エコノミストは基本的にn = 1の実験を行っています。このため、データは時間の経過とともにほぼ確実に自己相関します。経済学者は一般的に、FRBが政策を開始するのを見ており、潜在的に政策のために時系列が変化したかどうかを判断しようとしています。 時系列がデータに基づいて増加または減少したかどうかを判断するための適切なテストは何ですか?どのくらいのデータが必要ですか?どのツールが存在しますか?私の最初のグーグルはマルコフ切り替え時系列モデルを示唆していますが、私のグーグルのスキルでは、テクニックの名前だけで何かをするのに失敗するわけではありません。

1
時系列の隣接行列の固有関数?
簡単な時系列を考えてみましょう: > tp <- seq_len(10) > tp [1] 1 2 3 4 5 6 7 8 9 10 サンプル間の時間リンクを表すこの時系列の隣接行列を計算できます。この行列の計算では、時間0に架空のサイトを追加し、この観測と時間1の最初の実際の観測間のリンクをリンク0と呼びます。時間1と時間2の間では、リンクはリンク1などです。時間は方向性のあるプロセスであるため、サイトはサイトの「上流」にあるリンクに接続されます(影響を受けます)。したがって、すべてのサイトはリンク0に接続されますが、リンク9はサイト10にのみ接続されます。これは、サイト10を除く各サイトの後に一時的に発生します。このように定義された隣接行列は、次のように作成されます。 > adjmat <- matrix(0, ncol = length(tp), nrow = length(tp)) > adjmat[lower.tri(adjmat, diag = TRUE)] <- 1 > rownames(adjmat) <- paste("Site", seq_along(tp)) > colnames(adjmat) <- paste("Link", seq_along(tp)-1) > adjmat Link 0 …


1
状態空間時系列分析でどのモデルが優れているかを確認するにはどうすればよいですか?
状態空間法による時系列データ分析を行っています。私のデータでは、確率論的なローカルレベルモデルは決定論的なモデルよりも完全に優れていました。しかし、決定論的レベルと勾配モデルは、確率論的レベルと確率論的/決定論的勾配よりも良い結果をもたらします。これは普通ですか?Rのすべてのメソッドには初期値が必要であり、ARIMAモデルを最初に適合させ、そこから値を状態空間解析の初期値として取得することが1つの方法であることをどこかで読みました。可能?または他の提案?ここで私は、状態空間分析のまったくの初心者であることを告白する必要があります。

3
1週間分のデータを時間単位で集計するにはどうすればよいですか?
複数のデータ列、1日ごとに1時間ごとの平均を取得し、同じグラフに12個の「ホスト」の結果を表示するにはどうすればよいですか?つまり、1週間分のデータについて、24時間の期間をグラフ化したいと思います。最終的な目標は、サンプリングの前後にこのデータの2つのセットを比較することです。 dates Host CPUIOWait CPUUser CPUSys 1 2011-02-11 23:55:12 db 0 14 8 2 2011-02-11 23:55:10 app1 0 6 1 3 2011-02-11 23:55:09 app2 0 4 1 私はxyplot(CPUUser〜dates | Host)を効果的に実行できました。ただし、週の各日付を表示するのではなく、X軸を1日の時間にしたいと思います。 このデータをxtsオブジェクトに取得しようとすると、「order.byには適切な時間ベースのオブジェクトが必要」などのエラーが発生します データフレームのstr()は次のとおりです。 'data.frame': 19720 obs. of 5 variables: $ dates : POSIXct, format: "2011-02-11 23:55:12" "2011-02-11 23:55:10" ... $ Host …

3
時系列の適切な紹介(Rを使用)
私は現在、痛みの経験に関連する心理社会的特性の実験のためのデータを収集しています。その一環として、私は参加者からGSRおよびBPの測定値を、さまざまな自己報告および暗黙の測定とともに電子的に収集しています。私は心理学的なバックグラウンドを持ち、因子分析、線形モデル、実験分析に慣れています。 私の質問は、時系列分析について学ぶために利用できる優れた(できれば無料の)リソースです。私はこの分野に関してはまったくの初心者ですので、どんな助けでも大歓迎です。練習用のパイロットデータがいくつかありますが、データの収集を完了する前に、分析計画を詳細に解決してもらいたいと思います。 提供された参考文献もR関連である場合、それは素晴らしいでしょう。 編集済み:文法を変更し、「自己報告と暗黙の測定」を追加する


4
時系列の統計的類似性
期間、最大、最小、平均などのさまざまな測定値を取得できる時系列があり、それらを使用して同じ属性を持つモデル正弦波を作成すると仮定すると、定量化できる統計的アプローチはありますか実際のデータが仮定されたモデルにどの程度適合しているか?シリーズのデータ​​ポイントの数は、10〜50ポイントの範囲になります。 私の最初の非常に単純な考えは、正弦波の方向の動きに値を割り当てることでした。つまり、+ 1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1、実際のデータに対して同じことを行い、何らかの方法で方向性運動の類似度を定量化します。 編集:データで本当にやりたいことをより深く考え、元の質問への回答に照らして、競合する仮定の間で選択する意思決定アルゴリズムが必要です:つまり、データは基本的に線形(またはトレンド)周期的な要素を含む可能性のあるノイズを含む; 私のデータは基本的に循環的であり、方向性のある傾向はありません。データは本質的に単なるノイズです。または、これらの状態のいずれかの間を移行しています。 私の考えは、何らかの形のベイジアン分析とユークリッド/ LMSメトリックを組み合わせることです。このアプローチの手順は次のとおりです。 データ測定から想定正弦波を作成します LMS直線をデータに適合させる 上記のそれぞれの元のデータからの逸脱について、ユークリッドまたはLMSメトリックを導出します このメトリックに基づいて、それぞれのベイジアン事前分布を作成します。つまり、組み合わせた出発の60%が一方に接続し、40%が他方に接続します。 ウィンドウをデータに沿って1データポイントスライドし、上記を繰り返して、このわずかに変更されたデータセットの新しい%メトリックを取得します-これは新しい証拠です-ベイジアン分析を実行して事後を作成し、各仮定に有利な確率を変更します このスライディングウィンドウ(ウィンドウ長10〜50データポイント)で、データセット全体(3000+データポイント)に沿って繰り返します。希望/意図は、データセットの任意の時点で優勢/好まれる仮定を特定し、これが時間とともにどのように変化するかです。 この潜在的な方法論、特にベイジアン分析パートを実際に実装する方法についてのコメントを歓迎します。

2
不規則な間隔の時系列に対して共和分モデルが存在しますか?
不規則な時系列での共和分を計算する方法が明確ではありません(VECMでヨハンセン検定を使用するのが理想的です)。私の当初の考えは、シリーズを正規化し、欠損値を補間することでしたが、推定に偏りがあるかもしれません。 このテーマに関する文献はありますか?

2
時系列のこの予測が「かなり悪い」のはなぜですか?
ニューラルネットワークの使用方法を学習しようとしています。私はこのチュートリアルを読んでいました。 値を用いて、時系列にニューラルネットワークを適合した後にでの値を予測するために著者は青い線は、時系列であり、以下のプロットを取得し、緑色列データに予測され、赤色でありますテストデータの予測(テストトレイン分割を使用)tttt + 1t+1t+1 「トレーニングデータセットとテストデータセットの両方を適合させるという、モデルの仕事がかなり貧弱だったことがわかります。基本的に、出力と同じ入力値を予測しました。」 次に、著者は、およびを使用して値を予測することにしました。そうすることで取得tttt − 1t−1t-1t − 2t−2t-2t +1t+1t+1 「グラフを見ると、予測にさらに構造が見られる」と言います。 私の質問 最初の「貧しい」のはなぜですか?私にはほとんど完璧に見えますが、すべての単一の変化を完全に予測します! 同様に、なぜ2番目の方が優れているのでしょうか?「構造」はどこにありますか?私にとっては、最初のものよりもずっと貧しいようです。 一般に、時系列の予測はいつ良いのか、いつ悪いのか?

1
多変量生物学的時系列:VARと季節性
相互作用する生物学的変数と環境変数(およびおそらく外生変数も含む)を含む多変量時系列データセットがあります。季節性のほかに、データには明確な長期的な傾向はありません。私の目的は、どの変数が互いに関連しているかを確認することです。予測は実際には求められていません。 時系列分析は初めてなので、いくつかの参考文献を読みました。私の知る限り、Vector Autoregressive(VAR)モデルは適切ですが、季節性と季節性のない経済学分野(多くの場合、時系列分析など)に気付いたほとんどの例に不安を感じています。 季節データをどうすればよいですか?私はそれらを非季節化することを検討しました。たとえば、Rではdecompose、$trend + $rand値を使用してから、かなり静止しているように見える信号を取得します(で判断acf)。VARモデルの結果は混乱を招きます(1ラグモデルが選択されますが、直観的にはもっと期待していたので、自己回帰の係数だけが-他の遅延変数との回帰ではなく-重要です)。私は何か間違ったことをしていますか、または変数が(線形に)関連していない/私のモデルが良いものではないと結論付ける必要があります(補助的な質問:VARに相当する非線形はありますか?) [別の方法として、ダミーの季節変数を使用できるかもしれないと読みましたが、実装方法を正確に把握することはできません]。 経験豊富なユーザーの詳細が実際に私に有益である可能性があるため、ステップバイステップの提案は非常に高く評価されます(そして、具体的な例へのRコードスニペットまたはリンクはもちろん大歓迎です)。


2
Rの拡張ディッキーフラーテストにおけるkラグの理解
Rでいくつかのユニットルートテストを試しましたが、k lagパラメーターをどのように作成すればよいかわかりません。tseriesパッケージの拡張Dickey FullerテストとPhilipps Perronテストを使用しました。明らかに、デフォルトのkパラメータ(の場合)は、系列の長さにのみ依存します。別のkを選択した場合kkkadf.testkkk値、かなり異なる結果が得られます。nullを拒否する: Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272 alternative hypothesis: stationary # 103^(1/3)=k=4 Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543 alternative hypothesis: stationary # k=0 Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542 alternative hypothesis: stationary # k=6 プラスPPテスト結果: …
15 r  time-series  trend 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.