タグ付けされた質問 「unevenly-spaced-time-series」

不均一な(または不規則な)分布時点でサンプリングまたは測定された時系列。

8
不規則な間隔の時系列をモデル化するためのゴールドスタンダードはありますか?
経済学の分野(私は思う)には、等間隔の時系列用のARIMAとGARCHと、ポイントプロセスのモデリング用のPoisson、Hawkesがあります。 ? (このトピックに関する知識がある場合は、対応するwiki記事も展開できます。) エディション(欠損値と不規則な間隔の時系列について): @Lucas Reisのコメントに答えてください。測定または実現変数間のギャップが(たとえば)ポアソンプロセスのために間隔が空いている場合、この種の正則化の余地はあまりありませんt(i)が、単純な手順が存在します:変数xのi番目の時間インデックス(実現X)、次いで、測定の時間の間のギャップを定義g(i)=t(i)-t(i-1)し、我々は、離散化、g(i)定数を使用しc、dg(i)=floor(g(i)/cそして元の時系列から古い観測値との間のブランク値の数と新しい時系列を作成iし、i+1()IをDGに等しいが、問題は、このことですプロシージャは、観測数よりはるかに多くの欠損データを含む時系列を容易に生成できるため、欠損観測値の合理的な推定は不可能であり、大きすぎる可能性があります。c「時間構造/時間依存など」を削除する 分析された問題の(極端なケースは、c>=max(floor(g(i)/c))不規則な間隔の時系列を規則的に間隔を空けて単純に崩壊させることにより与えられる Edition2(楽しみのためだけ):不規則な間隔の時系列の欠損値またはポイント処理の場合の画像アカウンティング。

3
欠損値や不規則な時系列でR予測パッケージを使用する
R forecastパッケージ、zooおよび不規則な時系列や欠損値の補間などのパッケージに感銘を受けました。 私のアプリケーションはコールセンターのトラフィック予測の領域にあるため、週末のデータは常に(ほぼ)欠落していzooます。これはでうまく処理できます。また、いくつかの離散ポイントが欠落している可能性がありますNA。そのためにRを使用しています。 事ある次のような予測パッケージ、すべての素敵な魔法eta()、auto.arima()など、平野期待しているように見えるts物体は、つまりは、欠落したデータを含まない時系列を等間隔。等間隔のみの時系列の実世界のアプリケーションは確かに存在すると思いますが、-私の意見では-非常に限られています。 少数の離散の問題NA値が容易に提供される補間関数のいずれかを使用することによって解決することができるzooだけでなくによってforecast::interp。その後、予測を実行します。 私の質問: 誰かがより良い解決策を提案していますか? (私の主な質問)少なくとも私のアプリケーションドメイン、コールセンターのトラフィック予測(および他のほとんどの問題ドメインを想像できる限り)では、時系列は等間隔ではありません。少なくとも、定期的な「営業日」スキームなどがあります。それを処理し、予測パッケージのすべてのクールな魔法を使用する最良の方法は何ですか? 週末を埋めるために時系列を「圧縮」し、予測を実行してから、週末にNA値を再挿入するためにデータを再度「膨らませ」ますか?(それは残念だと思いますか?) 予測パッケージを、動物園やそのような不規則な時系列パッケージと完全に互換させる計画はありますか?はいの場合、いつ、いいえの場合、なぜですか? 私は予測(および統計全般)が初めてなので、重要なことを見落とす可能性があります。

2
不規則な間隔の時系列に対して共和分モデルが存在しますか?
不規則な時系列での共和分を計算する方法が明確ではありません(VECMでヨハンセン検定を使用するのが理想的です)。私の当初の考えは、シリーズを正規化し、欠損値を補間することでしたが、推定に偏りがあるかもしれません。 このテーマに関する文献はありますか?

2
金融/経済学研究における不規則な間隔の時系列
金融計量経済学の研究では、日次データの形をとる金融時系列間の関係を調査することは非常に一般的です。多くの場合、変数は対数の差を取ることによってになります。。私(0 )私(0)I(0)ln(Pt)− ln(Pt − 1)ln⁡(Pt)−ln⁡(Pt−1)\ln(P_t)-\ln(P_{t-1}) ただし、毎日のデータは、毎週データポイントがあり、土曜日と日曜日が欠落していることを意味します。これは、私が知っている応用文献では言及されていないようです。この観察から得られた私が持っているいくつかの密接に関連した質問はここにあります:555 週末に金融市場が閉鎖されたとしても、これは不規則な間隔のデータとみなされますか? もしそうなら、この問題を無視する膨大な数の論文でこれまでに得られた現存の経験的結果の妥当性に対する結果は何ですか?

3
不規則な時間間隔のRNN?
RNNは、シーケンシャルデータの時間依存性のキャプチャに非常に適しています。ただし、シーケンス要素の間隔が等間隔でない場合はどうなりますか? たとえば、LSTMセルへの最初の入力は月曜日に行われ、火曜日から木曜日まではデータがありません。最後に、金曜日、土曜日、日曜日のそれぞれに新しい入力が行われます。1つの可能性は、火曜日から木曜日に供給されるある種のNULLベクトルを持つことですが、NULLエントリがデータを汚染するため、およびリソースの浪費であるため、これはばかげた解決策のようです。 何か案は?RNNはそのような場合をどのように処理しますか?RNN以外の方法がある場合は、それらの提案も歓迎します。

4
不規則な時系列の動的タイムワーピング
最近、ダイナミックタイムワーピング(DTW)についてたくさん読んでいます。DTWの不規則な時系列への適用に関する文献がまったくないか、少なくとも見つけることができなかったことに非常に驚いています。 誰かが私にその問題に関連する何かへの参照、またはそれの実装さえ与えるかもしれませんか?

1
非同期(不規則)時系列分析
2つの株価の時系列間のリードラグを分析しようとしています。通常の時系列分析では、VECM(Granger Causality)のCross Correlatonを実行できます。ただし、不規則な間隔の時系列で同じように処理するにはどうすればよいでしょうか。 仮説は、楽器の1つがもう1つをリードするというものです。 両方のシンボルのデータをマイクロ秒まで持っています。 RTAQパッケージを見て、VECMを適用してみました。RTAQは単変量時系列に基づいていますが、VECMはこれらのタイムスケールでは重要ではありません。 > dput(STOCKS[,])) structure(c(29979, 29980, 29980, 29980, 29981, 29981, 29991, 29992, 29993, 29991, 29990, 29992), .Dim = c(6L, 2L), .Dimnames = list(NULL, c("Pair_Bid", "Calc_Bid" )), index = structure(c(1340686178.55163, 1340686181.40801, 1340686187.2642, 1340686187.52668, 1340686187.78777, 1340686189.36693), class = c("POSIXct", "POSIXt"), tzone = ""), class = "zoo")

2
非常に不規則な時系列
私は、約5年間にわたってサンプリングされた、非常に不規則なパターンで、さまざまな魚の個体数のデータを持っています。サンプル間に数か月ある場合もあれば、1か月に複数のサンプルがある場合もあります。0カウントもたくさんあります そのようなデータをどのように扱うのですか? Rでは十分簡単に​​グラフ化できますが、非常にでこぼこなので、グラフは特に明るくはありません。 モデリングの観点から-種をさまざまなものの関数としてモデル化-多分混合モデル(別名マルチレベルモデル)。 どんな参考やアイデアも歓迎します コメントに応じた詳細 約15種あります。 私は、各魚の傾向や季節性を把握し、種が互いにどのように関連しているかを調べようとしています(クライアントはもともと、単純な相関関係の表が必要でした) 目標は予測的ではなく、説明的で分析的です さらに編集:私はこの論文をK. Rehfieldらによって見つけました。これは、ガウスカーネルを使用して非常に不規則な時系列のACFを推定することを示唆しています http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

1
2つの時系列をギャップと異なるタイムベースに関連付ける方法は?
私は尋ねたこの質問を StackOverflowの上の上に、そしてここでそれを尋ねることをお勧めしました。 2つの時系列の3D加速度計データがあり、タイムベースが異なり(クロックは異なる時間に開始され、サンプリング時間中にわずかにクリープがあり)、異なるサイズの多くのギャップが含まれています(別々に書き込むことに関連する遅延のため)フラッシュデバイス)。 私が使用している加速度計は、安価なGCDC X250-2です。加速度計を最高のゲインで実行しているので、データには大きなノイズフロアがあります。 時系列にはそれぞれ約200万のデータポイント(512サンプル/秒で1時間以上)があり、約500の対象となるイベントが含まれます。一般的なイベントは100〜150サンプル(それぞれ200〜300 ms)です。これらのイベントの多くは、フラッシュ書き込み中のデータ停止の影響を受けます。 したがって、データは原始的ではなく、非常にきれいでもありません。しかし、私の眼球検査では、興味のある情報が明確に含まれていることが示されています(必要に応じて、プロットを投稿できます)。 加速度計は同様の環境にありますが、適度に結合されているだけです。つまり、各加速度計からどのイベントが一致するかを目で確認できますが、ソフトウェアでこれを行うことはできません。物理的な制限により、デバイスは軸が一致しないさまざまな方向にも取り付けられますが、それらは私が作成できる限り直交に近いです。したがって、たとえば、3軸の加速度計AおよびBの場合、+ Axは-By(上下)にマップされ、+ Azは-Bx(左右)にマップされ、+ Ayは-Bz(前後)にマップされます。 。 私の最初の目標は、縦軸の衝撃イベントを関連付けることですが、最終的には、a)軸のマッピングを自動的に検出し、b)マップされたエースのアクティビティを関連付け、c)2つの加速度計の動作の違い(ねじるなど)を抽出しますまたは屈曲)。 時系列データの性質により、Pythonのnumpy.correlate()は使用できなくなります。私もR's Zooパッケージを見てきましたが、それで進んでいません。信号解析のさまざまな分野を参考にしてきましたが、進歩はありませんでした。 誰かが私にできること、または私が研究すべきアプローチについての手がかりはありますか? 2011年2月28日更新:データの例を示すいくつかのプロットをここに追加しました。

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

3
RでXTS時系列を再サンプリングする方法は?
不規則な間隔のXTS時系列がありPOSIXctます(インデックスタイプとして値を使用)。 10分間隔でサンプリングされた新しい時系列をどのように構築できますか。ただし、各サンプルモーメントはラウンド時間(13:00:00、13:10:00、13:20:00など)に合わせて調整されます。 。リサンプリングの瞬間が元のシリーズの値に正確に一致しない場合は、以前の値を使用します。

3
不規則な時系列データの傾向
何十年にもわたって不規則な間隔で大きな水域から取られた水温測定のデータセットがあります。(興味がある場合は、テキサス州ガルベストンベイ) データの先頭は次のとおりです。 STATION_ID DATE TIME LATITUDE LONGITUDE YEAR MONTH DAY SEASON MEASUREMENT 1 13296 6/20/91 11:04 29.50889 -94.75806 1991 6 20 Summer 28.0 2 13296 3/17/92 9:30 29.50889 -94.75806 1992 3 17 Spring 20.1 3 13296 9/23/91 11:24 29.50889 -94.75806 1991 9 23 Fall 26.0 4 13296 9/23/91 11:24 29.50889 …

1
不定期時系列の予測(Rあり)
等距離の時系列を予測する方法はいくつかあります(例:Holt-Winters、ARIMAなど)。しかし、私は現在、次の不規則な間隔のデータセットに取り組んでいます。これには、年間のデータポイントの量が異なり、それらのポイント間に定期的な時間間隔はありません。 プロット: サンプルデータ: structure(list(date = structure(c(664239600, 665449200, 666658800, 670888800, 672184800, 673394400, 674517600, 675727200, 676936800, 678146400, 679356000, 680565600, 682984800, 684194400, 685404000, 686613600, 687823200, 689036400, 690246000, 691455600, 692665200, 695084400, 696294000, 697503600, 698713200, 699922800, 701132400, 703548000, 705967200, 707176800, 708472800, 709682400, 710805600, 712015200, 713224800, 714434400, 715644000, 716853600, 718063200, 719272800, 720486000, 721695600, 722905200, 724114800, 726534000, …

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

1
どこから始めるか:多数の外れ値またはランダム性がある不等間隔の時系列
何ができるのか本当にわからないので、正しい方向への指針を求めています。 時間と位置の測定値があります。これは、歩いている人、道路上の車、駐車場、オフィスのプリンターなど、あらゆるものです。2点間の車両の移動時間を計算する必要があります。曲がりくねったルートをたどる場合もあれば、AからBに到着するまでに数日かかる場合もあります。あるいは、歩行者や緊急時のサービス車両である場合もあります。 メインルートに沿った通常の車両の推定所要時間を知りたい。 検出は、特定の半径を持つ検出器の近くに誰かがいるときはいつでも行われます。検出が非常に少ない場合があります。これは、道路が空で、所要時間が適切であることを意味しますが、道路が閉鎖されていることを示している可能性があり、所要時間はひどいものになります。または、交通が動いていないことを示す検出がたくさんあり、道路をオフにするためにキューに入れられている可能性がありますが、他の車両は通常の速度で走行しています。 プロットはランダムノイズのように見えます。 編集: 現在、私は2つの方法を検討しています。 四分位範囲を使用して外れ値を破棄する カルマンフィルターを使用します。 時々刻々と変化することを期待しない限り、私は旅行時間のモデルを持っていないので、フィルターは行くのに間違った方法だと思います。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.