タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

2
差異のある介入
たとえば、ここで説明するように時系列データ(別名:中断された時系列)を使用して介入分析を実行するときの要件の1つは、介入による総利得(または損失)を推定することです。 )。 R内のフィルター関数を使用して介入関数を推定する方法を完全に理解しているわけではないので、私はこれを力ずくでやってみました。 データが与えられたとしましょう cds<- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L, 2084L, 2031L, 2256L, 2401L, 3253L, 2881L, 2555L, 2585L, 3015L, 2608L, 3676L, 5763L, 4626L, 3848L, 4523L, 4186L, 4070L, 4000L, 3498L), .Dim = c(29L, 1L), .Dimnames = list( NULL, "CD"), .Tsp = c(2012, 2014.33333333333, 12), class = …

4
不規則な時系列の動的タイムワーピング
最近、ダイナミックタイムワーピング(DTW)についてたくさん読んでいます。DTWの不規則な時系列への適用に関する文献がまったくないか、少なくとも見つけることができなかったことに非常に驚いています。 誰かが私にその問題に関連する何かへの参照、またはそれの実装さえ与えるかもしれませんか?

2
二元配置分散分析は適切ですか?
これは私の研究の説明です。私は、A、B、Cの3つの植物で実験しています。これらの植物は、糖尿病患者の血糖値を下げると考えられています。これらの3つの植物のどれが、マウスへの単回投与後の血糖値低下により長い影響を与えるかを調べたいと思います。これは、7つの時点(1、2、3、5、7、10、および14日目)でのマウスの血糖値を測定することによって行われます。したがって、4つのグループがあります(未処理、Aで処理、Bで処理、Cで処理)。各グループに3匹のマウスを使用した(n = 3)。私の目標は: 各植物処理の効果が未処理と比較して重要かどうかを判断します。 毎日のグループ間での効果を比較します。 14日後に最も効果のある治療グループを特定します。 私の解決策は、2つ以上のグループがあるため、2因子ANOVAを使用することです。毎日のグループを比較し、最後に全体的な効果を比較します。 これは正しい方法ですか?2番目と3番目に続く最高の植物をランク付けできますか?または時系列分析を使用する必要がありますか?

3
密度関数の予測
確率密度関数の時系列の予測について調査しています。過去に観測された(通常は推定された)PDFを与えられたPDFを予測することを目指しています。私たちが開発している予測方法は、シミュレーション研究でかなりうまく機能します。 ただし、この方法をさらに説明するには、実際のアプリケーションからの数値例が必要です。では、時系列のPDFが収集され、そのような時系列を予測することが重要で難しいアプリケーション(金融、経済学、生物学、工学など)に適切な例はありますか?

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


3
大規模な時系列データをインタラクティブに表示する方法は?
私は、適切なサイズの時系列データを処理することが多く、タイムスタンプが5億から2億倍になり、タイムスタンプを動的に視覚化したいと考えています。 これを効果的に行うための既存のソフトウェアはありますか?ライブラリとデータ形式はどうですか?ズームキャッシュは、大規模な時系列に焦点を当てたライブラリの一例です。ズームキャッシュでは、さまざまな解像度で見やすくするために、データがいくつかの解像度で要約されます。 編集:また、この質問をするか、答えを探す必要がある場合は、お知らせください。

1
ACFおよびPACFによる季節性の解釈
経験的直観で週ごとの季節性を期待する必要があると言うデータセットがあります(つまり、土曜日と日曜日の動作は他の週の動作とは異なります)。この前提が当てはまる場合、自己相関グラフから7のラグ倍数でバーストが発生しないはずです。 データのサンプルは次のとおりです。 data = TemporalData[{{{2012, 09, 28}, 19160768}, {{2012, 09, 19}, 19607936}, {{2012, 09, 08}, 7867456}, {{2012, 09, 15}, 11245024}, {{2012, 09, 04}, 0}, {{2012, 09, 21}, 24314496}, {{2012, 09, 12}, 11233632}, {{2012, 09, 03}, 9886496}, {{2012, 09, 09}, 9122272}, {{2012, 09, 24}, 23103456}, {{2012, 09, 20}, 25721472}, {{2012, 09, …

1
相関確率変数の加重和の「中央極限定理」
私はそれを主張する論文を読んでいます X^k=1N−−√∑j=0N−1Xje−i2πkj/N,X^k=1N∑j=0N−1Xje−i2πkj/N,\hat{X}_k=\frac{1}{\sqrt{N}}\sum_{j=0}^{N-1}X_je^{-i2\pi kj/N}, つまり離散フーリエ変換、CFTによるDFT)は、(複雑な)ガウス確率変数になる傾向があります。しかし、私はこれが一般的に正しくないことを知っています。この(誤った)議論を読んだ後、私はネットで検索し、Peligrad&Wuによるこの2010年の論文を見つけました。彼らは、いくつかの定常プロセスについて、「CLT定理」を見つけることができることを証明しています。 私の質問は:(シミュレーションまたは理論の両方によって)与えられたインデックス付きシーケンスのDFTの制限分布を見つける問題に対処しようとする他の参照がありますか?私は特に、時系列分析のコンテキストでの共分散構造、または非定常系列への導出/アプリケーションでの収束率(つまり、DFTが収束する速さ)にがあります。XjXjX_j

3
時変バイアスでバイアスされたコインをモデル化する方法は?
バイアスコインのモデルには、通常、1つのパラメーターます。一連の描画からを推定する1つの方法は、ベータ事前分布を使用し、二項尤度で事後分布を計算することです。θθ = P(頭| θ )θ=P(Head|θ)\theta = P(\text{Head} | \theta)θθ\theta 私の設定では、奇妙な物理的プロセスのために、私のコインのプロパティはゆっくりと変化し、は時間関数になります。私のデータは、順序付けられた描画のセット、つまりです。私は、離散的で通常の時間グリッドでは、ごとに1つのドローしかないと考えることができます。T { H 、T 、H 、H 、H 、T 、。。。} tθθ\thetattt{ H、T、H、H、H、T、。。。}{H,T,H,H,H,T,...}\{H,T,H,H,H,T,...\}ttt これをどのようにモデル化しますか?私は、隠れた変数があるという事実に適応し、二項尤度を維持するカルマンフィルターのようなものを考えています。推論を扱いやすくするために、をモデル化するために何を使用できますか?P (θ (T + 1 )| θ (T ))θθ\thetaP(θ (t + 1 )| θ (t ))P(θ(t+1)|θ(t))P(\theta(t+1)|\theta(t)) 次の回答を編集してください(ありがとう!):HMMまたはカルマンフィルターで行われるように、を次数1のマルコフ連鎖としてモデル化したいと思います。私ができる唯一の仮定は、が滑らかであることです。私はをで小さなガウスノイズ(カルマンフィルターのアイデア)と書くことができますが、これはままにする必要があります。@J Davのアイデアに従って、プロビット関数を使用して実際の線をにマッピングすることができますが、これは非分析的な解決策を与えるという直感があります。平均ベータ分布θ (T )P (θ (T + 1 )| θ (T ))= θ (T …

1
非同期(不規則)時系列分析
2つの株価の時系列間のリードラグを分析しようとしています。通常の時系列分析では、VECM(Granger Causality)のCross Correlatonを実行できます。ただし、不規則な間隔の時系列で同じように処理するにはどうすればよいでしょうか。 仮説は、楽器の1つがもう1つをリードするというものです。 両方のシンボルのデータをマイクロ秒まで持っています。 RTAQパッケージを見て、VECMを適用してみました。RTAQは単変量時系列に基づいていますが、VECMはこれらのタイムスケールでは重要ではありません。 > dput(STOCKS[,])) structure(c(29979, 29980, 29980, 29980, 29981, 29981, 29991, 29992, 29993, 29991, 29990, 29992), .Dim = c(6L, 2L), .Dimnames = list(NULL, c("Pair_Bid", "Calc_Bid" )), index = structure(c(1340686178.55163, 1340686181.40801, 1340686187.2642, 1340686187.52668, 1340686187.78777, 1340686189.36693), class = c("POSIXct", "POSIXt"), tzone = ""), class = "zoo")

1
マウス(またはキーボード)クリックのパターンとコンピューターユーザーのアクティビティの予測
マウスクリックの時間パターン(クリック時間のリスト)のみに基づいて、コンピューターユーザーのアクティビティを予測できますか?[t1,t2,t3,…][t1,t2,t3,…][t_1,t_2,t_3,\ldots] 例:Facebookでの作業、時間の使用、写真の視聴、コンピュータゲームの再生など。 それらがさらに細かい予測である場合(たとえば、StarCraft対Counter Strike対SimCityをプレイする場合)、私も同様に興味があります。 (間違いなく)誰かが遊んでいる(高速でバーストの多いクリックにより)か、写真を見ている(等間隔のクリック)のが聞こえますが、その件に関してさらに客観的な結果(出版物、ブログの調査など)があるかどうか興味があります。 。 編集: 私は、キーボードのクリック(どのキーが押されているかを区別せず)または組み合わせたアプローチ(マウス+キーボード)にも同様に興味があります。

2
シリアル相関と単位根を持つことの違いは何ですか?
時系列と非時系列の概念を混同している可能性がありますが、シリアル相関を示す回帰モデルと単位根を示すモデルの違いは何ですか? さらに、シリアル相関のテストにダービンワトソン検定を使用できるのに、単位根にはディッキーフラー検定を使用する必要があるのはなぜですか。(これは、独立変数にラグを含むモデルではダーバンワトソン検定を使用できないためです。)

3
統計的有意性を使用して2つの異なるモデルの精度を比較する方法
私は時系列予測に取り組んでいます。2つのデータセットとます。 3つの予測モデルがあります。これらのモデルはすべて、データセットサンプルを使用してトレーニングされ、そのパフォーマンスはデータセットサンプルを使用して測定されます。パフォーマンスメトリックがMSE(またはその他)であるとします。データセットについて測定し、それらのモデルのMSEある及び。あるモデルの別のモデルに対する改善が統計的に有意であることをどのようにテストできますか?D1={x1,x2,....xn}D1={x1,x2,....xn}D1=\{x_1, x_2,....x_n\}D2={xn+1,xn+2,xn+3,....,xn+k}D2={xn+1,xn+2,xn+3,....,xn+k}D2=\{x_n+1, x_n+2, x_n+3,...., x_n+k\}M1,M2,M3M1,M2,M3M1, M2, M3D1D1D1D2D2D2D2D2D2MSE1,MSE2,MSE1,MSE2,MSE_1, MSE_2, MSE3MSE3MSE_3 たとえば、、、、これらのMSEの計算に基づくデータセットサンプルの総数が2000 であるとします、、およびが大幅に異なることをどのようにテストできますか。誰かがこの問題で私を助けることができれば私は非常に感謝します。MSE1=200MSE1=200MSE_1=200MSE2=205MSE2=205MSE_2=205MSE3=210MSE3=210MSE_3=210D2D2D2MSE1MSE1MSE_1MSE2MSE2MSE_2MSE3MSE3MSE_3

3
時系列分析を学ぶためのオンライン資料
私の質問は、これを学ぶための良いオンライン資料があるかどうかです。特にARMAモデルと関連する数学をうまく紹介するもの。 編集:私はハイエンドの学部レベルの何かを探しています。ブロックウェルとデイビスの時系列と予測入門のようなもの

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.