タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。


3
時系列ベースの異常検出アルゴリズムへのウェーブレットの適用
私はを通じて、私のように動作し始めてきたアンドリュー・ムーアによって統計的データマイニングチュートリアル(非常に誰が最初にこの分野に進出を推奨します)。「時系列ベースの異常検出アルゴリズムの概要」というタイトルの非常に興味深いPDFを読むことから始めました。ムーアは、病気の発生を検出するアルゴリズムの作成に使用される多くのテクニックを追跡します。スライドの途中の27ページで、彼は、アウトブレイクの検出に使用される他の多くの「最先端の方法」をリストしています。最初にリストされているのはウェーブレットです。ウィキペイダは、ウェーブレットを次のように説明しています ゼロから始まり、増加し、その後ゼロに戻る振幅を持つ波状の振動。通常、「簡単な振動」として視覚化できます。 統計への適用については説明していません。私のGoogle検索では、ウェーブレットが統計または主題に関する完全な書籍にどのように関連するかを知っている高度な学術論文が生成されます。 Mooreがチュートリアルで他のテクニックを説明するのと同じように、時系列の異常検出にウェーブレットがどのように適用されるかについての基本的な理解をお願いします。誰かが、ウェーブレットを使用した検出方法の仕組みの説明や、その問題に関する理解可能な記事へのリンクを提供できますか?

5
ある種のARIMAの説明を求める
これは見つけるのは難しいかもしれないが、私が読みたいARIMA例をよく説明していること 最小限の数学を使用します モデルを構築するだけでなく、そのモデルを使用して特定のケースを予測することまで議論を広げます グラフィックスと数値結果を使用して、予測値と実際の値の適合を特徴付けます。

2
R時系列ベクトルのサブセット化
時系列があり、開始、終了、および頻度を保持しながら、時系列として保持しながらサブセット化します。 たとえば、時系列があるとします。 > qs <- ts(101:110, start=c(2009, 2), frequency=4) > qs Qtr1 Qtr2 Qtr3 Qtr4 2009 101 102 103 2010 104 105 106 107 2011 108 109 110 今、私はそれをサブセットします: > qs[time(qs) >= 2010 & time(qs) < 2011] [1] 104 105 106 107 正しい結果が得られましたが、時系列(つまり、開始、終了、頻度)から「ラッピング」を失ったことに注意してください。 このための機能を探しています。時系列のサブセット化は一般的なシナリオではありませんか?私はまだ見つけていないので、ここに私が書いた関数があります: subset.ts <- function(data, start, end) { …
25 r  time-series 

4
時系列異常検出のアルゴリズム
現在、RでTwitterのAnomalyDetectionを使用しています:https : //github.com/twitter/AnomalyDetection。このアルゴリズムは、季節性のあるデータの時系列異常検出を提供します。 質問:これに似た他のアルゴリズムはありますか(季節性の制御は重要ではありません)? 私はデータで可能な限り多くの時系列アルゴリズムをスコアリングしようとしています。これにより、最適なもの/アンサンブルを選択できます。

2
GAMに相互作用用語を含める方法
次のコードは、2つの時系列間の類似性を評価します。 set.seed(10) RandData <- rnorm(8760*2) America <- rep(c('NewYork','Miami'),each=8760) Date = seq(from=as.POSIXct("1991-01-01 00:00"), to=as.POSIXct("1991-12-31 23:00"), length=8760) DatNew <- data.frame(Loc = America, Doy = as.numeric(format(Date,format = "%j")), Tod = as.numeric(format(Date,format = "%H")), Temp = RandData, DecTime = rep(seq(1, length(RandData)/2) / (length(RandData)/2), 2)) require(mgcv) mod1 <- gam(Temp ~ Loc + s(Doy) + s(Doy,by …

3
2つの時系列間の相関
まったく同じサイズの2つの時系列間の相関を計算する最も簡単な方法/方法は何ですか?Iは乗算考えと、乗算を加算します。この単一の数値が正の場合、これら2つのシリーズは相関していると言えますか?しかし、直線的に別の指数関数的に成長する時系列が互いに関係を持たないが、上記の計算はそれらが相関していると報告するいくつかの例を考えることができます。(X [ T ] - μバツ)(バツ[t]−μバツ)(x[t]-\mu_x)(y[ T ] - μy)(y[t]−μy)(y[t] - \mu_y) 何かご意見は?

3
毎日の時系列分析
私は時系列分析を行おうとしており、この分野は初めてです。2006年から2009年までのイベントを毎日数えており、時系列モデルをそれに合わせたいと考えています。これが私が達成した進歩です。 timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) 結果のプロットは次のとおりです。 データに季節性と傾向があるかどうかを確認するには、この投稿に記載されている手順に従います。 ets(x) fit <- tbats(x) seasonal <- !is.null(fit$seasonal) seasonal そしてロブ・J・ハインドマンのブログで: library(fma) fit1 <- ets(x) fit2 <- ets(x,model="ANN") deviance <- 2*c(logLik(fit1) - logLik(fit2)) df <- attributes(logLik(fit1))$df - attributes(logLik(fit2))$df #P value 1-pchisq(deviance,df) どちらの場合も、季節性がないことを示しています。 シリーズのACFとPACFをプロットすると、次のようになります。 私の質問は: これは、毎日の時系列データを処理する方法ですか?このページは、週ごとと年ごとのパターンを検討する必要があることを示唆していますが、そのアプローチは明確ではありません。 ACFプロットとPACFプロットを取得した後、どのように進めるかわかりません。 auto.arima関数を単純に使用できますか? fit <-arima(myts、order = c(p、d、q) ***** Auto.Arimaの結果を更新****** ここでRob Hyndmanのコメントに従ってデータの頻度を7に変更すると、auto.arimaは季節ARIMAモデルを選択して出力します。 …

5
変化点分析のためのPythonモジュール
時系列の変化点分析を実行するPythonモジュールを探しています。さまざまなアルゴリズムがありますが、それぞれのアルゴリズムを手動でロールすることなく、それらのいくつかの有効性を調査したいと思います。 理想的には、bcp(Bayesian Change Point)やRのstrucchangeパッケージのようないくつかのモジュールが欲しいです。 以下に施設がないことに驚いています。 statsmodels.tsa:時系列統計分析ツール scikits.timeseries:scipyを拡張する時系列分析ツール scipy.signal:scipyの信号処理ツール Pythonに変更点検出アルゴリズムを備えたモジュールはありますか?

1
ネイト・シルバーが黄土について言ったことの説明
私が最近尋ねた質問で、私はそれが黄土で外挿するのは大きな「ノー」だと言われました。しかし、Nate SilverのFiveThirtyEight.comに関する最新の記事では、選挙の予測に黄土を使用することについて議論しました。 彼はレスで積極的な予測と保守的な予測の詳細を議論していましたが、私はレスで将来の予測を行うことの妥当性について興味がありますか? また、私はこの議論と、黄土と同様の利点があるかもしれない他の選択肢があることに興味があります。

1
依存観測のPCAのプロパティ
通常、ケースがiidであると想定されるデータの次元削減手法としてPCAを使用します 質問:依存する非iidデータにPCAを適用する際の典型的なニュアンスは何ですか?iidデータを保持するPCAの優れた/有用なプロパティは、侵害された(または完全に失われた)ものですか? たとえば、データは多変量時系列である場合があり、その場合、自己相関または自己回帰条件付き不均一分散(ARCH)が予想されます。 時系列データにPCAを適用する上でいくつかの関連の質問は、前に依頼されている例えば1、2、3、4、私は(個々のポイントに多くの拡大を必要とせずに)、より一般的かつ総合的な答えを探しています。 編集: @ttnphnsが指摘したように、PCA 自体は推論分析ではありません。ただし、PCAの一般化パフォーマンス、つまり、サンプルPCAの母集団の対応に注目することができます。例えば、Nadler(2008)に書かれているとおり: 与えられたデータが(一般的に未知の)分布からの有限でランダムなサンプルであると仮定すると、興味深い理論的および実用的な問題は、有限データから計算されたサンプルPCA結果と基礎となる母集団モデルの結果の間の関係です。 参照: ナズラー、ボアズ。「主成分分析の有限サンプル近似結果:行列摂動アプローチ。」 統計学年報(2008):2791-2817。

2
ARMAを使用した非定常プロセスのモデリングの結果は?
非定常時系列のモデリングにはARIMAを使用する必要があることを理解しています。また、ARMAは定常時系列にのみ使用されるべきだと私が読んだことすべてがあります。 私が理解しようとしているのは、モデルを誤分類し、d = 0非定常の時系列を仮定したときに実際に何が起こるかです。例えば: controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44) 制御データは次のようになります。 [1] 0.0000000 0.1240838 -1.4544087 -3.1943094 -5.6205257 [6] -8.5636126 -10.1573548 -9.2822666 -10.0174493 -11.0105225 [11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414 [16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267 [21] -22.6155812 -21.9189036 -20.2064343 -18.2516852 -15.5822178 [26] …

3
ARIMAモデルの特殊なケースとして見られる一般的な予測モデルは何ですか?
今朝、私は不思議に目を覚ましました(これは昨夜はあまり眠れなかったためかもしれません)。 「に対して交差検証しますか? いくつかの(簡単な)ものを思いつきましたが、すぐにそれらがすべてARIMAモデルの特殊なケースであることに気付きました。だから私は今疑問に思っています、そしてこれは実際の質問です、Box-Jenkninsのアプローチにはすでにどの予測モデルが組み込まれていますか? このように言えば: 平均= ARIMA(0,0,0)と定数 素朴= ARIMA(0,1,0) ドリフト= ARIMA(0,1,0)と定数 単純指数平滑法= ARIMA(0,1,1) ホルトの指数平滑化= ARIMA(0,2,2) 減衰ホルト= ARIMA(0,1,2) 加法Holt-Winters:SARIMA(0,1、m + 1)(0,1,0)m 前のリストに他に何を追加できますか?移動平均または最小二乗回帰を「ARIMA方式」で行う方法はありますか?また、他の単純なモデル(たとえば、ARIMA(0,0,1)、ARIMA(1,0,0)、ARIMA(1,1,1)、ARIMA(1,0,1)など)はどのように変換されますか? 少なくとも初心者には、ARIMAモデルができないことには興味がないことに注意してください。今は、彼らができることだけに集中したい。 ARIMAモデルの各「ビルディングブロック」が何をするかを理解すれば、上記のすべての質問に答えられるはずですが、何らかの理由でそれを理解するのが困難です。そこで、「リバースエンジニアリング」のようなアプローチを試してみました。

3
RのARIMAモデルのパラメーターのp値を計算する方法は?
Rで時系列調査を行うarima と、適合モデルの係数値とその標準誤差のみが提供されることがわかりました。ただし、係数のp値も取得する必要があります。 coefの重要性を提供する機能は見つかりませんでした。 したがって、私は自分で計算したいのですが、係数のtまたはchisq分布の自由度はわかりません。だから私の質問は、Rのフィットされたアリマモデルの係数のp値を取得する方法ですか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.