タグ付けされた質問 「arima」

データの説明と予測の両方のために時系列モデリングで使用されるAutoRegressive統合移動平均モデルを指します。このモデルは、傾向を取り除き、いくつかのタイプの非定常性を処理するのに役立つ差分の用語を含めることにより、ARMAモデルを一般化します。

4
有馬以前または有馬内の時系列の差
Arimaを使用する前にシリーズを区別すること(それが必要であると仮定)またはArima内でdパラメーターを使用する方が良いですか? 同じモデルとデータでどのルートを採用するかによって、適合値がどのように異なるかは驚きました。それとも私は間違って何かをしていますか? install.packages("forecast") library(forecast) wineindT<-window(wineind, start=c(1987,1), end=c(1994,8)) wineindT_diff <-diff(wineindT) #coefficients and other measures are similar modA<-Arima(wineindT,order=c(1,1,0)) summary(modA) modB<-Arima(wineindT_diff,order=c(1,0,0)) summary(modB) #fitted values from modA A<-forecast.Arima(modA,1)$fitted #fitted from modB, setting initial value to the first value in the original series B<-diffinv(forecast.Arima(modB,1)$fitted,xi=wineindT[1]) plot(A, col="red") lines(B, col="blue") 追加: 私は一度シリーズを区別し、arima(1,0,0)を当てはめ、その後、arima(1,1,0)を元のシリーズに当てはめていることに注意してください。私は、差分ファイル上のarima(1,0,0)の適合値の差分を逆にしています(と思います)。 予測ではなく、適合値を比較しています。 以下がプロットです(赤はarima(1,1,0)、青は元のスケールに戻った後の差分系列のarima(1,0,0)です): ハインドマン博士の回答に対する回答: 1)Arima(1,1、 0)と手動で異なるシリーズのArima(1,0,0)?これはmodAに含まれていないという意味に関係していると思いますが、どうすればいいのか完全にはわかりません。 …
12 r  time-series  arima 

2
毎日、毎週、毎年の周期性を持つ時間ごとの時系列の予測
主な編集:Dave&Nickの対応に感謝します。良い知らせは、ループが機能するようになったことです(原則として、バッチ予測に関するHydnman教授の投稿から借用しました)。未解決のクエリを統合するには: a)auto.arimaの最大反復回数を増やすにはどうすればよいですか。外生変数が多数あるため、auto.arimaは最終モデルに収束する前に最大反復回数に達しているようです。これを誤解している場合は訂正してください。 b)Nickからの1つの回答は、時間間隔の私の予測はそれらの時間間隔のみから導き出され、その日の早い段階での発生に影響されないことを強調しています。このデータを処理することから、本能は、これがしばしば重大な問題を引き起こすべきではないことを教えてくれますが、これをどのように処理するかについての提案を受け入れます。 c)Daveは、予測変数を取り巻くリードタイムとラグタイムを特定するには、より高度なアプローチが必要であることを指摘しました。Rのこれに対するプログラムによるアプローチの経験はありますか?もちろん制限はあると思いますが、できる限りこのプロジェクトを進めたいと思っています。これが他の人にも役立つことは間違いありません。 d)新しいクエリですが、当面のタスクに完全に関連しています-注文を選択するときにauto.arimaはリグレッサを考慮しますか? 来店を予測しようとしています。移動する休日、うるう年、散発的なイベント(本質的には外れ値)を説明する機能が必要です。これに基づいて、私はARIMAXが私の最善の策であると収集し、外因性変数を使用して、複数の季節性と前述の要因を試してモデル化します。 データは1時間ごとに24時間記録されます。これは私のデータにゼロの量があるため、特に訪問数が非常に少ない1日の時間帯に問題があることが判明しています。また、営業時間は比較的不安定です。 また、3年以上の履歴データを持つ1つの完全な時系列として予測する場合、計算時間は膨大です。毎日の時間を別々の時系列として計算することで、それがより速くなると考えました。そして、忙しい時間帯でこれをテストすると、より高い精度が得られるようですが、早朝/後期の時間で問題になることが判明しましたt常に訪問を受ける。auto.arimaを使用するとプロセスにメリットがあると思いますが、最大反復回数に達する前にモデルに収束できないようです(そのため、手動での適合とmaxit句を使用しています)。 訪問数= 0の場合の外生変数を作成して、「欠落」データを処理しようとしました。繰り返しますが、これは、訪問がない唯一の時間である1日の店舗が閉まっているときだけ、忙しい1日の時間帯に最適です。これらの例では、外生変数は前向きに予測するためにこれを正常に処理するようであり、以前に閉じられた日の影響を含みません。ただし、店が開いているが、常に訪問を受けるとは限らない静かな時間を予測することに関して、この原則を使用する方法がわかりません。 Rでのバッチ予測についてのHyndman教授の投稿を利用して、24シリーズを予測するループを設定しようとしていますが、午後1時以降は予測したくなく、その理由を理解できません。「optim(init [mask]、armafn、method = optim.method、hessian = TRUE、:non-finite finite-difference value [1]のエラー」というエラーが表示されますが、すべての系列の長さが等しく、基本的に同じマトリックスですが、なぜこれが起こっているのか理解できません。これは、マトリックスがフルランクではないことを意味しますか?このアプローチでこれを回避するにはどうすればよいですか? https://www.dropbox.com/s/26ov3xp4ayig4ws/Data.zip date() #Read input files INPUT <- read.csv("Input.csv") XREGFDATA <- read.csv("xreg.csv") #Subset time series data from the input file TS <- ts(INPUT[,2:25], f=7) fcast <- matrix(0, nrow=nrow(XREGFDATA),ncol=ncol(TS)) #Create matrix of exogenous …

3
2つの時系列間の関係:ARIMA
次の2つの時系列(x、y、以下を参照)が与えられた場合、このデータの長期傾向間の関係をモデル化する最良の方法は何ですか? 両方の時系列は、時間の関数としてモデル化されたときに有意なダービン・ワトソン検定を持ち、どちらも定常ではありません(用語を理解しているように、またはこれは、残差で定常である必要があるだけですか?)。これは、基本的にはarima(1,1,0)を使用して、一方を他方の関数としてモデル化する前に、各時系列の1次の差(少なくとも、おそらく2次)を取得する必要があることを意味します。 )、arima(1,2,0)など モデル化する前になぜトレンド除去する必要があるのか​​理解できません。自己相関をモデル化する必要性を理解していますが、なぜ差異化が必要なのかわかりません。私には、差分によるトレンド除去が、関心のあるデータの主要な信号(この場合は長期トレンド)を削除し、より高い周波数の「ノイズ」を残す(ノイズという用語を緩く使用する)ように見えます。確かに、ある時系列と別の時系列との間にほぼ完全な関係を作成し、自己相関がないシミュレーションでは、時系列を差分すると、関係検出の目的に対して直観に反する結果が得られます。たとえば、 a = 1:50 + rnorm(50, sd = 0.01) b = a + rnorm(50, sd = 1) da = diff(a); db = diff(b) summary(lmx <- lm(db ~ da)) この場合、bはaと強く関連していますが、bの方がノイズが多くなります。私にとってこれは、低周波信号間の関係を検出するための理想的なケースでは差分が機能しないことを示しています。差分は時系列分析で一般的に使用されることを理解していますが、高周波信号間の関係を決定するために、より役立つようです。何が欠けていますか? データの例 df1 <- structure(list( x = c(315.97, 316.91, 317.64, 318.45, 318.99, 319.62, 320.04, 321.38, 322.16, 323.04, 324.62, 325.68, …

3
ACFおよびPACFはMAおよびAR条件の順序をどのように識別しますか?
私が別の時系列に取り組んでいるのは、2年以上前です。ACFはMA用語の順序を識別するために使用され、PACFはARのために使用されるという多くの記事を読みました。経験則では、MAの場合、ACFが突然停止するラグはMAの順序であり、同様にPACFとARの場合です。 ここでの記事の一つ、私は科学のPennState Eberly大学から続きます。 私の質問は、なぜそうなのですか?私にとって、ACFでもAR条件を与えることができます。上記の経験則の説明が必要です。親指の法則を直感的/数学的に理解できないのはなぜですか。 多くの場合、ARモデルの識別はPACFを使用して行うのが最適です。 MAモデルの識別は、多くの場合、PACFではなくACFを使用して行うのが最善です。 ご注意ください:-「なぜ」以外の方法は必要ありません。:)

1
指数平滑法とARIMAを使用する場合
私は最近、毎月の予測に取り組み、Rob Hyndmanの本を読みながら、予測の知識を更新していますが、私が苦労しているのは、指数平滑化モデルとARIMAモデルのどちらを使用するかです。ある方法論と別の方法論のどちらを使用するべきかという経験則はありますか? また、AICを使用して2つを比較することはできないので、RMSE、MAEなどを使用する必要がありますか? 現在、それぞれをいくつか作成してエラー測定値を比較していますが、より良いアプローチがあるかどうかはわかりません。

2
auto.arimaを使用して欠損値を補完する方法
多くの欠損値のある動物園シリーズがあります。auto.arimaこれらの欠損値を推定できると私は読みましたか?誰でも私にそれを行う方法を教えることができますか?どうもありがとう! これは私が試したものですが、成功しませんでした: fit <- auto.arima(tsx) plot(forecast(fit))
12 arima 

4
Statsmodelsは、ARIMAはシリーズが静止していないため適切ではないと述べていますが、それをどのようにテストしていますか?
Pythonのstatsmodels ARIMA APIでモデル化しようとしている時系列があります。以下を適用した場合: from statsmodels.tsa.arima_model import ARIMA model = ARIMA(data['Sales difference'].dropna(), order=(2, 1, 2)) results_AR = model.fit(disp=-1) 次のエラーが発生します。 ValueError: The computed initial AR coefficients are not stationary You should induce stationarity, choose a different model order, or you can pass your own start_params. しかし、私はすでにデータを区別しています: data['Sales'] = data['Sales'] - data['Sales'].shift() 定常性を誘発するためにこれ以上何ができますか? …

2
ハミルトンからのARMA(p、q)の状態空間表現
私はハミルトンの第13章を読んでおり、彼はARMA(p、q)に対して次の状態空間表現を持っています。ましょう次のように.ThenはARMA(P、Q)プロセスである: \ {整列} y_tを開始- \ MU&= \ phi_1(Y_ {T-1} - \ MU) + \ phi_2(y_ {t-2}-\ mu)+ ... + \ phi_3(y_ {t-3}-\ mu)\\&+ \ epsilon_t + \ theta_1 \ epsilon_ {t-1} +。 .. + \ theta_ {r-1} \ epsilon_ {t-r + 1}。\ end {aligned} 次に、状態方程式を次のように定義します。r=max(p,q+1)r=max(p,q+1)r = \max(p,q+1)yt−μ=ϕ1(yt−1−μ)+ϕ2(yt−2−μ)+...+ϕ3(yt−3−μ)+ϵt+θ1ϵt−1+...+θr−1ϵt−r+1.yt−μ=ϕ1(yt−1−μ)+ϕ2(yt−2−μ)+...+ϕ3(yt−3−μ)+ϵt+θ1ϵt−1+...+θr−1ϵt−r+1. \begin{aligned} y_t -\mu …

3
ARIMA介入伝達関数-効果を視覚化する方法
介入のある月次時系列があり、結果に対するこの介入の影響を定量化したいと思います。シリーズはかなり短く、効果はまだ結論に達していません。 データ cds <- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L, 2084L, 2031L, 2256L, 2401L, 3253L, 2881L, 2555L, 2585L, 3015L, 2608L, 3676L, 5763L, 4626L, 3848L, 4523L, 4186L, 4070L, 4000L, 3498L), .Dim=c(29L, 1L), .Dimnames=list(NULL, "CD"), .Tsp=c(2012, 2014.33333333333, 12), class="ts") 方法論 1)介入前のシリーズ(2013年10月まで)がauto.arima機能とともに使用されました。提案されたモデルは、平均がゼロでないARIMA(1,0,0)でした。ACFプロットは良好に見えました。 pre <- window(cds, start=c(2012, 01), end=c(2013, 09)) …

1
AICの値が低く、ほぼ等しい場合はどうすればよいですか?
(1)で私が読書を楽しんだ質の高い本や論文を数多く提供しているChris Chatfieldは、次のアドバイスを提供しています。 たとえば、AICの値が低い値とほぼ等しいARIMA時系列モデルを選択する必要があります。これは、たまたま最小のAICを与えるのではなく、直近の年のデータの最良の予測を与えるものです。 そのようなアドバイスの根拠は何ですか?それが健全である場合、なぜforecast :: auto.arimaおよび他の予測ルーチンがそれに従っていないのですか?まだ実装されていませんか?すでにここで議論されているだけで最小を与えるために起こっモデルを探すために、AICはおそらく良いアイデアではないこと。 ARIMAモデルに低いがほぼ等しい(たとえば、最小AICの値が1または2以内)オプションは、多くの時系列予測ソフトウェアのデフォルトではないのはなぜですか?N ≥ 1ん≥1n\ge1 (1)Chatfield、C.(1991)。統計上の落とし穴を回避します。Statistical Science、6(3)、240–252。オンラインで入手可能、URL:https : //projecteuclid.org/euclid.ss/1177011686。

3
多次元時系列による介入分析
時間の経過に伴うアルコールの販売に関する政策決定の結果を定量化するために介入分析を行いたいと思います。しかし、時系列分析はかなり新しいので、初心者向けの質問があります。 文献を調べると、他の研究者がARIMAを使用してアルコールの時系列売上高をモデル化し、介入の効果をモデル化するためのリグレッサとしてダミー変数を使用していることがわかります。これは妥当なアプローチのように思えますが、私のデータセットは、私が文献で得たデータセットよりもわずかに豊富です。最初に、私のデータセットは飲料の種類(つまり、ビール、ワイン、スピリッツ)ごとに分類され、次に地理的ゾーンごとにさらに分類されます。 分離されたグループごとに個別のARIMA分析を作成して結果を比較することもできますが、ここにはより良いアプローチがあると思います。多次元時系列データに慣れている人は、いくつかの指針や提案を提供できますか?

1
ARIMA(1,1,0)シリーズのシミュレーション
ARIMAモデルを元の時系列に適合させましたが、最良のモデルはARIMA(1,1,0)です。次に、そのモデルからシリーズをシミュレートしたいと思います。単純なAR(1)モデルを作成しましたが、モデルARI(1,1,0)内の違いを調整する方法を理解できませんでした。AR(1)シリーズの次のRコードは次のとおりです。 phi= -0.7048 z=rep(0,100) e=rnorm(n=100,0,0.345) cons=2.1 z[1]=4.1 for (i in 2:100) z[i]=cons+phi*z[i-1]+e[i] plot(ts(Y)) 上記のコードに差分項ARI(1,1)を含めるにはどうすればよいですか?この点で誰でも私を助けてくれます。
11 r  time-series  arima 

3
Holt-WintersまたはARIMAを使用しますか?
私の質問は、Holt-WintersとARIMAの概念的な違いについてです。 私が理解している限りでは、Holt-WintersはARIMAの特殊なケースです。しかし、あるアルゴリズムが他のアルゴリズムよりも優先されるのはいつですか?おそらくHolt-Wintersはインクリメンタルであるため、インライン(高速)アルゴリズムとして機能しますか? ここでいくつかの洞察を楽しみにしています。

1
分数微分式について
時系列あり、それをARFIMA(別名FARIMA)プロセスとしてモデル化したいと思います。が(分数)の次数で積分されている場合、それを定常的にするために分数で差を付けたいと思います。ytyty_tytyty_tddd 質問:分数微分を定義する次の式は正しいですか? Δdyt:=yt−dyt−1+d(d−1)2!yt−2−d(d−1)(d−2)3!yt−3+...+(−1)k+1d(d−1)⋅...⋅(d−k)k!yt−k+...Δdyt:=yt−dyt−1+d(d−1)2!yt−2−d(d−1)(d−2)3!yt−3+...+(−1)k+1d(d−1)⋅...⋅(d−k)k!yt−k+...\Delta^d y_t := y_t - d y_{t-1} + \frac{d(d-1)}{2!} y_{t-2} - \frac{d(d-1)(d-2)}{3!} y_{t-3} + ... +(-1)^{k+1} \frac{d(d-1) \cdot ... \cdot (d-k)}{k!} y_{t-k} + ... (ここでは、次数分数微分を示します。)ΔdΔd\Delta^dddd このウィキペディアの記事ARFIMAの Chapter ARFIMA()に基づいて式を作成しましたが、正しく取得したかどうかはわかりません。0,d,00,d,00,d,0

2
ARMA-GARCHモデルを使用した外国為替価格のシミュレーション
ARIMA(1,1,1)-GARCH(1,1)モデルを、数年にわたって1分間隔でサンプリングされたAUD / USD為替レートログ価格の時系列に適合させ、2つ以上のモデルを推定する100万のデータポイント。データセットはこちらから入手できます。明確にするために、これはログ価格の1次積分により、ログのリターンに適合したARMA-GARCHモデルでした。元のAUD / USD時系列は次のようになります。 次に、当てはめたモデルに基づいて時系列をシミュレートしようとしましたが、次のようになりました。 シミュレーションされた時系列が元の時系列と異なることを期待し、望んでいますが、それほど大きな違いがあるとは思っていませんでした。本質的に、私はシミュレートされたシリーズがオリジナルのように動作するか、概して見たいと思っています。 これは、モデルの推定とシリーズのシミュレーションに使用したRコードです。 library(rugarch) rows <- nrow(data) data <- (log(data[2:rows,])-log(data[1:(rows-1),])) spec <- ugarchspec(variance.model = list(model = "sGARCH", garchOrder = c(1, 1)), mean.model = list(armaOrder = c(1, 1), include.mean = TRUE), distribution.model = "std") fit <- ugarchfit(spec = spec, data = data, solver = "hybrid") sim …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.