タグ付けされた質問 「arima」

データの説明と予測の両方のために時系列モデリングで使用されるAutoRegressive統合移動平均モデルを指します。このモデルは、傾向を取り除き、いくつかのタイプの非定常性を処理するのに役立つ差分の用語を含めることにより、ARMAモデルを一般化します。

2
手作業によるARIMA推定
ARIMAモデリング/ Box Jenkins(BJ)でパラメーターがどのように推定されるかを理解しようとしています。残念ながら、私が遭遇した本のいずれも、対数尤度推定手順などの推定手順を詳細に説明していません。私は非常に役立つウェブサイト/教材を見つけました。以下は、上記のソースからの方程式です。 L L (θ )= − n2ログ(2 π)− n2ログ(σ2)− ∑t = 1ne2t2つのσ2LL(θ)=−n2ログ⁡(2π)−n2ログ⁡(σ2)−∑t=1net22σ2 LL(\theta)=-\frac{n}{2}\log(2\pi) - \frac{n}{2}\log(\sigma^2) - \sum\limits_{t=1}^n\frac{e_t^2}{2\sigma^2} 自分でARIMA / BJの推定を学びたいです。そこで、を使用して手作業でARMAを推定するコードを記述しました。以下は私がRでやったことです、RRRRRR ARMAをシミュレートしました(1,1) 上記の方程式を関数として書きました シミュレートされたデータと最適関数を使用して、ARおよびMAパラメーターを推定しました。 また、statsパッケージでARIMAを実行し、ARMAパラメーターを手作業で行ったものと比較しました。 以下は比較です: **以下は私の質問です: 推定変数と計算変数の間にわずかな違いがあるのはなぜですか? ARIMAはRバックキャストで機能しますか、または推定手順はコードで以下に概説されているものとは異なりますか? 観測1でe1またはエラーを0として割り当てましたが、これは正しいですか? また、最適化のヘッセ行列を使用して予測の信頼限界を推定する方法はありますか? いつものようにあなたの助けに感謝します。 コードは次のとおりです。 ## Load Packages library(stats) library(forecast) set.seed(456) ## Simulate Arima y <- arima.sim(n = 250, list(ar = …

1
日次データを使用した時系列予測:リグレッサーを使用したARIMA
私は、約2年間の毎日のデータポイントを含む販売データの毎日の時系列を使用しています。いくつかのオンラインチュートリアル/例に基づいて、データの季節性を特定しようとしました。毎週、毎月、そしておそらく毎年の周期性/季節性があるようです。 たとえば、特に月の最初の給料日には、週の数日間続く給料日があります。また、いくつかの特定の休日の影響もあり、観測に注目することで明確に識別できます。 これらの観察のいくつかを装備して、私は次を試みました: (持つARIMA Arimaとauto.arima回帰(及び機能に必要な他のデフォルト値)を用いてR-予測パッケージから)。私が作成したリグレッサーは、基本的に0/1値のマトリックスです。 11か月(n-1)変数 12の休日変数 給料日の部分を理解できませんでした...それは思ったよりも少し複雑な効果だからです。給料日の効果は、月の1日の平日によって異なります。 時系列をモデル化するために7(つまり、週ごとの頻度)を使用しました。テストを試してみました-一度に7日間予測します。結果は合理的です。11週間の予測の平均精度は、週平均5%のRMSEになります。 TBATSモデル(R予測パッケージから)-複数の季節性(7、30.4375、365.25)を使用し、明らかにリグレッサーなし。週平均RMSE 3.5%では、精度はARIMAモデルよりも驚くほど優れています。 この場合、ARMAエラーのないモデルのパフォーマンスはわずかに向上します。#1で説明したARIMAモデルのHoliday Effectsの係数のみをTBATSモデルの結果に適用すると、週平均RMSEは2.95%に向上します 現在、これらのモデルの基礎理論に関する多くの背景や知識がなくても、このTBATSアプローチが有効なものであるかどうかはジレンマに陥っています。11週間のテストでRMSEを大幅に改善していますが、将来この精度を維持できるかどうか疑問に思っています。または、ARIMAからTBATSの結果にホリデー効果を適用することは正当化できます。すべての貢献者からのどんな考えでも高く評価されます。 テストデータのリンク 注:ファイルをダウンロードするには、「名前を付けてリンクを保存」を実行します。

5
何回もシリーズを同時に処理する方法は?
25期間のいくつかの製品(1200製品)の需要を含むデータセットがあり、次の期間の各製品の需要を予測する必要があります。最初は、ARIMAを使用して各製品のモデルをトレーニングしたかったのですが、製品の数と(p、d、q)パラメーターの調整のため、非常に時間がかかり、実用的ではありません。以前の要求が独立変数である回帰(自己回帰)を使用することをお勧めしますか? 1200のすべての製品の需要予測のために単一のモデルをトレーニングする方法があるかどうかを知ることができますか?Pythonを使用しているので、Pythonのライブラリを提案していただければ幸いです。

4
RのARIMA残差のLjung-Box統計:混乱したテスト結果
予測しようとしている時系列があり、そのために季節のARIMA(0,0,0)(0,1,0)[12]モデル(= fit2)を使用しました。Rがauto.arimaで提案したものとは異なります(Rで計算されたARIMA(0,1,1)(0,1,0)[12]の方がより適切であるため、fit1と名付けました)。ただし、時系列の最後の12か月では、モデル(fit2)を調整するとよりよくフィットするようです(慢性的に偏っていたため、残差平均を追加し、新しいフィットは元の時系列の周囲によりぴったりと収まるようです)過去12か月の例と、両方の近似の最近12か月のMAPEは次のとおりです。 時系列は次のようになります。 ここまでは順調ですね。私は両方のモデルの残差分析を実行しましたが、これが混乱です。 acf(resid(fit1))は素晴らしく、非常にホワイトノイズが多い: ただし、Ljung-Boxテストは、たとえば20のラグに対しては見栄えがよくありません。 Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1) 次の結果が得られます。 X-squared = 26.8511, df = 19, p-value = 0.1082 私の理解では、これは残差が独立していないことの確認です(p値が大きすぎて独立仮説を維持できない)。 ただし、ラグ1では、すべてが素晴らしいです。 Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1) 私に結果を与えます: X-squared = 0.3512, df = 0, p-value < 2.2e-16 テストを理解していないか、またはacfプロットで見たものとわずかに矛盾しています。自己相関は非常に低いです。 次に、fit2をチェックしました。自己相関関数は次のようになります。 いくつかの最初のラグでのこのような明らかな自己相関にもかかわらず、Ljung-Boxテストでは、fit1よりも20ラグではるかに良い結果が得られました。 Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0) 結果: X-squared = 147.4062, df = 20, p-value < 2.2e-16 一方、lag1で自己相関をチェックするだけで、帰無仮説の確認もできます。 Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0) X-squared = 30.8958, df …

2
ARMA / ARIMAは混合エフェクトモデリングとどのように関連していますか?
パネルデータ分析では、ランダム/混合効果を備えたマルチレベルモデルを使用して、自己相関問題(つまり、観測が時間の経過とともに個人内でクラスター化される)を追加し、他のパラメーターを追加して、時間とショックの特定の仕様を調整しました。ARMA / ARIMAは、同様の問題に対処するように設計されているようです。 私がオンラインで見つけたリソースでは、時系列(ARMA / ARIMA)または混合効果モデルのいずれかについて説明していますが、回帰に基づいて構築することを超えて、2つの関係を理解し​​ていません。マルチレベルモデル内からARMA / ARIMAを使用したい場合がありますか?2つが同等または冗長であるという意味はありますか? これについて議論するリソースへの回答またはポインタは素晴らしいでしょう。

2
Box-Jenkinsモデルの選択
時系列分析におけるBox-Jenkinsモデル選択手順は、系列の自己相関関数と部分自己相関関数を調べることから始まります。これらのプロットは、ARMAモデルで適切なと提案できます。この手順は、AIC / BIC基準を適用して、ホワイトノイズエラー項を含むモデルを生成するモデルの中から最もmost約性の高いモデルを選択するようにユーザーに求めることによって続行します。pppqqq(p 、q)(p、q)(p,q) 視覚検査と基準に基づいたモデル選択のこれらのステップが、最終モデルの推定標準誤差にどのように影響するのかと思っていました。たとえば、横断的ドメインでの多くの検索手順は、標準エラーを下向きにバイアスする可能性があることを知っています。 最初のステップでは、データ(ACF / PACF)を見て適切な数のラグを選択すると、時系列モデルの標準誤差にどのように影響しますか? AIC / BICスコアに基づいてモデルを選択すると、断面法の場合と同様の影響があると思います。私も実際にはこの分野についてあまり知りませんので、この点についてもコメントをいただければ幸いです。 最後に、各ステップで使用される正確な基準を書き留めた場合、プロセス全体をブートストラップして標準エラーを推定し、これらの懸念を排除できますか?

1
Rに複数の外生変数がある有馬時系列予測(auto.arima)
複数の外生変数を持つ複数の時系列ARIMAモデルに基づいて予測を実行したいと思います。私は統計もRIも維持したくないという点に関しては、十分なスキルを持っているわけではないので、可能な限り簡単です(3ヶ月のトレンド予測で十分です)。 1つの依存時系列と3〜5の予測時系列、すべて月間データ、ギャップなし、同じ時間「水平線」があります。 auto.arima関数に遭遇し、これが私の問題の適切な解決策であるかどうかを自問しました。私は異なる商品価格とそれらから作られた製品の価格を持っています。すべての生データは非定常ですが、1次差分によりすべて定常データになります。ADF、KPSSはこれを示します。(これは、統合のテストを行ったことを意味しますか?) 私の質問は次のとおりです:auto.arima関数でこれをどのように適用し、ARIMAはとにかく正しいアプローチですか?一部の人々はすでにVARを使用するようにアドバイスしてくれましたが、ARIMAでも可能ですか? 次の表は私のデータです。実際、データセットは105回の観測まで増加しますが、最初の50回は増加します。ここでは、トレンドと季節性が明らかに重要です。 アドバイスや助けをありがとう!ゲオルグ
14 r  time-series  arima 

1
循環データの時系列モデリング
風/波データのARIMAモデルを構築しています。変数ごとに個別のモデルを作成しています。 モデル化する必要がある変数の2つは、波と風の方向です。値は度(0-360°)です。値の間隔が循環するこのタイプのデータをモデル化することは可能ですか?そうでない場合、どの種類のモデルがこの種のデータに最適ですか?

2
Rを使用した時系列分析の手順と方法
私は、今後6か月間、商品(石油、アルミニウム、錫など)の価格を予測しようとする小さなプロジェクトに取り組んでいます。予測するそのような変数は12個あり、2008年4月から2013年5月までのデータがあります。 予測についてはどうすればいいですか?私は次のことをしました: Timeseriesデータセットとしてインポートされたデータ すべての変数の季節性はトレンドによって異なる傾向があるため、乗法モデルを使用します。 加算モデルに変換する変数のログを取りました 各変数について、STLを使用してデータを分解しました Holt Winters指数平滑法、ARIMAおよびニューラルネットを使用して予測する予定です。トレーニングとテストとしてデータを分割しました(80、20)。MAE、MPE、MAPE、MASEの少ないモデルを選択する計画。 私はそれを正しくやっていますか? また、ARIMAまたはニューラルネットに渡す前に、データを平滑化する必要がありましたか?はいの場合、何を使用しますか?データは、季節性と傾向の両方を示しています。 編集: 時系列のプロットとデータの添付 Year <- c(2008, 2008, 2008, 2008, 2008, 2008, 2008, 2008, 2008, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2011, 2011, 2011, …

2
異なるシリーズのARIMA対ARMA
R(2.15.2)では、時系列にARIMA(3,1,3)を1回、かつ時差のある時系列にARMA(3,3)を1回当てはめました。当てはめられたパラメータは異なります。これは、ARIMAの当てはめ方法に起因します。 また、ARMA(3,3)と同じデータにARIMA(3,0,3)をフィッティングしても、使用するフィッティング方法に関係なく、同じパラメーターにはなりません。 私は、ARMAと同じ適合係数を得るために、違いがどこから来て、どのパラメーターでARIMAに適合するか(もしあれば)を特定することに興味があります。 実証するサンプルコード: library(tseries) set.seed(2) #getting a time series manually x<-c(1,2,1) e<-c(0,0.3,-0.2) n<-45 AR<-c(0.5,-0.4,-0.1) MA<-c(0.4,0.3,-0.2) for(i in 4:n){ tt<-rnorm(1) t<-x[length(x)]+tt+x[i-1]*AR[1]+x[i-2]*AR[2]+x[i-3]*AR[3]+e[i-1]*MA[1]+e[i-2]*MA[2]+e[i-3]*MA[3] x<-c(x,t) e<-c(e,tt) } par(mfrow=c(2,1)) plot(x) plot(diff(x,1)) #fitting different versions. What I would like to get is fit1 with ARIMA() fit1<-arma(diff(x,1,lag=1),c(3,3),include.intercept=F) fit2<-arima(x,c(3,1,3),include.mean=F) fit3<-arima(diff(x,1),c(3,0,3),include.mean=F) fit4<-arima(x,c(3,1,3),method="CSS",include.mean=F) fit5<-arima(diff(x,1),c(3,0,3),method="CSS",include.mean=F) cbind(fit1$coe,fit2$coe,fit3$coe,fit4$coe,fit5$coe) 編集:条件付き二乗和の使用はかなり近づきますが、完全ではありません。fit1のヒントをありがとう! 編集2:これは重複しているとは思わない。ポイント2と3は、私のものとは異なる問題に対処し、ポイント1で述べた初期化をオーバーライドしても fit4<-arima(x,c(3,1,3),method="CSS",include.mean=F,init=fit1$coe) 私はまだ異なる係数を取得します
13 r  time-series  arima  fitting  arma 

4
モデルはauto.arima()によって識別されていますか?
私はARIMAモデルを学び、適用しようとしています。私はPankratzによってARIMAに優れた文章を読んでてきた- 予測を単変量ボックスで-ジェンキンスモデル:概念と事例。本文では、著者は特にARIMAモデルを選択する際の節約の原則を強調しています。 Rパッケージ予測のauto.arima()関数で遊び始めました。これが私がやったことです。ARIMAをシミュレートしてから適用しました。以下に2つの例を示します。両方の例でわかるように、多くの人が非慈善的と考えるモデルを明確に特定しました。特に例2では、実際にはARIMA(1,0,1)で十分かつpar約であるにもかかわらず、ARIMA(3,0,3)が識別されています。auto.arima()auto.arima()auto.arima() 以下は私の質問です。提案や推奨事項に感謝します。 次のような自動アルゴリズムを使用して特定されたモデルをいつ使用/変更するかについてのガイダンスはありますauto.arima()か? auto.arima()モデルを識別するためにAIC(これが使用していると思う)を使用するだけで落とし穴はありますか? 節約的な自動アルゴリズムを構築できますか? ちなみに、私はauto.arima()ちょうど例として使用しました。これは、自動アルゴリズムに適用されます。 以下は例1です。 set.seed(182) y <- arima.sim(n=500,list(ar=0.2,ma=0.6),mean = 10) auto.arima(y) qa <- arima(y,order=c(1,0,1)) qa 以下はからの結果ですauto.arima()。すべての係数は重要ではないことに注意してください。すなわち、ttt値<2。 ARIMA(1,0,2) with non-zero mean Coefficients: ar1 ma1 ma2 intercept 0.5395 0.2109 -0.3385 19.9850 s.e. 0.4062 0.4160 0.3049 0.0878 sigma^2 estimated as 1.076: log likelihood=-728.14 AIC=1466.28 AICc=1466.41 BIC=1487.36 以下は、arima()注文ARIMA(1,0,1)で定期的に実行した結果です。 Series: …

4
ラグと時系列のある多重線形回帰の「機械的な」違いは何ですか?
私は現在、データ工学の修士号を取得するために勉強しているビジネスと経済学を卒業しています。線形回帰(LR)を研究してから、時系列分析(TS)を研究しているときに、疑問が浮かびました。多重線形回帰を使用し、それにラグ変数を追加するのではなく、時系列(ARIMA)などのまったく新しいメソッドを作成する理由(ラグの順序はACFとPACFを使用して決定)?そこで、先生は私がこの問題について少しエッセイを書くことを提案しました。私は手ぶらで助けを求めに来ませんでしたので、私はこのトピックに関する研究を行いました。 LRを使用する場合、ガウスマルコフの仮定に違反すると、OLS回帰は正しくないこと、そしてこれは時系列データ(自己相関など)を使用するときに発生することを既に知っていました。(これに関する別の質問、GMの仮定の1つは、独立変数を正規分布させるべきか、それとも独立変数の条件付き従属変数だけかということです。) また、ここで提案している分散ラグ回帰を使用し、OLSを使用してパラメーターを推定すると、変数間の多重共線性が(明らかに)発生する可能性があるため、推定が間違っていることもわかっています。 でTSとLRについて同様のポストここで、@IrishStatは言いました: ...回帰モデルは、動的回帰モデルまたはXARMAXモデルとも呼ばれる伝達関数モデルの特定のケースです。際立ったポイントは、時系列でのモデルの識別、つまり、適切な違い、Xの適切なラグ、適切なARIMA構造、パルスなどの不特定の決定論的構造の適切な識別、レベルシフト、ローカル時間傾向、季節的パルス、および組み込みです。パラメータの変化またはエラー分散を考慮する必要があります。 (私はBox JenkinsとLRについてのAutoboxの彼の論文も読んでいます。)しかし、これでも私の疑問は解決しません(または、少なくとも私にとってRLとTSの異なるメカニズムを明確にしません)。 遅れた変数でもOLS問題が発生し、効率的でも正確でもないことは明らかですが、最尤法を使用する場合、これらの問題は持続しますか?ARIMAは最尤法で推定されることを読んだので、遅れのあるLRがOLSではなくMLで推定される場合、「正しい」係数が得られます(順序のMAのように、遅延誤差項も含めると仮定します) q)。 要するに、問題はOLSですか?MLを適用して問題は解決しましたか?

3
アンサンブル時系列モデル
時系列予測を自動化する必要がありますが、それらの系列の機能(季節性、傾向、ノイズなど)を事前に知りません。 私の目的は、各シリーズに最適なモデルを取得することではなく、かなり悪いモデルを回避することです。言い換えれば、小さなエラーを毎回取得することは問題ではありませんが、大きなエラーを時々取得することは問題です。 異なる手法で計算されたモデルを組み合わせることで実現できると思いました。 つまり、ARIMAは特定のシリーズに最適なアプローチですが、別のシリーズには最適でない場合があります。指数平滑法についても同様です。 ただし、各手法の1つのモデルを組み合わせると、1つのモデルがそれほど良くなくても、もう1つのモデルが推定値を実際の値に近づけます。 ARIMAが長期の正常に動作するシリーズに適していることはよく知られていますが、指数平滑法は短期のノイズの多いシリーズで際立ちます。 私のアイデアは、より堅牢な予測を得るために、両方の手法から生成されたモデルを組み合わせることです、それは理にかなっていますか? これらのモデルを組み合わせるには多くの方法があるかもしれません。 これが良いアプローチである場合、それらをどのように組み合わせる必要がありますか? 予測の単純な平均はオプションですが、モデルの適切な尺度に従って平均に重みを付けると、より良い予測が得られる可能性があります。 モデルを組み合わせるときの分散の扱いは何ですか?

1
予測における休日の影響を考慮する方法
週ごとの季節性を持つかなり予測可能な毎日の時系列があります。休日がない場合、かなり正確であると思われる予測(クロスバリデーションによって確認された)を思いつくことができます。ただし、休日がある場合、次の問題があります。 過去のすべての休日が0であっても、予測では休日に0以外の数値が表示されます。これは実際には主要な問題ではありません。問題は... 休日に発生しない処理は、休日の翌日に「波及」するため、これらの異常値は短期的な革新的であるように見えるため、単純なダミー変数はそれをカットしません。週ごとの季節性がない場合は、休日の5日前後にわたって休日に未処理のデータを配布するための見積もりを考え出すことができます(休日のリード/ラグの影響を反映する変数の作成方法/時系列分析におけるカレンダー効果?)ただし、「スピルオーバー」の分布は、休日が発生する曜日、および休日がクリスマスまたは感謝祭であるかどうかに依存します。クリスマスまたは感謝祭では、年の残りよりも低いレートで注文が行われます。 クロスバリデーションのいくつかのスナップショットを以下に示します。これらのスナップショットは、異なる曜日に表示される休日の予測結果(青)と実際の結果(赤)を示しています。 また、クリスマスの影響はそれが属する曜日に依存するのではないかと心配しています。また、6年ほどの履歴データしかありません。 予測の文脈でこれらのタイプの革新的な外れ値に対処する方法についての提案はありますか?(残念ながら、データを共有することはできません)

4
ARIMAでトレンド定常シリーズをモデル化できますか?
ARIMA(X)でのモデリングに必要な定常シリーズについて質問/混乱があります。私はこれを推論(介入の効果)の観点から考えていますが、予測と推論が反応に何らかの違いをもたらすかどうかを知りたいです。 質問: 私が読んだすべての入門資料は、シリーズが静止している必要があると述べています。これは私にとって理にかなっています。 私を混乱させているのは、ARIMA(X)のトレンドとドリフトの使用、および定常要件に対する影響(ある場合)です。 定数/ドリフト項および/またはトレンド変数を外生変数として使用する(つまり、「t」をリグレッサーとして追加する)と、シリーズが定常であるという要件が無効になりますか?シリーズに単位根がある場合(adfテストなど)、決定論的な傾向はあるが単位根がない場合、答えは異なりますか? または ARIMA(X)を使用する前に、差分および/またはトレンド除去を介して作成されたシリーズは常に静止している必要がありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.