タグ付けされた質問 「arima」

データの説明と予測の両方のために時系列モデリングで使用されるAutoRegressive統合移動平均モデルを指します。このモデルは、傾向を取り除き、いくつかのタイプの非定常性を処理するのに役立つ差分の用語を含めることにより、ARMAモデルを一般化します。

3
auto.arima()のp、d、qを読み取る方法は?
によって推定されp,d and qたARIMA(p,d,q)モデルの値を取得するにはどうすればよいauto.arima(mytimeseries)ですか? arima_model <-auto.arima(mytimeseries、ic = 'bic') の出力を見ると arima_model $ arma 我々が得る、 [1] 1 0 0 0 1 2 0 上記のシーケンスに表示される数字の意味は何ですか?
10 r  arima 

2
ARIMAプロセスのBox-Jenkins法とは正確には何ですか?
Wikipediaのページには、ボックス・ジェンキンスは、時系列にARIMAモデルを適合させる方法であると述べています。ここで、時系列にARIMAモデルを適合させたい場合は、SASを開いてを呼び出しproc ARIMA、パラメーターを指定します。SASはAR係数とMA係数を提供します。これで、p 、d 、qのさまざまな組み合わせを試すことができます。SASを使用すると、各ケースで一連の係数が得られます。赤池情報量基準が最も低いセットを選択します。p,d,qp,d,qp,d,qp,d,qp,d,qp,d,q 私の質問は、上記の手順のどこでBox-Jenkinsを使用したかです。Box-Jenkinsを使用して、初期推定値を出すことになっていますか?それともSASは内部的に何らかの方法でそれを使用しましたか?p,d,qp,d,qp,d,q

4
ARIMAモデリングのパラメーター(p、d、q)の決定
私は統計とRにかなり慣れています。データセットのARIMAパラメータを決定するプロセスを知りたいのですが。Rと理論的に(可能であれば)を使用して同じことを理解するのを手伝ってくれませんか? データの範囲は1月12日から3月14日で、月次売上高を表します。これがデータセットです: 99 58 52 83 94 73 97 83 83 63 63 77 70 87 84 60 105 87 93 110 71 158 52 33 68 82 88 84 そしてここにトレンドがあります: データは、傾向、季節的な行動または周期性を示していません。
10 r  arima  box-jenkins 

4
ニューラルネットワーク、auto.arimaおよびetsを使用したR時系列予測
ニューラルネットワークを使用して時系列を予測することについて少し聞いたことがあります。 比較するにはどうすればよいですか?auto.arima(x)、ets(x)、またはnnetar(x)の時系列(日次小売データ)を予測する方法はどちらが優れていますか。 auto.arimaとetsをAICまたはBICで比較できます。しかし、どうすればニューラルネットワークと比較できますか? 例えば: > dput(x) c(1774, 1706, 1288, 1276, 2350, 1821, 1712, 1654, 1680, 1451, 1275, 2140, 1747, 1749, 1770, 1797, 1485, 1299, 2330, 1822, 1627, 1847, 1797, 1452, 1328, 2363, 1998, 1864, 2088, 2084, 594, 884, 1968, 1858, 1640, 1823, 1938, 1490, 1312, 2312, 1937, 1617, 1643, 1468, …

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
時系列予測を行う際の推奨事項
私は何カ月も短期的な負荷予測と精度を向上させるための気候/気象データの使用に取り組んできました。私はコンピューターサイエンスのバックグラウンドを持っているので、ARIMAモデルなどの統計ツールを使用して、大きな間違いや不当な比較を行わないようにしています。私はいくつかのことについてあなたの意見を知りたいです: (S)ARIMAモデルと(S)ARIMAXモデルの両方を使用して、気象データが予測に与える影響を調査していますが、指数平滑法も使用する必要があると思いますか? 最初の2週間から始めて、300サンプルの時系列の時系列があり、auto.arima R関数(予測パッケージ)で構築されたモデルを使用して5日間先の予測を実行します。次に、データセットに別のサンプルを追加し、モデルを再度キャリブレーションし、さらに5日間の予測を実行して、使用可能なデータが終わるまで続けます。この操作方法は正しいと思いますか? エンジニアリングジャーナルの記事をターゲットにしていますが、統計的な観点からできる限り厳密な作業を行いたいと思います。

1
ARIMA対カルマンフィルター-それらはどのように関連していますか
カルマンフィルターについて読み始めたとき、それはARIMAモデル(つまりARIMA(0,1,1))の特殊なケースであると思いました。しかし、実際には状況はより複雑であるようです。まず、ARIMAは予測に使用でき、カルマンフィルターはフィルタリングに使用できます。しかし、それらは密接に関連していませんか? 質問: ARIMAとカルマンフィルターの関係は何ですか?別のものを使用していますか?別の特別なケースですか?

2
ACFおよびPACFプロットを解釈する方法
ACFプロットとPACFプロットを正しく解釈していることを確認したいだけです。 データは、実際のデータポイントとAR(1)モデルを使用して生成された推定値の間に生成されたエラーに対応します。 私はここで答えを見ました: ACFおよびPACF検査によりARMA係数を推定する エラーを自動相関させていないようですが、確認したいのですが、私の懸念は次のとおりです。 1.)最初のエラーは境界の右側にあります(これが当てはまる場合、ラグ1に有意な自己相関があることを受け入れるか拒否する必要がありますか)? 2.)線は95%の信頼区間を表しており、116のラグがあることを前提として(0.05 * 116 = 5.8、6に切り上げます)、6つのラグが境界を超えると予測されます。ACFの場合はこれに該当しますが、PACFの場合は約10の例外があります。国境にそれらを含めると、14のようになりますか?これはまだ自己相関がないことを示していますか? 3.)95%信頼区間のすべての違反がマイナス面で発生しているという事実に何かを読む必要がありますか?

4
Rの離散時間イベント履歴(生存)モデル
Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。 従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります:ID、Event(各time-obsで1または0)およびTime Elapsed(観測の開始以降)、および他の共変量。 モデルに合うようにコードを書くにはどうすればよいですか?従属変数はどれですか?Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか?必要ですか? ありがとう。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
時系列分析の履歴に役立つリソースは何ですか?
私はstats.stackexchangeでこの質問の回答を確認しました。統計の履歴を提供する優れたリソースは何ですか? 確かに、スティグラーの本「Statistics on the Table」はすばらしいように見え、私はそれを読むのを楽しみにしています。しかし、私は現代のARIMAモデルの開発にもっと興味があります。 第二次世界大戦中の大砲のランダムな不正確さを予測しようとすることで多くの進歩が刺激されたと聞いたのを覚えていると思います。また、もちろん、ミレニアムの後半の天文学者は、天体の動きを理解するために、ある種の時系列をある程度使用していました。しかし、時系列の大砲の適用についてどこで聞いたのか思い出せず、物理学のバックグラウンドがあり、天文学者がどのような統計的手法を使用していたのか本当にわかりません。 ですから、時系列手法の開発に最も関連した歴史的影響は何だと思いますか。たとえば、それらは主に金融、防衛、地質学/地球物理学、またはこれらすべての組み合わせによって刺激されたのでしょうか?ARIMAの歴史に関する有益な本やウェブサイトはありますか?

3
機械学習を使用した複数の期間の予測
私は最近、時系列の知識を要約しましたが、機械学習はほとんど一歩先の予測しか与えないことに気付きました。 一段先の予測我々は時間単位のデータを持っている場合は、午前12時などの予測午前11時と11時まで午前10時からのデータを使用して、例えば、I平均予測 機械学習の方法でh-steps-aheadの予測を作成できますか?h-step-ahead予測では、たとえば、毎時のデータを想定して、午前10時からのデータを使用して7-step-ahead予測を行い、11、12、13、14、15、16、17の推定値を取得します。 o時計。 写真の例: 私の主な質問に関連して私は思います: h-ahead-ahead予測を行うために機械学習を使用している人を見かけない理由は何ですか? 機械学習を使用する方法がある場合、それはARIMAよりも正確ですか?

1
ARIMAモデルの周期的動作の条件
私は季節ではなく周期的な時系列をモデル化して予測しようとしています(つまり、季節に似たパターンがありますが、一定の期間ではありません)。これは、予測のセクション8.5で説明されているように、ARIMAモデルを使用して実行できるはずです。 データがサイクルを示す場合、の値は重要です。環状の予測を得るために、有することが必要であるP ≥ 2のパラメータのいくつかの追加の条件と一緒。AR(2)モデルの場合、サイクリック動作は、場合に発生φ 2 1 + 4 φ 2 &lt; 0。pppp≥2p≥2p\geq 2ϕ21+4ϕ2&lt;0ϕ12+4ϕ2&lt;0\phi^2_1+4\phi_2<0 一般的なARIMA(p、d、q)の場合のパラメーターのこれらの追加条件は何ですか?私はどこにもそれらを見つけることができませんでした。

1
ARIMAとLSTMを使用した時系列予測
私が扱っている問題は、時系列値を予測することです。一度に1つの時系列を見ていて、たとえば入力データの15%に基づいて、将来の値を予測したいと思います。これまでのところ、2つのモデルに出会いました。 LSTM(長期短期記憶;再帰型ニューラルネットワークのクラス) 有馬 私は両方を試し、それらに関するいくつかの記事を読みました。現在、私はこの2つを比較する方法について理解を深めようとしています。これまでに見つけたもの: 大量のデータを処理し、十分なトレーニングデータが利用可能な場合、LSTMは適切に機能しますが、ARIMAは小さなデータセットに適しています(これは正しいですか?) ARIMAでは(p,q,d)データに基づいて計算する必要がある一連のパラメーターが必要ですが、LSTMではそのようなパラメーターを設定する必要はありません。ただし、LSTMを調整する必要があるいくつかのハイパーパラメーターがあります。 上記の特性以外に、最良のモデルを選択するのに役立つポイントや事実は見つかりませんでした。誰かが記事、論文、またはその他のものを見つけるのを手伝ってくれる人がいてくれたら本当にありがたいです(これまでのところ運が悪く、あちこちにいくつかの一般的な意見だけがあり、実験に基づくものはありません)。 元々はストリーミングデータを扱っていることを述べなければなりませんが、今のところ、最大サイズが20kデータポイントの50個のデータセットを含むNABデータセットを使用しています。

2
tsoutliersパッケージとauto.arimaを使用して予測を解釈および実行する方法
1993年から2015年までの月次データがあり、これらのデータを予測したいと思います。私はtsoutliersパッケージを使用して外れ値を検出しましたが、自分のデータセットを使用して予測を続行する方法がわかりません。 これは私のコードです: product.outlier&lt;-tso(product,types=c("AO","LS","TC")) plot(product.outlier) これはtsoutliersパッケージからの私の出力です ARIMA(0,1,0)(0,0,1)[12] Coefficients: sma1 LS46 LS51 LS61 TC133 LS181 AO183 AO184 LS185 TC186 TC193 TC200 0.1700 0.4316 0.6166 0.5793 -0.5127 0.5422 0.5138 0.9264 3.0762 0.5688 -0.4775 -0.4386 s.e. 0.0768 0.1109 0.1105 0.1106 0.1021 0.1120 0.1119 0.1567 0.1918 0.1037 0.1033 0.1040 LS207 AO237 TC248 AO260 AO266 0.4228 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.