統計とビッグデータ arima

3

によって推定されp,d and qたARIMA(p,d,q)モデルの値を取得するにはどうすればよいauto.arima(mytimeseries)ですか？ arima_model <-auto.arima（mytimeseries、ic = 'bic'）の出力を見ると arima_model $ arma 我々が得る、 [1] 1 0 0 0 1 2 0 上記のシーケンスに表示される数字の意味は何ですか？

10 r arima

2

ARIMAプロセスのBox-Jenkins法とは正確には何ですか？

Wikipediaのページには、ボックス・ジェンキンスは、時系列にARIMAモデルを適合させる方法であると述べています。ここで、時系列にARIMAモデルを適合させたい場合は、SASを開いてを呼び出しproc ARIMA、パラメーターを指定します。SASはAR係数とMA係数を提供します。これで、p 、d 、qのさまざまな組み合わせを試すことができます。SASを使用すると、各ケースで一連の係数が得られます。赤池情報量基準が最も低いセットを選択します。p,d,qp,d,qp,d,qp,d,qp,d,qp,d,q 私の質問は、上記の手順のどこでBox-Jenkinsを使用したかです。Box-Jenkinsを使用して、初期推定値を出すことになっていますか？それともSASは内部的に何らかの方法でそれを使用しましたか？p,d,qp,d,qp,d,q

10 time-series arima sas aic box-jenkins

4

ARIMAモデリングのパラメーター（p、d、q）の決定

私は統計とRにかなり慣れています。データセットのARIMAパラメータを決定するプロセスを知りたいのですが。Rと理論的に（可能であれば）を使用して同じことを理解するのを手伝ってくれませんか？データの範囲は1月12日から3月14日で、月次売上高を表します。これがデータセットです： 99 58 52 83 94 73 97 83 83 63 63 77 70 87 84 60 105 87 93 110 71 158 52 33 68 82 88 84 そしてここにトレンドがあります：データは、傾向、季節的な行動または周期性を示していません。

10 r arima box-jenkins

4

ニューラルネットワーク、auto.arimaおよびetsを使用したR時系列予測

ニューラルネットワークを使用して時系列を予測することについて少し聞いたことがあります。比較するにはどうすればよいですか？auto.arima（x）、ets（x）、またはnnetar（x）の時系列（日次小売データ）を予測する方法はどちらが優れていますか。 auto.arimaとetsをAICまたはBICで比較できます。しかし、どうすればニューラルネットワークと比較できますか？例えば： > dput(x) c(1774, 1706, 1288, 1276, 2350, 1821, 1712, 1654, 1680, 1451, 1275, 2140, 1747, 1749, 1770, 1797, 1485, 1299, 2330, 1822, 1627, 1847, 1797, 1452, 1328, 2363, 1998, 1864, 2088, 2084, 594, 884, 1968, 1858, 1640, 1823, 1938, 1490, 1312, 2312, 1937, 1617, 1643, 1468, …

10 r neural-networks forecasting arima exponential-smoothing

1

観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか？

私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA（0,2,1）モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値（IO）TSAを検出しました。この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか？Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか？これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

1

Anova（）とdrop1（）がGLMMに異なる回答を提供したのはなぜですか？

次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル（異なるグループでnが等しくない場合）、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。これらの2つの方法の間に違いがあるのはなぜですか？ GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか？これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか？

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

1

時系列予測を行う際の推奨事項

私は何カ月も短期的な負荷予測と精度を向上させるための気候/気象データの使用に取り組んできました。私はコンピューターサイエンスのバックグラウンドを持っているので、ARIMAモデルなどの統計ツールを使用して、大きな間違いや不当な比較を行わないようにしています。私はいくつかのことについてあなたの意見を知りたいです：（S）ARIMAモデルと（S）ARIMAXモデルの両方を使用して、気象データが予測に与える影響を調査していますが、指数平滑法も使用する必要があると思いますか？最初の2週間から始めて、300サンプルの時系列の時系列があり、auto.arima R関数（予測パッケージ）で構築されたモデルを使用して5日間先の予測を実行します。次に、データセットに別のサンプルを追加し、モデルを再度キャリブレーションし、さらに5日間の予測を実行して、使用可能なデータが終わるまで続けます。この操作方法は正しいと思いますか？エンジニアリングジャーナルの記事をターゲットにしていますが、統計的な観点からできる限り厳密な作業を行いたいと思います。

10 time-series forecasting arima

1

ARIMA対カルマンフィルター-それらはどのように関連していますか

カルマンフィルターについて読み始めたとき、それはARIMAモデル（つまりARIMA（0,1,1））の特殊なケースであると思いました。しかし、実際には状況はより複雑であるようです。まず、ARIMAは予測に使用でき、カルマンフィルターはフィルタリングに使用できます。しかし、それらは密接に関連していませんか？質問： ARIMAとカルマンフィルターの関係は何ですか？別のものを使用していますか？別の特別なケースですか？

10 time-series bayesian arima kalman-filter

2

ACFおよびPACFプロットを解釈する方法

ACFプロットとPACFプロットを正しく解釈していることを確認したいだけです。データは、実際のデータポイントとAR（1）モデルを使用して生成された推定値の間に生成されたエラーに対応します。私はここで答えを見ました： ACFおよびPACF検査によりARMA係数を推定するエラーを自動相関させていないようですが、確認したいのですが、私の懸念は次のとおりです。 1.）最初のエラーは境界の右側にあります（これが当てはまる場合、ラグ1に有意な自己相関があることを受け入れるか拒否する必要がありますか）？ 2.）線は95％の信頼区間を表しており、116のラグがあることを前提として（0.05 * 116 = 5.8、6に切り上げます）、6つのラグが境界を超えると予測されます。ACFの場合はこれに該当しますが、PACFの場合は約10の例外があります。国境にそれらを含めると、14のようになりますか？これはまだ自己相関がないことを示していますか？ 3.）95％信頼区間のすべての違反がマイナス面で発生しているという事実に何かを読む必要がありますか？

10 time-series arima interpretation autocorrelation acf-pacf

4

Rの離散時間イベント履歴（生存）モデル

Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります：ID、Event（各time-obsで1または0）およびTime Elapsed（観測の開始以降）、および他の共変量。モデルに合うようにコードを書くにはどうすればよいですか？従属変数はどれですか？Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか？必要ですか？ありがとう。

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

2

時系列分析の履歴に役立つリソースは何ですか？

私はstats.stackexchangeでこの質問の回答を確認しました。統計の履歴を提供する優れたリソースは何ですか？確かに、スティグラーの本「Statistics on the Table」はすばらしいように見え、私はそれを読むのを楽しみにしています。しかし、私は現代のARIMAモデルの開発にもっと興味があります。第二次世界大戦中の大砲のランダムな不正確さを予測しようとすることで多くの進歩が刺激されたと聞いたのを覚えていると思います。また、もちろん、ミレニアムの後半の天文学者は、天体の動きを理解するために、ある種の時系列をある程度使用していました。しかし、時系列の大砲の適用についてどこで聞いたのか思い出せず、物理学のバックグラウンドがあり、天文学者がどのような統計的手法を使用していたのか本当にわかりません。ですから、時系列手法の開発に最も関連した歴史的影響は何だと思いますか。たとえば、それらは主に金融、防衛、地質学/地球物理学、またはこれらすべての組み合わせによって刺激されたのでしょうか？ARIMAの歴史に関する有益な本やウェブサイトはありますか？

10 time-series references arima history

3

機械学習を使用した複数の期間の予測

私は最近、時系列の知識を要約しましたが、機械学習はほとんど一歩先の予測しか与えないことに気付きました。一段先の予測我々は時間単位のデータを持っている場合は、午前12時などの予測午前11時と11時まで午前10時からのデータを使用して、例えば、I平均予測機械学習の方法でh-steps-aheadの予測を作成できますか？h-step-ahead予測では、たとえば、毎時のデータを想定して、午前10時からのデータを使用して7-step-ahead予測を行い、11、12、13、14、15、16、17の推定値を取得します。 o時計。写真の例：私の主な質問に関連して私は思います： h-ahead-ahead予測を行うために機械学習を使用している人を見かけない理由は何ですか？機械学習を使用する方法がある場合、それはARIMAよりも正確ですか？

9 machine-learning time-series forecasting arima

1

ARIMAモデルの周期的動作の条件

私は季節ではなく周期的な時系列をモデル化して予測しようとしています（つまり、季節に似たパターンがありますが、一定の期間ではありません）。これは、予測のセクション8.5で説明されているように、ARIMAモデルを使用して実行できるはずです。データがサイクルを示す場合、の値は重要です。環状の予測を得るために、有することが必要であるP ≥ 2のパラメータのいくつかの追加の条件と一緒。AR（2）モデルの場合、サイクリック動作は、場合に発生φ 2 1 + 4 φ 2 < 0。pppp≥2p≥2p\geq 2ϕ21+4ϕ2<0ϕ12+4ϕ2<0\phi^2_1+4\phi_2<0 一般的なARIMA（p、d、q）の場合のパラメーターのこれらの追加条件は何ですか？私はどこにもそれらを見つけることができませんでした。

9 time-series forecasting arima seasonality

1

ARIMAとLSTMを使用した時系列予測

私が扱っている問題は、時系列値を予測することです。一度に1つの時系列を見ていて、たとえば入力データの15％に基づいて、将来の値を予測したいと思います。これまでのところ、2つのモデルに出会いました。 LSTM（長期短期記憶;再帰型ニューラルネットワークのクラス）有馬私は両方を試し、それらに関するいくつかの記事を読みました。現在、私はこの2つを比較する方法について理解を深めようとしています。これまでに見つけたもの：大量のデータを処理し、十分なトレーニングデータが利用可能な場合、LSTMは適切に機能しますが、ARIMAは小さなデータセットに適しています（これは正しいですか？） ARIMAでは(p,q,d)データに基づいて計算する必要がある一連のパラメーターが必要ですが、LSTMではそのようなパラメーターを設定する必要はありません。ただし、LSTMを調整する必要があるいくつかのハイパーパラメーターがあります。上記の特性以外に、最良のモデルを選択するのに役立つポイントや事実は見つかりませんでした。誰かが記事、論文、またはその他のものを見つけるのを手伝ってくれる人がいてくれたら本当にありがたいです（これまでのところ運が悪く、あちこちにいくつかの一般的な意見だけがあり、実験に基づくものはありません）。元々はストリーミングデータを扱っていることを述べなければなりませんが、今のところ、最大サイズが20kデータポイントの50個のデータセットを含むNABデータセットを使用しています。

9 time-series forecasting references arima lstm

2

tsoutliersパッケージとauto.arimaを使用して予測を解釈および実行する方法

1993年から2015年までの月次データがあり、これらのデータを予測したいと思います。私はtsoutliersパッケージを使用して外れ値を検出しましたが、自分のデータセットを使用して予測を続行する方法がわかりません。これは私のコードです： product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) これはtsoutliersパッケージからの私の出力です ARIMA(0,1,0)(0,0,1)[12] Coefficients: sma1 LS46 LS51 LS61 TC133 LS181 AO183 AO184 LS185 TC186 TC193 TC200 0.1700 0.4316 0.6166 0.5793 -0.5127 0.5422 0.5138 0.9264 3.0762 0.5688 -0.4775 -0.4386 s.e. 0.0768 0.1109 0.1105 0.1106 0.1021 0.1120 0.1119 0.1567 0.1918 0.1037 0.1033 0.1040 LS207 AO237 TC248 AO260 AO266 0.4228 …

9 r time-series forecasting arima outliers

タグ付けされた質問 「arima」

タグ付けされた質問「arima」