タグ付けされた質問 「arima」

データの説明と予測の両方のために時系列モデリングで使用されるAutoRegressive統合移動平均モデルを指します。このモデルは、傾向を取り除き、いくつかのタイプの非定常性を処理するのに役立つ差分の用語を含めることにより、ARMAモデルを一般化します。

2
実世界でのMA(q)モデル入力とは何ですか?
AR(p)モデルを理解しています。その入力はモデル化される時系列です。MA(q)モデルについて読むとき、私は完全に行き詰まっています。その入力は、しばしば定式化されているため、イノベーションまたはランダムショックです。 問題は、(完全な)時系列のモデルがないイノベーションコンポーネントを取得する方法が想像できないことです(つまり、ε = Xo b s e r v e d− XP E R Fe c tε=Xobserved−Xperfect\varepsilon=X_{\rm observed}-X_{\rm perfect}、そしてそれはおそらく間違っています)。さらに、この革新的なコンポーネントをサンプルで取得できる場合、長期予測(個別の追加時系列コンポーネントとしてのモデル誤差項)を実行するときにどのように取得できますか?

3
RでArimaモデルを近似するときのoptimのエラー
Rの統計パッケージのarimaメソッドを、時系列の17376要素で使用しています。私の目標は、AIC基準の値を取得することです。最初のテストでこれを観察しました。 ts <- arima(serie[,1], order = c(2,1,1), seasonal = list(order=c(2,0,1),period = 24), method = "CSS", optim.method = "BFGS",) > ts$coef ar1 ar2 ma1 sar1 sar2 sma1 0.8883730 -0.0906352 -0.9697230 1.2047580 -0.2154847 -0.7744656 > ts$aic [1] NA ご覧のとおり、AICは定義されていません。AICについて、Rの「ヘルプ」は「ML」でのみ使用できると述べました。しかし、それは起こります: > ts <- arima(serie[,1], order = c(2,1,1), seasonal = list(order=c(2,0,1),period = 24), method …

2
膨大なデータセットが与えられた場合、なぜ統計モデルは過剰適合しますか?
現在のプロジェクトでは、特定のグループの行動を予測するモデルを構築する必要があるかもしれません。トレーニングデータセットには6つの変数のみが含まれます(idは識別目的のみです)。 id, age, income, gender, job category, monthly spend その中で monthly spend応答変数です。ただし、トレーニングデータセットには約300万行が含まれid, age, income, gender, job category、予測されるデータセット(応答変数は含まれるが、含まれない)には100万行が含まれます。私の質問は、統計モデルにあまりにも多くの行(この場合は300万行)を投げた場合に潜在的な問題はありますか?計算コストが懸念事項の1つであることを理解していますが、他に懸念事項はありますか?データセットのサイズの問題を完全に説明している本/紙はありますか?
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

2
auto.arimaが季節パターンを認識しない
私は毎日の気象データセットを持っていますが、これは当然のことながら、非常に強い季節効果を持っています。 予測パッケージの関数auto.arimaを使用して、このデータセットにARIMAモデルを適合させました。驚いたことに、この関数は季節性操作、季節性差異、季節性arまたはmaコンポーネントを適用しません。推定したモデルは次のとおりです。 library(forecast) data<-ts(data,frequency=365) auto.arima(Berlin) Series: data ARIMA(3,0,1) with non-zero mean Coefficients: ar1 ar2 ar3 ma1 intercept 1.7722 -0.9166 0.1412 -0.8487 283.0378 s.e. 0.0260 0.0326 0.0177 0.0214 1.7990 sigma^2 estimated as 5.56: log likelihood=-8313.74 AIC=16639.49 AICc=16639.51 BIC=16676.7 また、このモデルを使用した予測は、本当に満足できるものではありません。これが予測のプロットです。 誰かが私にここで何が間違っているのかヒントを教えてくれますか?

2
Rを使用したARIMAの2つの季節期間
私は現在、これらの指示で時系列を予測するためにRを使用しています: X <- ts(datas, frequency=24) X.arima <- Arima(X, order=c(2,1,0), seasonal=c(1,1,1)) pred <- predict(X.arima, n.ahead=24) plot.ts(pred$pred) ご覧のとおり、1時間ごとにデータを取得し、24(1日)の季節期間を選択しました。 週の季節要素を含めるために、追加の季節期間を使用して予測を改善したい(季節の長さ7 * 24 = 168データ) これには何らかの方法がありますか?どうやってやるの? 更新: 私はこの(あなたの)ブログページを読みました。おそらく、外部のリグレッサを使用して2番目の季節期間をシミュレートできますか?

1
非定常時系列の予測
非定常時系列を予測したいと思います。そのような系列のインスタンスの研究から続くいくつかの重要な先験的仮定を含みます。 正規分布で近似された時間平均1点確率分布関数を作成しました。 この観点から、とき、予測がこれを超えないようにします。言い換えると、分散は有界でなければなりません。ZT(L)L→∞ZT(L)p^(x )= 12個のπσ2∞−−−−−√exp( − x22つのσ2∞)p^(バツ)=12πσ∞2exp⁡(−バツ22σ∞2)\hat p(x) = \frac{1}{\sqrt{2\pi \sigma^2_{\infty}}} \exp\left(-\frac{x^2}{2\sigma^2_{\infty}}\right)zt(l )zt(l)z_t(l)l → ∞l→∞l \to \inftyzt(l )zt(l)z_t(l) 平均2点確率分布関数も作成され、自己相関関数の識別につながりました。は。ρ(J)≈AJ-α0&lt;α&lt;0.5p^(x私、私; バツj、j )p^(バツ私、私;バツj、j)\hat p(x_i,i;x_j,j)ρ (J )≈ A J- αρ(j)≈あj−α\rho(j) \approx A j^{-\alpha} 0 &lt; α &lt; 0.50&lt;α&lt;0.50<\alpha<0.5 最初、Box-Jenkinsの識別プロセスにより、モデルが、A R IMA (0 、1 、3 )あR私Mあ(0、1、3)ARIMA(0,1,3) (これはBJ重みの方程式から得られます)までは、分散の制限はありません。同時に、初期の自己相関がゆっくりと減少するため、使用することはできません(これは、おそらくBJによる非定常性の証拠です)。これが私にとっての主な障害です。ψ J D = 0d≠ 0d≠0d \ne 0ψjψj\psi_jd= …

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 


1
Rを使用してArimaエラーのある回帰のR-2乗を計算するにはどうすればよいですか?
私のようなarimaオブジェクトがある場合a: set.seed(100) x1 &lt;- cumsum(runif(100)) x2 &lt;- c(rnorm(25, 20), rep(0, 75)) x3 &lt;- x1 + x2 dummy = c(rep(1, 25), rep(0, 75)) a &lt;- arima(x3, order=c(0, 1, 0), xreg=dummy) print(a) 。 Series: x3 ARIMA(0,1,0) Call: arima(x = x3, order = c(0, 1, 0), xreg = dummy) Coefficients: dummy 17.7665 s.e. …

1
予測パッケージのauto.arima()とets()を組み合わせる
多くの単変量時系列を予測するために、予測パッケージのets()およびauto.arima()関数を使用しています。私は次の関数を使用して2つの方法のいずれかを選択していますが、CrossValidatedに自動予測の優れた(またはそれほど単純ではない)アイデアがあるかどうか疑問に思っていました。 auto.ts &lt;- function(x,ic="aic") { XP=ets(x, ic=ic) AR=auto.arima(x, ic=ic) if (get(ic,AR)&lt;get(ic,XP)) { model&lt;-AR } else { model&lt;-XP } model } /編集:この関数はどうですか? auto.ts &lt;- function(x,ic="aic",holdout=0) { S&lt;-start(x)[1]+(start(x)[2]-1)/frequency(x) #Convert YM vector to decimal year E&lt;-end(x)[1]+(end(x)[2]-1)/frequency(x) holdout&lt;-holdout/frequency(x) #Convert holdout in months to decimal year fitperiod&lt;-window(x,S,E-holdout) #Determine fit window if (holdout==0) { testperiod&lt;-fitperiod } …

3
ARIMAモデルと回帰モデルのモデル比較
ARIMAモデルと回帰モデルを比較する方法を見つけるのに本当に苦労しています。ARIMAモデルを相互に評価する方法と、さまざまなタイプの回帰モデル(つまり、回帰とARエラーを伴う動的回帰)を相互に評価する方法を理解していますが、ARIMAモデルと回帰モデルの評価指標の間には多くの共通点がありません。 彼らが共有する唯一の2つのメトリックは、SBCとAICです。ARIMAの出力は、ルートMSEの図もr ^ 2統計も生成しません。ARIMAモデルの標準誤差の推定値が、回帰出力内の何かと直接同等(または同等)であるかどうかはあまりわかりません。 私がここで本当に混乱しているので、誰かが私を正しい方向に向けることができればそれは素晴らしいことです。リンゴとオレンジを比較しようとしているような気がします。 この分析では、SASを使用しています。

1
Rでの「予測」と「予測」によるARIMAの予測[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 3年前休業。 30個の値で構成されるデータは、時系列に格納されtimeます。 にARIMAモデリングを適用した後time、forecast関数を使用して将来の値を予測しました。 model = arima(time, order = c(3,2,1)) prediction = forecast.Arima(model,h=10) prediction step is not working and showing error Error in ts(x) : object is not a matrix 上記のように、エラーメッセージが表示されます。しかし、私がするなら model = arima(time[1:25], order = c(3,2,1)) prediction = forecast.Arima(model,h=10) できます。なぜそうなのですか? predict関数を使用したとき model = arima(time, order = c(3,2,1)) …

2
定常ARMA方程式の非定常解
「静止」とは「弱い静止」を意味します。 「定常」AR(1)方程式を考えます。 Xt=φXt−1+εt,Xt=φXt−1+εt,X_t=\varphi X_{t-1}+\varepsilon_t, ここでは離散時間モーメント、はゼロ平均ホワイトノイズ(一部のiidシーケンス)、。定常解(つまり、方程式を満たす離散時系列)があることはよく知られています。表ししかし、我々は、一連の他の時間導入することができる「固定」式(明確にするための非定常溶液であるように見える、自由ではないので、明らかであるがゼロ平均)。t∈Zt∈Zt\in\mathbb{Z}εtεt\varepsilon_tφ∈(−1,1)φ∈(−1,1)\varphi\in(-1,1)Xt.Xt.X_t.Yt=Xt+φtYt=Xt+φtY_t=X_t+\varphi^tE[Yt]E[Yt]\mathbb{E}[Y_t]tttXtXtX_t より一般的な定常AR()プロセスを考えると、弱い定常性特性を何らかの形で損なうことは可能ですか?または、一般的に、定常的な離散時間AR(またはARMA)方程式に非定常解があることは本当ですか?ppp

1
t学生のエラーがあるARMAプロセスの無条件分布
でモデルの誤差が正規分布を持つ場合、無条件の分布ノーマルです。エラーに自由度のt学生分布がある場合。の無条件分布とは何ですか?Yt∼ARMA(p,q)Yt∼ARMA(p,q)Y_t\sim ARMA(p,q)YtYtY_tνν\nuYtYtY_t したがって、 whereです。Yt=ϕ1Yt−1+⋯+ϕpYt−p+et−θ1et−1−⋯−θqet−qYt=ϕ1Yt−1+⋯+ϕpYt−p+et−θ1et−1−⋯−θqet−qY_t=\phi_1Y_{t-1}+\dots+\phi_pY_{t-p}+e_t-\theta_1e_{t-1}-\dots-\theta_q e_{t-q}et∼tνet∼tνe_t\sim t_\nu 私はそれの分布を見つける方法や、主にガウシアンエラーのケースのみをカバーしている本を見つける方法を知りません。 いくつかの参照も興味深いでしょう。

3
Rでの季節的ARIMAモデリング
私は、あなたが次のリンクでそれを見つけることができる2007年から2017年に商品のために毎月の価格データを持っている: https://drive.google.com/open?id=0BxRCOgKAL4itcUZlOExrUmVOanc 私は次のためにRの季節ARIMAモデルを使用して、それを予測する必要があります年。auto.arima関数を使用している場合は、ARIMA(0,1,1)ではなく、として最適なモデルが提案されますARIMA(p,d,q)(P,D,Q)12。の季節的な部分model(P,D,Q)がどういうわけか欠落しています。なぜこれが起こっているのか分かりません。私のデータは季節的ではありませんか、それとも私のコードに問題がありますか?また、モデルによって与えられる予測値は重要ではない次の月の間一定です。助けてください!これがコードです: data &lt;- read.delim("C:/Users/hp/Desktop/heckyl/forecasting model/Soybean_Prices.txt", header=F) View(data) summary(data) summary(data) ts.data = ts(data, frequency=12, start=c(2007,6)) ts.data plot(ts.data) dim(as.matrix(ts.data)) ################################################################################ # Training and Testing Dataset data.train = window(ts.data, start = c(2007,6), end = c(2013,12)) plot(data.train) dim(as.matrix(data.train)) data.test = window(ts.data, start = c(2014,1)) plot(data.test) dim(as.matrix(data.test)) ################################################################################ # Developing an SARIMA model …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.