タグ付けされた質問 「arima」

データの説明と予測の両方のために時系列モデリングで使用されるAutoRegressive統合移動平均モデルを指します。このモデルは、傾向を取り除き、いくつかのタイプの非定常性を処理するのに役立つ差分の用語を含めることにより、ARMAモデルを一般化します。

3
例:バイナリ結果にglmnetを使用したLASSO回帰
私は興味のある結果が二分されglmnetているLASSO回帰の使用に手を出し始めています。以下に小さな模擬データフレームを作成しました。 age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
移動平均プロセスの実際の例
あなたは、時系列のいくつかの実際の例を与えることができ、注文の移動平均処理のための、すなわち Y T = q個のΣ I = 1 θ I ε トン- 私は + εのトンを、ε T〜N(0 、σ 2) いくつか持っている先験的に良いモデルであることの理由を?少なくとも私にとっては、自己回帰プロセスは直感的に非常に簡単に理解できるように見えますが、MAプロセスは一見自然に見えません。私はそうではないことに注意してくださいqqqyt= ∑i = 1qθ私εt − i+ εt、 ここで εt〜N(0 、σ2)yt=∑私=1qθ私εt−私+εt、 どこ εt〜N(0、σ2) y_t = \sum_{i=1}^q \theta_i \varepsilon_{t-i} + \varepsilon_t, \text{ where } \varepsilon_t \sim \mathcal{N}(0, \sigma^2) ここで理論的な結果(ウォルドの定理や可逆性など)に興味があります。 私が探しています何の例として、あなたは毎日株式リターンがあると。そうすると、平均的な週次株価収益率は、純粋に統計的な成果物としてMA(4)構造になります。rt〜IID (0 、σ2)rt〜IID(0、σ2)r_t \sim \text{IID}(0, …

5
時系列モデリングのための状態空間モデルとカルマンフィルターの欠点は何ですか?
状態空間モデルとKFのすべての優れた特性を考えると、状態空間モデリングとカルマンフィルター(またはEKF、UKF、粒子フィルター)を推定に使用することの欠点は何でしょうか?ARIMA、VAR、またはアドホック/ヒューリスティック手法などの従来の方法論について考えてみましょう。 調整するのは難しいですか?彼らは複雑で、モデルの構造の変化が予測にどのように影響するかを見るのは難しいですか? または、別の言い方をすれば、状態空間モデルに対する従来のARIMA、VARの利点は何ですか? 状態空間モデルの利点のみを考えることができます。 いくつかの静的モデルの構造的な破損、シフト、時変パラメーターを簡単に処理します。これらのパラメーターを状態空間モデルの動的状態にするだけで、モデルはパラメーターのシフトに合わせて自動的に調整されます。 欠損データを非常に自然に処理します。KFの移行ステップを実行し、更新ステップは実行しません。 状態空間モデル自体のオンザフライパラメーター(ノイズと遷移/観測行列の共分散)を変更できるため、現在の観測が他とは少し異なるソースからのものである場合は、実行せずに簡単に推定に組み込むことができます何か特別なこと; 上記のプロパティを使用すると、不規則な間隔のデータを簡単に処理できます。観測間の間隔に従って毎回モデルを変更するか、定期的な間隔を使用して観測のない間隔を欠損データとして扱います。 同じモデル内の異なるソースからのデータを同時に使用して、1つの基本量を推定できます。 いくつかの解釈不可能な動的コンポーネントからモデルを構築し、それらを推定することができます。 どのARIMAモデルも状態空間形式で表現できますが、単純な状態空間モデルのみがARIMA形式で正確に表現できます。

2
MA(q)時系列モデルが「移動平均」と呼ばれるのはなぜですか?
時系列に関連して「移動平均」を読むと、、またはおそらく重み付きような平均。(これらは実際にはAR(3)モデルですが、これらは私の脳のジャンプ先です。)なぜMA(q)モデルはエラー用語、つまり「革新」の式なのですか?何ん移動平均としなければなりませんか?明らかな直観が欠けているように感じます。 0.5xt−1+0.3xt−2+0.2xt−3{ϵ}(xt − 1+ xt − 2+ xt − 3)3(バツt−1+バツt−2+バツt−3)3\frac{(x_{t-1} + x_{t-2} + x_{t-3})}30.5 xt − 1+ 0.3 xt − 2+ 0.2 xt − 30.5バツt−1+0.3バツt−2+0.2バツt−30.5x_{t-1} + 0.3x_{t-2} + 0.2x_{t-3}{ ϵ }{ϵ}\{\epsilon\}

4
GARCHとARMAの違いは何ですか?
私は混乱しています。ARMAとGARCHのプロセスの違いを理解していません。 これが(G)ARCH(p、q)プロセスです σ2t= α0+ ∑i = 1qα私r2t − iA R CH+ ∑i = 1pβ私σ2t − iG A R CHσt2=α0+∑i=1qαirt−i2⏟ARCH+∑i=1pβiσt−i2⏟GARCH\sigma_t^2 = \underbrace{ \underbrace{ \alpha_0 + \sum_{i=1}^q \alpha_ir_{t-i}^2} _{ARCH} + \sum_{i=1}^p\beta_i\sigma_{t-i}^2} _{GARCH} そして、ここにARMA(p 、qp,qp, q)があります: バツt= c + εt+ ∑i = 1pφ私バツt − i+ ∑i = 1qθ私εt − i。Xt=c+εt+∑i=1pφiXt−i+∑i=1qθiεt−i. X_t = c …
42 arima  garch  finance 

2
MEANがARIMAを上回ることは珍しいですか?
最近、さまざまな予測方法(MEAN、RWF、ETS、ARIMA、MLP)を適用しましたが、MEANが驚くほどうまくいったことがわかりました。(MEAN:将来の予測はすべて、観測値の算術平均に等しいと予測されます。)MEANは、使用した3つのシリーズでARIMAよりも優れていました。 私が知りたいのは、これが異常かどうかです。これは、私が使用している時系列が奇妙だということですか?または、これは何か間違ったことを設定したことを示していますか?

1
Rのtsoutliersパッケージを使用した時系列(LS / AO / TC)の外れ値の検出。方程式形式で外れ値を表す方法
コメント: まず、1993年にオープンソースソフトウェア Journal of the American Statistical Associationに発表されたChenとLiuの時系列外れ値検出を実装する新しいtsoutliersパッケージの作成者に感謝します。RRR このパッケージは、時系列データで5種類の外れ値を繰り返し検出します。 加算的外れ値(AO) イノベーションの外れ値(IO) レベルシフト(LS) 一時的な変更(TC) 季節的レベルシフト(SLS) さらに素晴らしいのは、このパッケージが予測パッケージからauto.arimaを実装しているため、異常値の検出がシームレスに行われることです。また、このパッケージは、時系列データをよりよく理解するためのすてきなプロットを生成します。 以下は私の質問です。 このパッケージを使用していくつかの例を実行してみましたが、うまくいきました。加算的な外れ値とレベルシフトは直感的です。ただし、一時的な変更の外れ値とイノベーションの外れ値の処理に関して、理解できない2つの質問がありました。 一時的な変更の外れ値の例: 次の例を考えてみましょう。 library(tsoutliers) library(expsmooth) library(fma) outlier.chicken <- tsoutliers::tso(chicken,types = c("AO","LS","TC"),maxit.iloop=10) outlier.chicken plot(outlier.chicken) プログラムは、次の場所でレベルシフトと一時的な変更を正しく検出します。 Outliers: type ind time coefhat tstat 1 LS 12 1935 37.14 3.153 2 TC 20 1943 36.38 3.350 以下はプロットと私の質問です。 方程式の形式で一時的な変更を書き込む方法は?(レベルシフトは、1935 …

3
RでARIMAXモデルを適合させる方法は?
毎時測定の4つの異なる時系列があります。 家の中の熱消費 家の外の温度 日射 風速 家の中の熱消費量を予測できるようにしたい。年間および日単位の両方で、明確な季節的傾向があります。異なるシリーズの間には明確な相関関係があるため、ARIMAXモデルを使用してそれらを近似します。これは、パッケージTSAの関数arimaxを使用して、Rで実行できます。 私はこの関数に関するドキュメントを読み、伝達関数を読み込もうとしましたが、これまでのところ、私のコードは: regParams = ts.union(ts(dayy)) transferParams = ts.union(ts(temp)) model10 = arimax(heat,order=c(2,1,1),seasonal=list(order=c(0,1,1),period=24),xreg=regParams,xtransf=transferParams,transfer=list(c(1,1)) pred10 = predict(model10, newxreg=regParams) 私に与えます: ここで、黒い線は実際の測定データであり、緑の線は私の比較モデルです。それは良いモデルではないだけでなく、明らかに何かが間違っています。 ARIMAXモデルと伝達関数に関する知識が限られていることを認めます。関数arimax()では(理解している限り)、xtransfは(伝達関数を使用して)メインの時系列を予測するために使用する外因性の時系列です。しかし、実際にはxregとxtransfの違いは何ですか? より一般的には、私が間違ったことは何ですか?lm(heat〜temp radi wind * time)から得られるものよりも良いフィット感を得ることができるようにしたいと思います。 編集: コメントのいくつかに基づいて、転送を削除し、代わりにxregを追加しました。 regParams = ts.union(ts(dayy), ts(temp), ts(time)) model10 = arimax(heat,order=c(2,1,1),seasonal=list(order=c(0,1,1),period=24),xreg=regParams) ここで、dayyは「年間通算日」であり、timeはその日の時間です。温度は再び外の温度です。これにより、次の結果が得られます。 それは良いですが、私が期待していたものとはほぼ異なります。

7
時系列分析のポイントは何ですか?
時系列分析のポイントは何ですか? 回帰や機械学習など、明らかなユースケースを持つ統計方法は他にもたくさんあります。回帰は2つの変数間の関係に関する情報を提供しますが、機械学習は予測に最適です。 しかしその間、私は時系列分析が何のために良いかわかりません。確かに、ARIMAモデルを当てはめて予測に使用できますが、その予測の信頼区間が大きくなるとしたら何が良いでしょうか?世界史上最もデータ主導型の業界であるにもかかわらず、誰も株式市場を予測できない理由があります。 同様に、プロセスをさらに理解するためにどのように使用しますか?確かに、ACFをプロットして、「あぁ!依存関係があります!」と言うことができますが、その後はどうでしょうか。ポイントは何ですか?もちろん、依存関係があります。そのため、そもそも時系列分析を行っています。あなたはすでに依存があることを知っていました。しかし、あなたは何のためにそれを使用するつもりですか?

1
Rの秒/分間隔データの「頻度」値
予測にR(3.1.1)とARIMAモデルを使用しています。私が次のような時系列データを使用している場合、ts()関数で割り当てられる「頻度」パラメータはどうあるべきかを知りたい 分単位で区切られ、180日間に分散(1440分/日) 秒で区切られ、180日間(86,400秒/日)に広がります。 定義を正しく思い出せば、Rのtsでの「頻度」は、「季節」ごとの観測数です。 質問パート1: 私の場合の「季節」とは何ですか? 季節が「日」の場合、分数の「頻度」は1440、秒数の86,400ですか。 質問パート2: 「頻度」は、達成/予測しようとしているものにも依存しますか? たとえば、私の場合、非常に短期的な予測が必要です。毎回10分先に進みます。 季節を1日ではなく1時間と見なすことは可能でしょうか? その場合、分数の頻度は60、秒の頻度は3600ですか? たとえば、分データに頻度= 60を使用しようとしましたが、頻度= 1440と比較してより良い結果が得られました(使用されfourierているリンクはHyndmanによる下記のリンクを参照してください) http://robjhyndman.com/hyndsight/forecasting-weekly-data/ (予測は、予測精度の測定にMAPEを使用して行われました) 結果が完全に任意であり、頻度を変更できない場合。私のデータでfreq = 60を使用することの実際の解釈は何でしょうか? また、私のデータには1時間ごとおよび2時間ごとの季節性が含まれていることに言及する価値があると思います(生データと自己相関関数を観察することにより)

1
自由度は非整数の数値にできますか?
GAMを使用すると、残留DFは(コードの最終行)になります。どういう意味ですか?GAMの例を超えて、一般に、自由度の数を整数以外の数にすることはできますか?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

2
ARIMAの値p、d、qは何ですか?
arimaR の関数では、どういうorder(1, 0, 12)意味ですか?割り当てることができる値どのようなものがありp、d、q、およびそれらの値を見つけるためのプロセスは何ですか?
27 r  time-series  arima 

1
SARIMAXを直感的に理解する方法
電気負荷の予測に関する論文を理解しようとしていますが、内部の概念、特にSARIMAXモデルに苦労しています。このモデルは、負荷を予測するために使用され、理解できない多くの統計概念を使用します(私はコンピューターサイエンスの学部生です-統計の中で私を素人と見なすことができます)。私はそれがどのように機能するかを完全に理解する必要はありませんが、少なくとも直観的に何が起こっているのかを理解したいと思います。 私は、SARIMAXを小さなピースに分割し、これらの各ピースを個別に理解し、それらをまとめようとしています。助けてくれませんか?ここに私がこれまでに持っているものがあります。 私はARとMAで始めました。 AR:自己回帰。私は回帰とは何かを学びましたが、私の理解から、単に質問に答えます:値/ポイントのセットが与えられた場合、これらの値を説明するモデルを見つけるにはどうすればよいですか?そのため、たとえば、これらすべての点を説明できる線を見つけようとする線形回帰があります。自己回帰は、以前の値を使用して値を説明しようとする回帰です。 MA:移動平均。私は実際ここでかなり迷っています。移動平均とは何かを知っていますが、移動平均モデルは「通常の」移動平均とは何の関係もないようです。モデルの式はARにぎこちなく似ているようで、インターネットで見つけた概念を理解できないようです。MAの目的は何ですか?MAとARの違いは何ですか? これでARMAができました。私は、その後から来統合限り私は理解しているように、単純に増加または減少のいずれか、ARMAモデルは傾向を持つことができるようにするという目的を果たします。(これは、ARIMAが非静止を許可するということと同等ですか?) 季節性からSが来ると、ARIMAに周期性が追加されます。これは、例えば、負荷予測の場合、基本的に毎日午後6時に負荷が非常に似ていると言います。 最後に、外生変数からのXは、基本的に天気予報などの外部変数をモデルで考慮することを可能にします。 ようやくSARIMAXができました!私の説明は大丈夫ですか?これらの説明は厳密に正確である必要はないことを認識してください。誰かがMAが直感的に行うことを説明できますか?

4
ARIMAモデルをあてはめる前に時系列をログ変換するタイミング
以前は予測プロを使用して単変量時系列を予測していましたが、ワークフローをRに切り替えています.Rの予測パッケージには多くの便利な機能が含まれていますが、自動化を実行する前に行わないデータ変換が1つあります.arima()。いくつかのケースでは、予測プロは予測を行う前に変換データを記録することを決定しますが、その理由はまだわかりません。 私の質問は次のとおりです:ARIMAメソッドを試す前に、時系列をいつログ変換する必要がありますか? /編集:回答を読んだ後、次のようなものを使用します。xは私の時系列です。 library(lmtest) if ((gqtest(x~1)$p.value < 0.10) { x<-log(x) } これは理にかなっていますか?

5
ある種のARIMAの説明を求める
これは見つけるのは難しいかもしれないが、私が読みたいARIMA例をよく説明していること 最小限の数学を使用します モデルを構築するだけでなく、そのモデルを使用して特定のケースを予測することまで議論を広げます グラフィックスと数値結果を使用して、予測値と実際の値の適合を特徴付けます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.