タグ付けされた質問 「arima」

データの説明と予測の両方のために時系列モデリングで使用されるAutoRegressive統合移動平均モデルを指します。このモデルは、傾向を取り除き、いくつかのタイプの非定常性を処理するのに役立つ差分の用語を含めることにより、ARMAモデルを一般化します。

4
これは、自殺カウントデータの季節的影響をテストする適切な方法ですか?
私は、米国の州の自殺による死亡に関連する17年(1995年から2011年)の死亡証明書データを持っています。確認しましたが、使用した方法の明確な感覚や結果に対する自信が得られません。 そのため、データセット内の特定の月に自殺が多かれ少なかれ発生する可能性があるかどうかを判断できるかどうかを確認しました。私の分析はすべてRで行われます。 データに含まれる自殺者の総数は13,909人です。 自殺が最も少ない年を見ると、309/365日(85%)に発生します。自殺が最も多い年を見ると、それらは339/365日(93%)に発生しています。 したがって、毎年自殺のないかなりの日数があります。ただし、17年間すべてで集計すると、2月29日を含む1年の毎日に自殺があります(平均が38の場合は5人のみ)。 1年の各日に自殺者の数を単純に合計しても、明確な季節性を示すものではありません(私の目には)。 月ごとのレベルで集計すると、月あたりの平均自殺者の範囲は次のとおりです。 (m = 65、sd = 7.4、m = 72、sd = 11.1) 私の最初のアプローチは、すべての年の月ごとにデータセットを集計し、月ごとの自殺数に系統的な分散がないという帰無仮説の予想確率を計算した後、カイ二乗検定を行うことでした。日数を考慮して(そしてうるう年の2月を調整して)各月の確率を計算しました。 カイ2乗の結果は、月ごとに大きな変動がないことを示しています。 # So does the sample match expected values? chisq.test(monthDat$suicideCounts, p=monthlyProb) # Yes, X-squared = 12.7048, df = 11, p-value = 0.3131 下の画像は、1か月あたりの合計数を示しています。水平の赤い線は、それぞれ2月、30日月、31日月の期待値に配置されています。カイ2乗検定と一致して、予想カウントの95%信頼区間外にある月はありません。 時系列データの調査を開始するまで、私は終わったと思いました。多くの人が想像するstlように、statsパッケージの関数を使用したノンパラメトリック季節分解法から始めました。 時系列データを作成するには、集約された月次データから始めました。 suicideByMonthTs <- ts(suicideByMonth$monthlySuicideCount, start=c(1995, 1), end=c(2011, 12), frequency=12) …

2
ARMAを使用した非定常プロセスのモデリングの結果は?
非定常時系列のモデリングにはARIMAを使用する必要があることを理解しています。また、ARMAは定常時系列にのみ使用されるべきだと私が読んだことすべてがあります。 私が理解しようとしているのは、モデルを誤分類し、d = 0非定常の時系列を仮定したときに実際に何が起こるかです。例えば: controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44) 制御データは次のようになります。 [1] 0.0000000 0.1240838 -1.4544087 -3.1943094 -5.6205257 [6] -8.5636126 -10.1573548 -9.2822666 -10.0174493 -11.0105225 [11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414 [16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267 [21] -22.6155812 -21.9189036 -20.2064343 -18.2516852 -15.5822178 [26] …

3
ARIMAモデルの特殊なケースとして見られる一般的な予測モデルは何ですか?
今朝、私は不思議に目を覚ましました(これは昨夜はあまり眠れなかったためかもしれません)。 「に対して交差検証しますか? いくつかの(簡単な)ものを思いつきましたが、すぐにそれらがすべてARIMAモデルの特殊なケースであることに気付きました。だから私は今疑問に思っています、そしてこれは実際の質問です、Box-Jenkninsのアプローチにはすでにどの予測モデルが組み込まれていますか? このように言えば: 平均= ARIMA(0,0,0)と定数 素朴= ARIMA(0,1,0) ドリフト= ARIMA(0,1,0)と定数 単純指数平滑法= ARIMA(0,1,1) ホルトの指数平滑化= ARIMA(0,2,2) 減衰ホルト= ARIMA(0,1,2) 加法Holt-Winters:SARIMA(0,1、m + 1)(0,1,0)m 前のリストに他に何を追加できますか?移動平均または最小二乗回帰を「ARIMA方式」で行う方法はありますか?また、他の単純なモデル(たとえば、ARIMA(0,0,1)、ARIMA(1,0,0)、ARIMA(1,1,1)、ARIMA(1,0,1)など)はどのように変換されますか? 少なくとも初心者には、ARIMAモデルができないことには興味がないことに注意してください。今は、彼らができることだけに集中したい。 ARIMAモデルの各「ビルディングブロック」が何をするかを理解すれば、上記のすべての質問に答えられるはずですが、何らかの理由でそれを理解するのが困難です。そこで、「リバースエンジニアリング」のようなアプローチを試してみました。

3
RのARIMAモデルのパラメーターのp値を計算する方法は?
Rで時系列調査を行うarima と、適合モデルの係数値とその標準誤差のみが提供されることがわかりました。ただし、係数のp値も取得する必要があります。 coefの重要性を提供する機能は見つかりませんでした。 したがって、私は自分で計算したいのですが、係数のtまたはchisq分布の自由度はわかりません。だから私の質問は、Rのフィットされたアリマモデルの係数のp値を取得する方法ですか?

3
Auto.arima with daily data:季節性/周期性をキャプチャする方法?
毎日の時系列にARIMAモデルを当てはめています。データは2010年2月1日から2011年7月30日まで毎日収集され、新聞販売に関するものです。週ごとの販売パターンを見つけることができるので(販売されたコピーの1日の平均量は月曜日から金曜日まで通常同じで、土曜日と日曜日に増加します)、この「季節」を捉えようとしています。売上データ「データ」を指定して、次のように時系列を作成します。 salests<-ts(data,start=c(2010,1),frequency=365) そして、auto.arima(。)関数を使用して、AIC基準を介して最適なARIMAモデルを選択します。結果は常に非季節ARIMAモデルですが、例として次の構文でいくつかのSARIMAモデルを試してみると: sarima1<-arima(salests, order = c(2,1,2), seasonal = list(order = c(1, 0, 1), period = 7)) より良い結果を得ることができます。tsコマンド/ arimaの仕様に何か問題はありますか?毎週のパターンは非常に強いので、キャプチャするのにそれほど多くの困難はないと思います。任意のヘルプは非常に便利です。ありがとう、ジュリア・デッピエーリ 更新: すでにいくつかの引数を変更しました。より正確には、プロシージャはを設定するとARIMA(4,1,3)を最良のモデルとして選択しますがD=7、AICおよびその他の適合指数および予測もまったく改善されません。季節性と周期性の混同によるいくつかの間違いがあると思います。 Auto.arima呼び出しが使用され、取得された出力: modArima<-auto.arima(salests,D=7,max.P = 5, max.Q = 5) ARIMA(2,1,2) with drift : 1e+20 ARIMA(0,1,0) with drift : 5265.543 ARIMA(1,1,0) with drift : 5182.772 ARIMA(0,1,1) with drift : 1e+20 ARIMA(2,1,0) with …

1
Rのauto.arima()でxreg引数を設定する方法は?[閉まっている]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新して、相互検証のトピックになるようにします。 6年前に閉鎖されました。 私は、顧客の訪問データ(毎日)を測定する1つの時系列を持つ小さなプロジェクトに取り組んでいます。私の共変量は、Dayデータ収集の最初の日から経過した日数を測定する連続変数と、その日がクリスマスであるか、曜日であるかなどのダミー変数です。 データの一部は次のようになります。 Date Customer_Visit Weekday Christmas Day 11/28/11 2535 2 0 1 11/29/11 3292 3 0 2 11/30/11 4103 4 0 3 12/1/11 4541 5 0 4 12/2/11 6342 6 0 5 12/3/11 7205 7 0 6 12/4/11 3872 1 0 7 12/5/11 3270 2 0 …

1
Stepwise AIC-このトピックをめぐる論争は存在しますか?
このサイトで、p値ベース、AIC、BICなど、あらゆる種類の基準を使用した変数の段階的な選択の使用に信じられないほど多くの投稿を読みました。 これらの手順が一般に、変数の選択に非常に悪い理由を理解しています。ここでの gungのおそらく有名な投稿は、その理由を明確に示しています。最終的には、仮説を立てるのに使用したのと同じデータセットで仮説を検証しています。これは単なるデータのedです。さらに、p値は共線性や外れ値などの量の影響を受け、結果が大きく歪むなど。 しかし、私は最近かなり時系列の予測を研究しており、特にARIMAモデルの最適な順序を見つけるための段階的選択の使用について彼がここで言及している Hyndmanの評判の高い教科書に出会いました。実際、forecastR のパッケージでは、auto.arimaデフォルトで知られているよく知られているアルゴリズムは、(p値ではなくAICを使用して)ステップワイズ選択を使用します。彼はまた、このウェブサイト上の複数の投稿とうまく調和するp値ベースの機能選択を批判しています。 最終的に、目標が予測/予測の優れたモデルを開発することである場合、最後に何らかの方法で常に相互検証する必要があります。ただし、p値以外の評価指標の手順自体に関しては、これは多少不一致です。 この文脈での段階的なAICの使用について、しかしこの文脈からも一般的には誰も意見がありますか?私は、段階的な選択はどれも貧弱だと信じていると教えられてきましたが、正直なところ、auto.arima(stepwise = TRUE)サンプル結果からより良い結果を得ていますauto.arima(stepwise = FALSE)が、これは単なる偶然かもしれません。

4
移動平均モデルの誤差項
これは、Box-Jenkins MAモデルに関する基本的な質問です。私が理解しているように、MAモデルは基本的に以前のエラー項に対する時系列値線形回帰です。つまり、観測値は最初に以前の値に対して回帰され、次に1つ以上の値がMAのエラー項として使用されますモデル。YYYet,...,et−net,...,et−ne_t,..., e_{t-n}YYYYt−1,...,Yt−nYt−1,...,Yt−nY_{t-1}, ..., Y_{t-n}Y−Y^Y−Y^Y - \hat{Y} しかし、ARIMA(0、0、2)モデルで誤差項はどのように計算されますか?MAモデルが自己回帰部分なしで使用され、したがって推定値がない場合、どのようにしてエラー項を取得できますか?

2
Rで異常値を検出して予測を行う方法 -時系列分析の手順と方法
私は毎月の時系列データを持っていますが、外れ値を検出して予測を行いたいです。 これは私のデータセットのサンプルです。 Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2006 7.55 7.63 7.62 7.50 7.47 7.53 7.55 7.47 7.65 7.72 7.78 7.81 2007 7.71 7.67 7.85 7.82 7.91 7.91 8.00 7.82 7.90 7.93 7.99 7.93 2008 8.46 8.48 9.03 9.43 11.58 12.19 12.23 11.98 12.26 …

2
時系列予測における確率的対決定論的傾向/季節性
時系列予測のバックグラウンドは中程度です。私はいくつかの予測の本を見ましたが、それらのいずれにも対処された以下の質問はありません。 2つの質問があります。 特定の時系列に以下が含まれている場合、どのように客観的に(統計テストを介して)決定しますか? 確率的季節性または決定論的季節性 確率的傾向または決定論的傾向 時系列に明確な確率的要素があるときに、時系列を決定論的な傾向/季節性としてモデル化するとどうなりますか? これらの質問に対処するための助けをいただければ幸いです。 傾向のデータ例: 7,657 5,451 10,883 9,554 9,519 10,047 10,663 10,864 11,447 12,710 15,169 16,205 14,507 15,400 16,800 19,000 20,198 18,573 19,375 21,032 23,250 25,219 28,549 29,759 28,262 28,506 33,885 34,776 35,347 34,628 33,043 30,214 31,013 31,496 34,115 33,433 34,198 35,863 37,789 34,561 36,434 34,371 …

1
ARIMA順序の定義に関する問題
これは長い投稿なので、あなたが私と一緒に耐えられることを願っています、そして私が間違っているところで私を修正してください。 私の目標は、3週間または4週間の履歴データに基づいて毎日の予測を作成することです。 データは、変圧器ラインの1つのローカル負荷の15分のデータです。季節のARIMAプロセスのモデル次数を見つけるのに問題があります。電力需要の時系列を考慮します。 元の時系列http://i.share.pho.to/80d86574_l.png 最初の3週間をサブセットとして取得し、差を付けると、次のACF / PACFプロットが計算されます。 サブセットhttp://i.share.pho.to/5c165aef_l.png 最初の違いhttp://i.share.pho.to/b7300cc2_l.png 季節的な違いと最初の違いhttp://i.share.pho.to/570c5397_l.png これは、シリーズが少し静止しているように見えます。しかし、季節性は週単位でもあります(季節差の週と2次の差[こちら] http://share.pho.to/3owoqをご覧ください。) したがって、モデルは次の形を取ると結論付けましょう: A R IMA (p 、1 、q)(P、1 、Q )96AR私MA(p、1、q)(P、1、Q)96 ARIMA(p,1,q)(P,1,Q)_{96} 最後の図では、ラグ96での明確なスパイクは、季節的なMA(1)コンポーネントを示しています(PACFにも明確なスパイクがあるので、AR(1)も同様である可能性があります)。ラグ1:4のスパイクは、PACFの指数関数的な減衰に対応するMA(4)コンポーネントを示しています。したがって、手動で選択される初期モデルは次のようになります withA R IMA (0 、1 、4 )(0 、1 、1 )96AR私MA(0、1、4)(0、1、1)96 ARIMA(0,1,4)(0,1,1)_{96} Series: x ARIMA(0,1,4)(0,1,1)[96] Coefficients: ma1 ma2 ma3 ma4 sma1 -0.2187 -0.2233 -0.0996 -0.0983 -0.9796 s.e. 0.0231 …

3
Auto.arimaとautoboxは違いますか?
このサイト上の記事を読んでから私はRのあることがわかっている機能 auto.arima(でforecast パッケージが)。また、私はことを知ってIrishStat、このサイトのメンバーは、商用パッケージ建てでAutoBoxを 1980年代初頭に。これらの2つのパッケージは現在存在し、特定のデータセットに対してarimaモデルを自動的に選択するため、これらのパッケージはどのように異なるのですか?同じデータセットに対して異なるモデルを作成する可能性はありますか?

2
推論にARIMAエラーを使用した回帰を使用する場合の定常性の要件は何ですか?
ARIMAエラーを伴う回帰(動的回帰)を推論に使用する場合の定常性の要件は何ですか? 具体的には、非定常連続結果変数、非定常連続予測変数およびダミー変数処理シリーズます。治療が、変化がゼロから2標準誤差以上離れた結果​​変数の変化と相関していたかどうかを知りたい。yyyバツaバツax_aバツbバツbx_b ARIMAエラーモデリングを使用して回帰を実行する前に、これらのシリーズを区別する必要があるかどうかはわかりません。別の質問への回答で、IrishStatは、while the original series exhibit non-stationarity this does not necessarily imply that differencing is needed in a causal model.それを追加すること を続けていると述べていunwarranted usage [of differencing] can create statistical/econometric nonsenseます。 SASユーザーガイドを示唆している、それはそう長く残差が非定常されているような差分せずに非定常シリーズへのARIMAエラーのフィット回帰モデルに罰金であること: 定常性の要件はノイズシリーズに適用されることに注意してください。入力変数がない場合、応答シリーズ(差分の後、平均項を引いたもの)とノイズシリーズは同じです。ただし、入力がある場合、入力の効果が除去された後のノイズ系列は残差です。 入力系列が静止している必要はありません。入力が非定常の場合、ノイズプロセスが定常的である場合でも、応答シリーズは非定常になります。 非定常入力シリーズを使用する場合、まずエラーのARMAモデルを使用せずに入力変数を近似し、次にノイズ部分のARMAモデルを特定する前に残差の定常性を考慮することができます。 一方、Rob HyndmanとGeorge Athanasopoulosは次のように主張しています。 ARMAエラーを含む回帰を推定する際の重要な考慮事項は、モデル内のすべての変数が最初に定常でなければならないことです。そのため、最初にytとすべての予測子が静止しているように見えることを確認する必要があります。これらのいずれかが非定常であるときにモデルを推定すると、推定係数が不正確になる可能性があります。(x1 、t、… 、xk 、t)(バツ1、t、…、バツk、t)(x_{1,t},\dots,x_{k,t}) ytyty_t これらのアドバイスは相互に排他的ですか?適用されたアナリストはどのように進めますか?

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
ARIMAモデルの正則化
LASSO、リッジ、および線形回帰モデルの正則化のElastic-Netタイプを認識しています。 質問: この(または同様の)罰則付き推定をARIMAモデリングに適用できますか(空でないMAパーツを使用)。 pmaxpmaxp_{max}qmaxqmaxq_{max}p⩽pmaxp⩽pmaxp \leqslant p_{max}q⩽qmaxq⩽qmaxq \leqslant q_{max} 私のさらなる質問は次のとおりです。 (、)までのすべての項を含めることができますが、係数のサイズにペナルティを科せますか(潜在的にゼロまで)。それは理にかなっていますか?pmaxpmaxp_{max}qmaxqmaxq_{max} もしそうなら、それはRまたは他のソフトウェアに実装されていますか?そうでない場合、問題は何でしたか? やや関連する投稿はこちらにあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.