タグ付けされた質問 「forecasting」

将来のイベントの予測。これは、[時系列]のコンテキストでは、[予測]の特殊なケースです。

2
ARIMA予測、季節性と傾向、奇妙な結果
ARIMAモデルを使用した予測に足を踏み入れているとき、季節性とドリフトに適合するARIMAに基づいて予測を改善する方法を理解しようとしています。 私のデータは次の時系列です(3年以上、明確な上昇傾向と目に見える季節性があり、ラグ12、24、36の自己相関ではサポートされていないようです)。 > bal2sum3years.ts Jan Feb Mar Apr May Jun Jul Aug 2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729 2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888 2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416 Sep Oct Nov Dec 2010 2232261 2394644 2468479 2816287 2011 2480940 …

2
Rで単純な指数平滑法をどのように使用しますか?
私はRの初心者です。R 予測の予測パッケージでsesを使用する方法を説明してもらえますか?初期期間の数と平滑化定数を選択したいと思います。 d <- c(3,4,41,10,9,86,56,20,18,36,24,59,82,51,31,29,13,7,26,19,20,103,141,145,24,99,40,51,72,58,94,78,11,15,17,53,44,34,12,15,32,14,15,26,75,110,56,43,19,17,33,26,40,42,18,24,69,18,18,25,86,106,104,35,43,12,4,20,16,8) 70期間ありますが、初期に40期間、サンプル外に30期間を使用したいと思います。 ses(d, h=30, level=c(80,95), fan=FALSE,initial=c("simple"), alpha=.1) それが正しいか?

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 



2
(0,1)によってバインドされたパーセンテージを予測するための時系列モデルとは何ですか?
これは浮かび上がるはずです--- 0と1の間で止まっているものの予測。 私のシリーズでは、自動回帰コンポーネントと平均回帰コンポーネントも疑っています。そのため、ARIMAのように解釈できるものが欲しいのですが、将来1000%まで飛ばしたくありません。 。 ロジスティック回帰のパラメーターとしてARIMAモデルを使用して、結果を0と1の間に制限しますか? または、ベータ回帰は(0,1)データに適していることをここで学びました。これを時系列にどのように適用できますか?これを簡単にフィッティングおよび予測できる優れたRパッケージまたはMatlab関数はありますか?

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
毎週の季節性の基礎となる、季節ごとに調整された月ごとの成長
副趣味として、私は(特にRを使用して)予測時系列を調査してきました。 私のデータでは、1日あたりの訪問数があり、毎日約4年前に遡ります。このデータには、いくつかの明確なパターンがあります。 月曜日から金曜日は訪問数が多く(月曜日と火曜日が最高)、土日曜日は大幅に減ります。 1年のうち特定の時期に落ちる(例:米国の祝日の訪問数が大幅に減る、夏の成長が鈍くなる) 毎年大幅な成長 このデータで次の年を予測でき、季節ごとに調整された月ごとの成長に使用できると便利です。月次ビューで私を失望させる主なものは次のとおりです。 特定の月は、他の月よりも月/火が多くなります(それは何年にもわたって一貫していません)。したがって、より多くの平日に発生する月は、それに応じて調整する必要があります。 週の番号付けシステムは年によって52〜53に変更されるため、週の調査も困難に思え、それをts処理できないようです。 私はその月の平日の平均を取ることを考えていますが、結果の単位は少し奇妙であり(平均平日の訪問数の増加)、それは有効なデータをドロップするでしょう。 この種類のデータは時系列で一般的であると思います(たとえば、オフィスビルでの電気使用量はこのようなものかもしれません)、特にRでそれをモデル化する方法について誰かがアドバイスを持っていますか? 私が使用しているデータは非常に簡単です、それは次のように始まります: [,1] 2008-10-05 17607 2008-10-06 36368 2008-10-07 40250 2008-10-08 39631 2008-10-09 40870 2008-10-10 35706 2008-10-11 18245 2008-10-12 23528 2008-10-13 48077 2008-10-14 48500 2008-10-15 49017 2008-10-16 50733 2008-10-17 46909 2008-10-18 22467 そして、現在に至るまでこのように続き、全体的な成長傾向、米国の休日の週あたりにいくらか落ち込み、夏の間は成長が全般的に鈍化しています。

1
予測モデルの応答変数が異なる場合に予測を組み合わせる方法は?
前書き 予測の組み合わせでは、人気のあるソリューションの1つは、いくつかの情報基準の適用に基づいています。モデルに対して推定された赤池基準を例にとると、からの差を計算でき、RP_j = e ^ {(AIC ^ *-AIC_j)/ 2}は次のように解釈できますモデルjの真の確率。重みは次のように定義されますA ICjあ私CjAIC_jjjjA ICjあ私CjAIC_jA IC∗= 分jA ICjあ私C∗=分jあ私CjAIC^* = \min_j{AIC_j}R Pj= e(A IC∗− A ICj)/ 2RPj=e(あ私C∗−あ私Cj)/2RP_j = e^{(AIC^*-AIC_j)/2}jjj wj= R PjΣjR Pjwj=RPjΣjRPjw_j = \frac{RP_j}{\sum_j RP_j} 問題 私が克服しようとしている問題は、モデルが異なるように変換された応答(内因性)変数で推定されることです。たとえば、一部のモデルは年間成長率に基づいており、別のモデルは四半期ごとの成長率に基づいています。したがって、抽出されたA ICjあ私CjAIC_j値は直接比較できません。 試したソリューション 重要なのはA ICあ私CAICの違いだけなので、応答変数の変換に不変なベースモデルのA ICあ私CAIC(たとえばlm(y~-1)、パラメーターなしでモデルを抽出しようとした)を使用して、jjj番目のモデルとベースモデルA ICあ私CAIC。ただし、ここでは弱点が残っているようです。違いは、応答変数の変換によって影響を受けます。 おわりに 「すべてのモデルを同じ応答変数で推定する」などのオプションは可能ですが、非常に時間がかかります。問題を解決する方法が他にない場合、苦痛な決定に行く前に、迅速な「解決策」を探したいと思います。

3
時系列の予測を行う方法は?
私は時系列データの分析にはあまり詳しくありません。しかし、私は対処すべき単純な予測タスクだと思います。 一般的な生成プロセスからの約5年分のデータがあります。毎年、非線形成分を持つ単調に増加する関数を表します。毎年40週間のサイクルで、毎週のカウントがあります。プロセスが開始され、関数はゼロから始まり、関数の前半ではかなり急速に増加し、後半では遅くなり、最後の5週間で平準化されます。このプロセスは、年を追うごとに一貫しており、年によってセグメント全体の変化率とボリュームに小さな違いがあります。 y1= { 0 、Nt 1、Nt 2、。。。Nt 39、Nt 40}y1={0,Nt1,Nt2,...Nt39,Nt40} y_{1}=\{0, N_{t1}, N_{t2}, ... N_{t39}, N_{t40}\} ⋮⋮ \vdots y5= { 0 、Nt 1、Nt2、。。。Nt39、Nt40}y5={0,Nt1,Nt2,...Nt39,Nt40} y_{5}=\{0, N_{t1}, N_{t2}, ... N_{t39}, N_{t40}\} ここで、Nt xNtxN_{tx}は時間xでのカウントに等しい。 目標は、txでN(またはより良いt0からtx、またはそのポイントへの勾配)を取り、t40でNを予測することです。たとえば、N_ {t10}が5000の場合、その年のN_ {t40}の期待値は何ですか。では、問題は、そのようなデータをどのようにモデル化するのでしょうか。簡単に要約して視覚化できます。しかし、予測を容易にし、エラーの測定値を組み込むモデルが欲しいのですが。NNNt xtxtxt 0t0t0t xtxtxNNNt 40t40t40Nt 10Nt10N_{t10}Nt 40Nt40N_{t40}

2
時系列回帰予測モデルで伝達関数を識別する方法は?
私は、他の予測子/入力変数と自己相関エラーの観点から、ドルの金額で結果変数の時系列回帰予測モデルを構築しようとしています。この種のモデルは動的回帰モデルとも呼ばれます。各予測子の伝達関数を特定する方法を学ぶ必要があります。そのための方法について、ぜひお聞かせください。

1
複数の店舗にわたる数千の製品の製品需要予測
私は現在、需要予測タスクに取り組んでおり、数千の店舗にわたる数万の製品に関するデータを使用しています。より具体的には、私は各店舗の製品ごとの数年分の毎日の売上データを持っています。私の目標は、各店舗の各アイテムの将来の売上を1日先に予測することです。その後2日先など これまでは、各製品とストアのペアを1つの時系列に分解し、Neal Wagnerの論文「現実のシステムで複数の時系列を予測するインテリジェントな手法」で行われたように、各時系列の予測を行うことを検討しました。つまり、特定の店舗での製品の売上の履歴情報のみを使用して、その店舗でのその製品の将来の売上を予測します。 ただし、私はKaggleを閲覧しており、CorporacionónFavorita Grocery Sales Forecastingのような競争では、すべての店舗とすべての製品の情報を使用して将来の売上を予測するという別のアプローチが提案されています。私が理解しているように、すべての店舗のすべての製品の履歴販売情報がトレーニングセットにダンプされ、そこからモデルが学習して将来の販売を予測します。これは、従来の時系列手法とは非常に異なりますが、明らかに、競争の結果に基づいて機能します。 後者の方法は、有望でより堅牢なようです。ただし、何億ものデータポイントを処理する必要があるという問題があります。 私のタスクにより適した方法はどれですか?同様の問題に取り組んだことがある人にとって、どの方法論をお勧めしますか?

2
時間遅延ニューラルネットワークとリカレントニューラルネットワークの違い
ニューラルネットワークを使用して財務時系列を予測したいと思います。私はIT出身で、ニューラルネットワークについてある程度の知識があり、次のことについて読んでいます。 TDNN RNN 私はそれらのRパッケージを探していましたが、RNNの1つだけを見つけました。これは、RNNであるelmanおよびjordan実装を持つRSNNSパッケージです。 では、リカレントニューラルネットワークは(財務)時系列で使用すると便利ですか?彼ら(以前に引用されたRNNのwikipediaリンクからの引用)以来: 各タイムステップで、入力は標準のフィードフォワード方式で伝播され、次に学習ルールが適用されます。固定されたバック接続により、コンテキストユニットは常に非表示のユニットの以前の値のコピーを維持します(学習ルールが適用される前に接続を介して伝播されるため)。したがって、ネットワークは一種の状態を維持でき、標準の多層パーセプトロンの能力を超えるシーケンス予測などのタスクを実行できます。 実際にはむだ時間ニューラルネットワークと同じではありませんか?そうでない場合、むだ時間ニューラルネットワークとの違いは何ですか?どちらも時系列での使用に適していますか、どちらが適していますか? よろしくお願いします!

4
オンラインの時系列予測を処理する方法は?
私は以下の問題を扱ってきました。私は一種のリアルタイムシステムを持っており、タイムフレームごとに現在の値を読み取り、時系列(1、12、2、3、5、9、1など)を作成します。オンラインで(新しい値が読み込まれるたびに)次の値を予測する方法(統計および機械学習)を知りたいのですが。RのARIMAとWekaのSMOregを試してみましたが、良い予測が得られましたが、新しい値が来るたびに計算をやり直さなければならないので、それらは少し遅いです。 PSメソッドが信頼区間を持っている場合も素晴らしいです。

3
2000の異なる製品の時系列予測の戦略?
まず第一に、私の質問は非常に広範であり、そのためにこの質問に答えるのが難しいかもしれないことを理解しています。 2000以上のさまざまな製品の予測/予測を行う必要がある「問題」にアプローチする方法について何かアドバイスはありますか?つまり、製品ごとに異なる予測/予測が必要です。私は週レベルで2年間の履歴データを持っています(つまり、製品ごとの週あたりの需要)。 これを短期間で行う必要があります。これを行うには約1週間かかるため、比較的優れた予測モデルをすばやく作成できる方法を探しています。各製品のモデルを作成し、そのパフォーマンスを1つずつ綿密に検査するのは、時間がかかりすぎます。 分散に基づいて製品をセグメント化することを考えたので、分散が低い製品の単純なモデルを使用できます。これは理想的ではないかもしれませんが、作成する必要のあるモデルの数を絞り込むための簡単な方法です。 この問題への取り組みについて、実際的なアドバイスをいただければ幸いです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.