タグ付けされた質問 「exponential-smoothing」

3
例:バイナリ結果にglmnetを使用したLASSO回帰
私は興味のある結果が二分されglmnetているLASSO回帰の使用に手を出し始めています。以下に小さな模擬データフレームを作成しました。 age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
ETS()関数、履歴データと一致しない予測を回避する方法
毎月の予測計算を自動化するために、Rのアルゴリズムに取り組んでいます。特に、予測パッケージのets()関数を使用して予測を計算しています。それは非常にうまく機能しています。 残念ながら、特定の時系列について、私が得る結果は奇妙です。 私が使用しているコードを以下で見つけてください: train_ts<- ts(values, frequency=12) fit2<-ets(train_ts, model="ZZZ", damped=TRUE, alpha=NULL, beta=NULL, gamma=NULL, phi=NULL, additive.only=FALSE, lambda=TRUE, lower=c(0.0001,0.0001,0.0001,0.8),upper=c(0.9999,0.9999,0.9999,0.98), opt.crit=c("lik","amse","mse","sigma","mae"), nmse=3, bounds=c("both","usual","admissible"), ic=c("aicc","aic","bic"), restrict=TRUE) ets <- forecast(fit2,h=forecasthorizon,method ='ets') 以下の関連する履歴データセットを見つけてください: values <- c(27, 27, 7, 24, 39, 40, 24, 45, 36, 37, 31, 47, 16, 24, 6, 21, 35, 36, 21, 40, 32, 33, …

3
アンサンブル時系列モデル
時系列予測を自動化する必要がありますが、それらの系列の機能(季節性、傾向、ノイズなど)を事前に知りません。 私の目的は、各シリーズに最適なモデルを取得することではなく、かなり悪いモデルを回避することです。言い換えれば、小さなエラーを毎回取得することは問題ではありませんが、大きなエラーを時々取得することは問題です。 異なる手法で計算されたモデルを組み合わせることで実現できると思いました。 つまり、ARIMAは特定のシリーズに最適なアプローチですが、別のシリーズには最適でない場合があります。指数平滑法についても同様です。 ただし、各手法の1つのモデルを組み合わせると、1つのモデルがそれほど良くなくても、もう1つのモデルが推定値を実際の値に近づけます。 ARIMAが長期の正常に動作するシリーズに適していることはよく知られていますが、指数平滑法は短期のノイズの多いシリーズで際立ちます。 私のアイデアは、より堅牢な予測を得るために、両方の手法から生成されたモデルを組み合わせることです、それは理にかなっていますか? これらのモデルを組み合わせるには多くの方法があるかもしれません。 これが良いアプローチである場合、それらをどのように組み合わせる必要がありますか? 予測の単純な平均はオプションですが、モデルの適切な尺度に従って平均に重みを付けると、より良い予測が得られる可能性があります。 モデルを組み合わせるときの分散の扱いは何ですか?

1
指数平滑法とARIMAを使用する場合
私は最近、毎月の予測に取り組み、Rob Hyndmanの本を読みながら、予測の知識を更新していますが、私が苦労しているのは、指数平滑化モデルとARIMAモデルのどちらを使用するかです。ある方法論と別の方法論のどちらを使用するべきかという経験則はありますか? また、AICを使用して2つを比較することはできないので、RMSE、MAEなどを使用する必要がありますか? 現在、それぞれをいくつか作成してエラー測定値を比較していますが、より良いアプローチがあるかどうかはわかりません。

3
Holt-WintersまたはARIMAを使用しますか?
私の質問は、Holt-WintersとARIMAの概念的な違いについてです。 私が理解している限りでは、Holt-WintersはARIMAの特殊なケースです。しかし、あるアルゴリズムが他のアルゴリズムよりも優先されるのはいつですか?おそらくHolt-Wintersはインクリメンタルであるため、インライン(高速)アルゴリズムとして機能しますか? ここでいくつかの洞察を楽しみにしています。

4
ニューラルネットワーク、auto.arimaおよびetsを使用したR時系列予測
ニューラルネットワークを使用して時系列を予測することについて少し聞いたことがあります。 比較するにはどうすればよいですか?auto.arima(x)、ets(x)、またはnnetar(x)の時系列(日次小売データ)を予測する方法はどちらが優れていますか。 auto.arimaとetsをAICまたはBICで比較できます。しかし、どうすればニューラルネットワークと比較できますか? 例えば: > dput(x) c(1774, 1706, 1288, 1276, 2350, 1821, 1712, 1654, 1680, 1451, 1275, 2140, 1747, 1749, 1770, 1797, 1485, 1299, 2330, 1822, 1627, 1847, 1797, 1452, 1328, 2363, 1998, 1864, 2088, 2084, 594, 884, 1968, 1858, 1640, 1823, 1938, 1490, 1312, 2312, 1937, 1617, 1643, 1468, …

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
指数加重平均の標準偏差
指数加重平均を計算する簡単な関数をPythonで記述しました。 def test(): x = [1,2,3,4,5] alpha = 0.98 s_old = x[0] for i in range(1, len(x)): s = alpha * x[i] + (1- alpha) * s_old s_old = s return s ただし、対応するSDを計算するにはどうすればよいですか?

3
指数移動平均を移動ウィンドウに調整することはどういう意味ですか?
指数移動平均のアルファパラメータは、平均が時系列に適用される平滑化を定義します。同様に、移動ウィンドウ平均のウィンドウサイズも平滑化を定義します。 平滑化が特定のサイズの移動ウィンドウ平均の平滑化とほぼ同じになるようにアルファパラメータを調整する方法はありますか?(明らかに、同じ結果を探しているわけではなく、オフセットは問題ありません)。それで、結果の時系列が3か月の移動ウィンドウによって提供される結果にできるだけ近い形になるようにアルファを調整すると言いますか? 編集:コンテキスト:異なる深さを抽象的に表す降雨データから、土壌水分の複数のプロキシを生成しようとしています(長期的な降雨平均に関連していると想定しています)。移動ウィンドウを使用すると、たとえば過去3日間、3か月、または1年間の総降水量を計算できます。これは、それぞれ上部の数センチメートルの土壌、上部のメーター、および拡張した土壌の柱に対応します。ただし、移動ウィンドウには過去のデータが必要です。これは常に利用できるとは限りません(たとえば、シリーズの開始時)。代わりに指数平均を使用する場合、各平均(前のタイムステップからの平均)ごとに1つの値を保存するだけでよく、この値は長期平均で初期化できます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.