タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

2
Rで異常値を検出して予測を行う方法 -時系列分析の手順と方法
私は毎月の時系列データを持っていますが、外れ値を検出して予測を行いたいです。 これは私のデータセットのサンプルです。 Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2006 7.55 7.63 7.62 7.50 7.47 7.53 7.55 7.47 7.65 7.72 7.78 7.81 2007 7.71 7.67 7.85 7.82 7.91 7.91 8.00 7.82 7.90 7.93 7.99 7.93 2008 8.46 8.48 9.03 9.43 11.58 12.19 12.23 11.98 12.26 …

3
ETS()関数、履歴データと一致しない予測を回避する方法
毎月の予測計算を自動化するために、Rのアルゴリズムに取り組んでいます。特に、予測パッケージのets()関数を使用して予測を計算しています。それは非常にうまく機能しています。 残念ながら、特定の時系列について、私が得る結果は奇妙です。 私が使用しているコードを以下で見つけてください: train_ts<- ts(values, frequency=12) fit2<-ets(train_ts, model="ZZZ", damped=TRUE, alpha=NULL, beta=NULL, gamma=NULL, phi=NULL, additive.only=FALSE, lambda=TRUE, lower=c(0.0001,0.0001,0.0001,0.8),upper=c(0.9999,0.9999,0.9999,0.98), opt.crit=c("lik","amse","mse","sigma","mae"), nmse=3, bounds=c("both","usual","admissible"), ic=c("aicc","aic","bic"), restrict=TRUE) ets <- forecast(fit2,h=forecasthorizon,method ='ets') 以下の関連する履歴データセットを見つけてください: values <- c(27, 27, 7, 24, 39, 40, 24, 45, 36, 37, 31, 47, 16, 24, 6, 21, 35, 36, 21, 40, 32, 33, …

1
Rの多変量時系列予測の遅れた相関を見つけてモデルを構築する方法
このページは新しく、統計とRはかなり新しいです。私は大学で、雨と川の水位の相関を見つけることを目的としたプロジェクトに取り組んでいます。相関が証明されたら、それを予測/予測したいと思います。 データ には、以下を含む特定の河川の数年(5分ごとに取得)のデータセットがあります。 降雨量(ミリメートル) 立方メートル/秒の河川流量 この川には雪がありませんので、モデルは雨と時間に基づいています。時々気温が氷点下になることがありますが、この状況は私のプロジェクトの範囲外であるため、これらの期間をデータから除外することを考えています。 例 ここでは、数時間後の雨と水の上昇からのサンプルデータのプロットがいくつかあります。 赤い線は川の流れです。オレンジは雨です。川で水が上がる前にいつも雨が降るのを見ることができます。時系列の終わりに再び雨が降り始めますが、後で川の流れに影響を与えます。 相関関係があります。Rでccfを使用して相関関係を証明するためにRで行ったことを次に示します。 相互相関 先行変数 遅れ これは、2番目の例(1つの降雨期間)に使用される私のRラインです。 ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain") 私の解釈は: 雨が降る(最初に起こる) 遅れでピークに達する重要な相関関係があり(正確な数を確認できます。その部分は知っています)。≈ 450≈450\approx 450 相関が川の流れに影響を与える時間を見つける方法がわかりません。名前は「保持」だと思います。私が見るものは、川が雨の後に水を失うとき、最初のグラフと同じ形をしたグラフです。それに基づいて、保持がからピークでまで続くと言えない場合(返されたデータフレームで作成されたオブジェクトでこれを確認し、水位が値に戻ったときを確認できます) 「雨の前」のことです正しいですか?保持を見つけるより良い方法はありますか?≈ 450≈450\approx 450≈ 800≈800\approx 800ccf 私は正しいですか? 時系列について。この時系列には周期性や季節性はありません。雨はいつでも降り、影響を及ぼします。夏には減りますが、それでも起こります。一年中雨が多い地域です。 モデルと予測。 雨が降った後に川がどれだけの量を増やすかを予測する予測を行うことができるようにモデルを作成する方法がわかりません。私はいくつか試してみましたがarima、auto arimaあまり成功していません。Arima、varsまたは他の異なる多変量モデルを使用する必要がありますか?例へのリンクは大いに役立ちます。 この予測を作成する最良の方法を知っている場合は、どのモデルを使用すればよいか教えてください。他にもいくつか検討していることがありますが、簡単にするためにこの説明から除外しています。必要に応じてデータを共有できます。

2
時系列予測における確率的対決定論的傾向/季節性
時系列予測のバックグラウンドは中程度です。私はいくつかの予測の本を見ましたが、それらのいずれにも対処された以下の質問はありません。 2つの質問があります。 特定の時系列に以下が含まれている場合、どのように客観的に(統計テストを介して)決定しますか? 確率的季節性または決定論的季節性 確率的傾向または決定論的傾向 時系列に明確な確率的要素があるときに、時系列を決定論的な傾向/季節性としてモデル化するとどうなりますか? これらの質問に対処するための助けをいただければ幸いです。 傾向のデータ例: 7,657 5,451 10,883 9,554 9,519 10,047 10,663 10,864 11,447 12,710 15,169 16,205 14,507 15,400 16,800 19,000 20,198 18,573 19,375 21,032 23,250 25,219 28,549 29,759 28,262 28,506 33,885 34,776 35,347 34,628 33,043 30,214 31,013 31,496 34,115 33,433 34,198 35,863 37,789 34,561 36,434 34,371 …

2
拡張ディッキーフラーテストとの混乱
私はelectricityRパッケージで利用可能なデータセットに取り組んでいますTSA。私の目的は、arimaモデルがこのデータに適切であり、最終的に適合するかどうかを調べることです。私は進んように、次: 第1回:次のグラフ場合は結果の時系列プロット 第二は:私のログを撮りたかったelectricity分散を安定化させ、その後、必要に応じて、一連の差分を取ったが、ちょうどその前に、私は上の定常性について試験をadf(Augmented Dickey Fuller)テストを使用した元のデータセットと、驚くべきことに、次のようになりました。 コードと結果: adf.test(electricity) Augmented Dickey-Fuller Test data: electricity Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 alternative hypothesis: stationary Warning message: In adf.test(electricity) : p-value smaller than printed p-value さて、私の初心者の時系列の概念によると、データが定常的であることを意味すると思います(小さなp値、非定常性の帰無仮説を棄却)。しかし、tsプロットを見ると、これが静止している可能性はありません。誰にもこれについて有効な説明がありますか?

1
STL s.windowの幅を設定する基準
を使用RしてSTL分解を実行s.windowし、季節成分がどれだけ速く変化するかを制御します。値を小さくすると、より迅速に変更できます。季節性ウィンドウを無限に設定することは、季節性成分を強制的に周期的にすることと同等です(つまり、年間を通して同一)。 私の質問: 毎月の時系列(頻度が等しい)がある場合、どの基準を使用して設定する必要がありますか?121212s.window それと時系列周波数の間にリンクはありますか?

1
混合サイトとマルチサイト研究のプーリング標準エラー-混合モデルの方が効率的である理由
いくつかのサイトからの「壊れた棒」の毎月の症例数からなるデータセットを持っています。私は2つの異なる技術から単一の要約推定値を取得しようとしています: 手法1:インジケーター変数0/1のポアソンGLMで「壊れたスティック」を取り付け、時間とtime ^ 2変数を使用して時間の傾向を制御します。この0/1インジケーター変数の推定値とSEは、モーメント法のかなりまっすぐな上下方法を使用して、またはRのtlniseパッケージを使用して「ベイジアン」推定値を取得してプールされます。これは、PengとDominiciが大気汚染データで行うことと似ていますが、サイトが少なくなります(1ダース)。 手法2:時間の傾向に対するサイト固有の制御の一部を放棄し、線形混合モデルを使用します。特に: lmer(cases ~ indicator + (1+month+I(month^2) + offset(log(p)), family="poisson", data=data) 私の質問には、これらの推定から生じる標準誤差が含まれます。手法1の標準誤差は、実際には月単位ではなく週単位の時間セットを使用しているため、精度が向上しますが、モーメント法の推定では〜0.206、tlniseでは〜0.306の標準誤差があります。 lmerメソッドは、〜0.09の標準エラーを提供します。効果の推定値はかなり近いため、混合モデルが非常に効率的である限り、異なる要約推定値に焦点を合わせているだけではないようです。 それは期待に値することですか?もしそうなら、なぜ混合モデルはそれほど効率的ですか?これは一般的な現象ですか、それともこのモデルの特定の結果ですか?

3
Auto.arimaとautoboxは違いますか?
このサイト上の記事を読んでから私はRのあることがわかっている機能 auto.arima(でforecast パッケージが)。また、私はことを知ってIrishStat、このサイトのメンバーは、商用パッケージ建てでAutoBoxを 1980年代初頭に。これらの2つのパッケージは現在存在し、特定のデータセットに対してarimaモデルを自動的に選択するため、これらのパッケージはどのように異なるのですか?同じデータセットに対して異なるモデルを作成する可能性はありますか?

1
Granger因果関係テストの結果の解釈
私はグレンジャーの因果関係について自分自身を教育しようとしています。このサイトの投稿といくつかの優れた記事をオンラインで読みました。また、非常に便利なツールである二変量グレンジャー因果-無料統計計算機に出会いました。このツールを使用すると、時系列を入力してグレンジャー統計を計算できます。以下は、サイトに含まれるサンプルデータの出力です。また、結果の解釈に亀裂を入れました。 私の質問: 私の解釈は方向的に正しいですか? 見落としている重要な洞察は何ですか? また、CCFチャートの意味と解釈は何ですか?(CCFは相互相関であると仮定しています。) 私が解釈した結果とプロットは次のとおりです。 Summary of computational transaction Raw Input view raw input (R code) Raw Output view raw output of R engine Computing time 2 seconds R Server 'Herman Ole Andreas Wold' @ wold.wessa.net Granger Causality Test: Y = f(X) Model Res.DF Diff. DF F p-value Complete …

1
短い多変量時系列を予測する最も愚かな方法
29番目の時間単位について、次の4つの変数を予測する必要があります。約2年分の履歴データがあります。1と14と27はすべて同じ期間(または時期)です。最後に、私は、、、および Oaxaca-Blinderスタイルの分解を行っています。w d w c pWWWwdwdwdwcwcwcppp time W wd wc p 1 4.920725 4.684342 4.065288 .5962985 2 4.956172 4.73998 4.092179 .6151785 3 4.85532 4.725982 4.002519 .6028712 4 4.754887 4.674568 3.988028 .5943888 5 4.862039 4.758899 4.045568 .5925704 6 5.039032 4.791101 4.071131 .590314 7 4.612594 4.656253 4.136271 .529247 8 4.722339 4.631588 3.994956 …


2
予測のためのニューラルネットワークの概要
時系列予測にニューラルネットワークを使用するには、いくつかのリソースが必要です。私はいくつかの論文を実装し、彼らが彼らの方法の可能性を大いに表明していることを知ることに警戒しています。そのため、これらのメソッドの経験がある場合は、さらに素晴らしいことを提案しています。

1
量的金融におけるHMMの使用。トレンド/ターニングポイントの検出に機能するHMMの例は?
「政権交代モデル」とも呼ばれる「隠れマルコフモデル」と呼ばれる素晴らしい世界を発見しています。RのHMMを適応させて、傾向と転換点を検出したいと思います。多くの価格でテストできるように、できるだけ一般的なモデルを作成したいと思います。 誰でも論文を推薦できますか?私はいくつかを見てきました(そして読んでいます)が、実装が簡単なシンプルなモデルを探しています。 また、どのRパッケージが推奨されますか?多くの人がHMMをやっていることがわかります。 「時系列の隠れマルコフモデル:Rを使用した導入」という本を購入しました。中身を見てみましょう;) フレッド

3
時系列に最適な統計検定は何ですか?
一定の間隔でデータセットごとに5〜10個のデータポイントを持つ単純な時系列があります。2つのデータセットが異なるかどうかを判断する最善の方法は何だろうと思っています。各データポイントでt検定を試す必要がありますか、それとも曲線の下の領域を見る必要がありますか、それともより効果的な多変量モデルがありますか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.