Rの多変量時系列予測の遅れた相関を見つけてモデルを構築する方法


16

このページは新しく、統計とRはかなり新しいです。私は大学で、雨と川の水位の相関を見つけることを目的としたプロジェクトに取り組んでいます。相関が証明されたら、それを予測/予測したいと思います。

データ には、以下を含む特定の河川の数年(5分ごとに取得)のデータセットがあります。

  • 降雨量(ミリメートル)
  • 立方メートル/秒の河川流量

この川には雪がありませんので、モデルは雨と時間に基づいています。時々気温が氷点下になることがありますが、この状況は私のプロジェクトの範囲外であるため、これらの期間をデータから除外することを考えています。

ここでは、数時間後の雨と水の上昇からのサンプルデータのプロットがいくつかあります。

数日大きい例

降雨期間が1つだけの短い例

赤い線は川の流れです。オレンジは雨です。川で水が上がる前にいつも雨が降るのを見ることができます。時系列の終わりに再び雨が降り始めますが、後で川の流れに影響を与えます。

相関関係があります。Rでccfを使用して相関関係を証明するためにRで行ったことを次に示します。

  • 相互相関
  • 先行変数
  • 遅れ

これは、2番目の例(1つの降雨期間)に使用される私のRラインです。

ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")

小さな例2のccfの結果

私の解釈は:

  • 雨が降る(最初に起こる)
  • 遅れでピークに達する重要な相関関係があり(正確な数を確認できます。その部分は知っています)。450
  • 相関が川の流れに影響を与える時間を見つける方法がわかりません。名前は「保持」だと思います。私が見るものは、川が雨の後に水を失うとき、最初のグラフと同じ形をしたグラフです。それに基づいて、保持がからピークでまで続くと言えない場合(返されたデータフレームで作成されたオブジェクトでこれを確認し、水位が値に戻ったときを確認できます) 「雨の前」のことです正しいですか?保持を見つけるより良い方法はありますか?450800ccf

私は正しいですか?

時系列について。この時系列には周期性や季節性はありません。雨はいつでも降り、影響を及ぼします。夏には減りますが、それでも起こります。一年中雨が多い地域です。

モデルと予測。 雨が降った後に川がどれだけの量を増やすかを予測する予測を行うことができるようにモデルを作成する方法がわかりません。私はいくつか試してみましたがarimaauto arimaあまり成功していません。Arimavarsまたは他の異なる多変量モデルを使用する必要がありますか?例へのリンクは大いに役立ちます。

この予測を作成する最良の方法を知っている場合は、どのモデルを使用すればよいか教えてください。他にもいくつか検討していることがありますが、簡単にするためにこの説明から除外しています。必要に応じてデータを共有できます。


あなたは介入分析を探しています(社会調査ではサブセットは「イベント調査」と呼ばれます)
コンスタンティノス

回答:


3

ACFとPACFの動作を使用して、どのモデルがデータに適しているかを判断する必要があります(たとえば、ACFプロットに遅い減衰が存在することは、シリーズをより安定させるために差分が必要な場合があることを示します。適切な変換(静止シリーズ)を使用する場合、変動はそれほど変化せず、青い線の範囲内である必要があります。シリーズを静止にしたら、どのモデルAR、MA、ARMA、またはARIMAが適切かを考えます。私のプロジェクトでは、モデルの選択を支援するために次のことを行いました。

ACFプロットは、ラグ2で比較的大きな値を示します(これがプロットのどこにあるかを参照してください)。それとは別に、2を超えるラグでは本質的にゼロになります。これは、MA(2)モデルがデータに適合し、PACFプロットを見ると、相関がほとんどすべてのラグでゼロであることにすぐに気付くことを示唆しています。これは、モデルにARパーツがないことを示唆する場合がありますこれをプロットに合わせて調整します)。したがって、候補モデルの1つは、パラメーターp = 0、d = 1、q = 1または2のARIMA(p、d、q)になります。また、高次のMAをいくつか試し、AIC、AICc、およびBICの結果を比較して最終モデルを決定するために、モデルにARパーツを含める可能性を検討しました。次のステップでは、正しいモデルを選択し、残差にパターンがないことを確認するためにいくつかの診断テストを実行する必要があります(残差のACFとPACF、Ljung-Box統計のp値、残差のヒスチグラム、 QQプロット)。それが役に立てば幸い!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.