1
Rの多変量時系列予測の遅れた相関を見つけてモデルを構築する方法
このページは新しく、統計とRはかなり新しいです。私は大学で、雨と川の水位の相関を見つけることを目的としたプロジェクトに取り組んでいます。相関が証明されたら、それを予測/予測したいと思います。 データ には、以下を含む特定の河川の数年(5分ごとに取得)のデータセットがあります。 降雨量(ミリメートル) 立方メートル/秒の河川流量 この川には雪がありませんので、モデルは雨と時間に基づいています。時々気温が氷点下になることがありますが、この状況は私のプロジェクトの範囲外であるため、これらの期間をデータから除外することを考えています。 例 ここでは、数時間後の雨と水の上昇からのサンプルデータのプロットがいくつかあります。 赤い線は川の流れです。オレンジは雨です。川で水が上がる前にいつも雨が降るのを見ることができます。時系列の終わりに再び雨が降り始めますが、後で川の流れに影響を与えます。 相関関係があります。Rでccfを使用して相関関係を証明するためにRで行ったことを次に示します。 相互相関 先行変数 遅れ これは、2番目の例(1つの降雨期間)に使用される私のRラインです。 ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain") 私の解釈は: 雨が降る(最初に起こる) 遅れでピークに達する重要な相関関係があり(正確な数を確認できます。その部分は知っています)。≈ 450≈450\approx 450 相関が川の流れに影響を与える時間を見つける方法がわかりません。名前は「保持」だと思います。私が見るものは、川が雨の後に水を失うとき、最初のグラフと同じ形をしたグラフです。それに基づいて、保持がからピークでまで続くと言えない場合(返されたデータフレームで作成されたオブジェクトでこれを確認し、水位が値に戻ったときを確認できます) 「雨の前」のことです正しいですか?保持を見つけるより良い方法はありますか?≈ 450≈450\approx 450≈ 800≈800\approx 800ccf 私は正しいですか? 時系列について。この時系列には周期性や季節性はありません。雨はいつでも降り、影響を及ぼします。夏には減りますが、それでも起こります。一年中雨が多い地域です。 モデルと予測。 雨が降った後に川がどれだけの量を増やすかを予測する予測を行うことができるようにモデルを作成する方法がわかりません。私はいくつか試してみましたがarima、auto arimaあまり成功していません。Arima、varsまたは他の異なる多変量モデルを使用する必要がありますか?例へのリンクは大いに役立ちます。 この予測を作成する最良の方法を知っている場合は、どのモデルを使用すればよいか教えてください。他にもいくつか検討していることがありますが、簡単にするためにこの説明から除外しています。必要に応じてデータを共有できます。