外部変数を使用した時系列データの予測


10

現在、時系列データ(月次データ)の予測を行うプロジェクトに取り組んでいます。私はRを使用して予測を行っています。1つの従属変数(y)と3つの独立変数(x1、x2、x3)があります。y変数には73個の観測値があり、他の3個の変数にもあります(alos 73)。2009年1月から2015年1月まで。相関とp値を確認しましたが、モデルに入れることはすべて重要です。私の質問は、どのようにすればすべての独立変数を使用して適切な予測を行うことができますか?これらの変数の将来の値はありません。2年後(2017年)のy変数を予測したいとします。これどうやってするの?

私は次のコードを試しました:

    model = arima(y, order(0,2,0), xreg = externaldata) 

このコードで2年間のy値の予測を行うことはできますか?

私は回帰コードも試しました:

    reg = lm(y ~ x1 + x2 + x3) 

しかし、このコードでどのように時間をかけますか?yの値が2年になると予測するにはどうすればよいですか?統計と予測は初めてです。いくつかの読み取りを行ってラグ値をカムしていますが、モデルでラグ値を使用して予測を行うにはどうすればよいですか?

実際、私の全体的な質問は、将来の値がない外部変数を含む時系列データをどのように予測できるかということです。


時系列データで回帰を使用しないでください。伝達関数モデルのアプローチを使用します。
トムライリー

2
こんにちは、伝達関数モデルについて詳しく教えていただけますか?そして、なぜ時系列データで回帰を使用すべきではないのですか?ほとんどの研究では、時系列で回帰を使用することを推奨しています。
SB 2016年

伝達関数モデルについては、第10章のBox-Jenkins教科書で説明されています。目的は、各因果関係(事前ホワイトニング)のモデルを作成し、残差を使用してY(相互相関)に対する相関を見つけることです。これは、どの変数が重要で、リードまたはラグ関係があるかどうかを識別するのに役立ちます。この方程式またはX変数の分母にARIMAが必要になる場合があります。外れ値、傾向、レベル、季節性、パラメーター、および分散の変化もあるかもしれません。
トムライリー

また、時間は重要ではないと想定した回帰がある場合もあります。回帰はGaltonがSweat Peasを研究するために使用した...時系列の問題ではありません。伝達関数は、プロセスの一部を使用して問題を推定します。
トムライリー

回答:


11

外部変数を使用してモデルを近似し、このモデルから予測する場合は、単純で単純な外部変数の将来の値(予測)が必要です。これを回避する方法はありません。

もちろん、説明変数を予測する方法はいくつかあります。最後に観測された値(「単純なランダムウォーク」予測)または全体の平均を使用できます。これが有用な値である場合は、それらをゼロに設定するだけです(たとえば、地震のように過去に発生した、繰り返し発生するとは予想されない特別なイベント)。または、たとえばを使用して、時系列モデルをこれらの説明変数自体に当てはめて予測することもできますauto.arima

yxregy

この無料のオンライン予測のテキスト、特に重回帰に関するこのセクション(残念ながら、ARIMAXについては何もありません)、およびRob Hyndmanのブログ投稿「The ARIMAX model muddle」をお勧めします。


1

ヨギ・ベラが言ったように、「特に将来についての予測をするのは難しい」

多くの統計ソフトウェアモジュールは、将来の情報がない場合に、時系列の単変量ストリームに基づいて予測を生成します。これらの予測は、データの履歴的な動作に基づく予測です。

あなたはあなたのデータが毎月であることを私たちに伝えますが、あなたが利用可能な期間を私たちに教えてはいけません。別のアプローチは、3つのIVをDVに対して24か月前に設定して、予測期間がt + 24になるようにすることです。これは、モデルを初期化し、必要に応じて関連する季節性を調整するための十分な日付があることを前提としています。


テキストを編集しました。今、私の質問に答えてもらえますか?
SB

十分な量の情報がある場合、時間をモデルに統合するには多くの方法があります。年(2009、2010など)、四半期、時系列の各月のダミー変数を作成できます。季節性を考慮する方法として、その年の各月も作成できます。別のアプローチは、時間を数値トレンド関数として扱うことです。たとえば、線形(2009年1月= 1、2月= 2で始まる期間のカウントなど)または線形トレンドに基づく任意の数の多項式トレンド、たとえば、二次(線形トレンド二乗)以上。他に何が知りたいですか?
マイクハンター、

しかし、時間は独立した変数ではありませんか?では、3つの外部変数を使用してy変数をどのように予測できますか?予測を行うモデルを実際に選択するのに苦労していますか?
SB

前のコメントで概説したように、時間は独立変数です。回帰、計量経済学、時系列の文献を読む必要があると思います。このサイトには、これらの質問に対処し、記事や本などを提案するスレッドがたくさんあります。このWebページの右側を参照して、懸念事項に関連するスレッドをさらに探してください。
マイクハンター、

私は多くの読書をしてきましたが、解決策を見つけることができませんでした。それが私がここでこの質問をした理由です。私が使用できるいくつかの文学のスレッドを挙げていただけますか?または右のウェブページ?
SB

1

私が見るように、3つのオプションがあります。

  1. 独立変数の公開済み予測を使用するか、モデルを見つけてそれらを予測します。たとえば、国勢調査では人口データが予測されます。
  2. 所有しているデータセットを使用して、時間に対して各独立変数を回帰し、これらの結果を使用して、独立変数の予測モデル
  3. 独立変数を削除し、従属変数を時間の関数およびyの遅れた値としてモデル化します。

それぞれのアプローチには長所と短所があるため、最適な方法は特定のコンテキストに依存します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.