ARIMAモデルをあてはめる前に時系列をログ変換するタイミング


26

以前は予測プロを使用して単変量時系列を予測していましたが、ワークフローをRに切り替えています.Rの予測パッケージには多くの便利な機能が含まれていますが、自動化を実行する前に行わないデータ変換が1つあります.arima()。いくつかのケースでは、予測プロは予測を行う前に変換データを記録することを決定しますが、その理由はまだわかりません。

私の質問は次のとおりです:ARIMAメソッドを試す前に、時系列をいつログ変換する必要がありますか?

/編集:回答を読んだ後、次のようなものを使用します。xは私の時系列です。

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

これは理にかなっていますか?

回答:


21

続行する前にいくつかの注意事項。私が生徒によく提案するように、auto.arima()物事は最終結果の最初の近似としてのみ使用するか、ライバル理論に基づいたモデルの方が優れていることを確認するときにpar約的なモデルが必要な場合にのみ使用します。

データ

作業している時系列データの説明から明確に開始する必要があります。マクロ計量経済学では通常、集計データを使用し、幾何学的平均(驚くべきことに)はマクロ時系列データのより経験的な証拠を持っています。これはおそらく、それらのほとんどが指数関数的に増加する傾向に分解できるためです。

ちなみに、Robの提案は、季節の変化が明確な時系列に対して「視覚的に」機能します。これは、変化の緩やかな年間データが変動の増加に対してあまり明確でないためです。幸運なことに、指数関数的に増加する傾向が通常見られます(ログが必要ないよりも、直線的であると思われる場合)。

モデル

分析が、いくつかの加重幾何平均 として知られる理論に基づいている場合乗法回帰モデルは、作業する必要があるモデルです。次に、通常、パラメーターが線形であり、ほとんどの変数が一部の成長率が変換される対数回帰モデルに移動しますY(t)=X1α1(t)...Xkαk(t)ε(t)

金融計量経済学では、ログはログリターンの人気のために一般的なものです、なぜなら...

ログ変換には素晴らしい特性があります

対数回帰モデルでは、それは推定パラメータの解釈である、と言うとして弾力のの。 Y T X IT αiY(t)Xi(t)

エラー修正モデルでは、絶対差よりも比率がより安定定常)であるという経験的に強い仮定があります。

金融計量経済学では、時間の経過とともにログリターンを集計するの簡単です。

ここで言及されていない他の多くの理由があります。

最後に

通常、対数変換は負でない(レベル)変数に適用されます。2つの時系列(ネットエクスポートなど)の違いを観察する場合、ログを取得することさえできません。レベルで元のデータを検索するか、差し引かれた一般的なトレンドの形式を想定する必要があります。

[ 編集後の追加 ] いつログ変換を行うかについての統計的基準が必要な場合、簡単な解決策は不均一分散のテストです。分散が増加する場合、Goldfeld-Quandt Testまたはそれに類似したテストをお勧め します。Rでは、それは機能にありlibrary(lmtest)gqtest(y~1)機能によって示されます。回帰モデルがない場合は、インターセプト項で単純に回帰することがy従属変数です。


情報をありがとう。GQテストでは、p値が低いほど、分布が不均一分散である可能性が高くなりますか?
ザック

@Zach:データマイニングに行く予定がない場合は、もちろん5%かかります。私は個人的にモデルの仮定から始めます。
ドミトリーチェロフ

@Dmitrij。ありがとうございました。出力を正しく解釈していることを確認したいだけです。
ザック

29

時間に対するデータのグラフをプロットします。シリーズのレベルに応じて変動が増加するように見える場合は、ログを取得します。それ以外の場合、元のデータをモデル化します。


3
ここに質問があります:ログを取得し、それらが要求されていない場合の影響は何ですか?対数変換を必要とする時系列で作業するとき、私はそれが好きでした。なぜなら、(私が理解しているように)係数は比率であり、小さな値ではほぼパーセンテージだからです。(たとえば、exp(0.05)= 1.051。)
ウェイン

4

あなたは彼らの実を知って

(テストされる)仮定は、モデルからのエラーが一定の分散を持っていることです。これは、想定モデルからのエラーを意味するものではないことに注意してください。単純なグラフィカル分析を使用する場合、基本的には時間内に線形モデルを想定しています。

したがって、時間に対するデータのカジュアルなプロットによって示唆されるような不適切なモデルがある場合、パワー変換の必要性について誤って結論を下す可能性があります。BoxとJenkinsは、Airline Dataの例でそうしました。彼らは、最新のデータの3つの異常な値を考慮しなかったため、系列の最高レベルで残差に大きな変動があると誤って結論付けました。

このテーマの詳細については、http://www.autobox.com/pdfs/vegas_ibf_09a.pdfをご覧ください


1

系列が何らかの形で自然に幾何学的である場合、または投資の時間価値が正のリターンを持つ最小リスク債券と比較することを意味する場合、系列を対数変換することができます。これにより、それらがより「線形化可能」になり、単純な差分再帰関係に適したものになります。


1
変容は麻薬のようなものです。あるものはあなたにとって良いものもあればそうでないものもあります。touが統計的仮説のテストに興味がない場合は、好きなものを仮定できます。仮説のパラメータ検定には誤差価格に関する仮定がありますが、危険を無視してください。
IrishStat

1
仰るとおり。プロセスは幾何学的である必要があると言っていました。変換に失敗すると、推論のエラーも発生する可能性があります。有効な推論の条件に関する仮定を無視するように提案した場所はわかりません。
DWin

1
stats.stackexchange.com/questions/6498/…には、いつ、なぜ変換するかについての議論が含まれていました。元の乾燥が「幾何学的」である「事実」は、適切なモデルからの残差が平均に比例する標準偏差を持っていることを推測しません。ただし、経験的に証明するか、少なくともテストする必要があります。
IrishStat
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.