時系列の説明をどうするか?


11

これまで、主に横断データを扱い、ごく最近では、一連の入門的な時系列文献をつまづいてスキャンしてきました。時系列分析で説明変数がどのような役割を果たしているのでしょうか。

トレンド除去ではなくトレンド説明したいと思います。序論として私が読んだことのほとんどは、シリーズが何らかの確率論的プロセスに由来していることを前提としています。AR(p)とMAプロセス、およびARIMAモデリングについて読みました。自己回帰プロセスだけではなく、より多くの情報を処理したいので、VAR / VECMを見つけていくつかの例を実行しましたが、断面図での説明とより密接に関連するケースがあるかどうか疑問に思います。

この背後にある動機は、私のシリーズの分解が傾向が主要な貢献者であることを示している一方で、残りと季節効果がほとんど役割を果たすことはないということです。この傾向を説明したいと思います。

複数の異なるシリーズでシリーズを後退させることはできますか?直感的には、シリアル相関のためにglsを使用します(cor構造についてはよくわかりません)。偽の回帰について聞いて、これが落とし穴であることを理解していますが、それでも傾向を説明する方法を探しています。

これは完全に間違っているのですか、それとも珍しいのですか?それとも、これまでのところ正しい章を逃しただけですか?

回答:


15

回答に対して提供したコメントに基づいて、偽の因果関係に注意する必要があります。時間傾向のある変数は、時間傾向のある別の変数と相関します。たとえば、私の誕生から27歳までの体重は、誕生から27歳までの体重と高い相関関係があります。明らかに、私の体重はあなたの体重が原因ではありません。もしそうなら、ジムにもっと頻繁に行くようお願いします。

断面データに慣れているので、省略された変数について説明します。私の体重をとし、あなたの体重をとします。ここで、 y t x txtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

次に、回帰 は、含まれている変数と相関する、省略された変数(時間トレンド)があります。したがって、係数はバイアスされます(この場合、時間の経過とともに重みが増加するため、係数はなります)。X T γ 1

yt=γ0+γ1xt+νt
xtγ1

時系列分析を実行しているときは、変数が定常であることを確認する必要があります。そうしないと、これらの疑わしい因果関係の結果が得られます。例外は統合シリーズですが、それについて詳しくは、時系列のテキストを参照してください。


5
偽の回帰の例として+1。講義で使用します:)
mpiktas

1
ええと、あなたはジムに行き、体重を減らしますか?:)
hans0l0

6

時系列回帰では、断面回帰と同じ直感を使用できます。他の変数を使用して傾向を説明しようとすることは完全に有効です。主な違いは、リグレッサは確率変数であると暗黙的に想定されていることです。したがって、回帰モデルでは:

Yt=β0+Xt1β1+...+Xtkβk+εt

および ではなく、が必要です代わりに。E ε T = 0 E ε 2 T | X T 1X 、T 、K= σ 2 E ε 2 、T = σ 2E(εt|Xt1,...,Xtk)=0Eεt=0E(εt2|Xt1,...,Xtk)=σ2Eεt2=σ2

回帰の実際的な部分は変わりません。通常の統計と方法がすべて適用されます。

難しいのは、どのタイプの確率変数、またはこの場合は確率過程に対して古典的な方法を使用できるかを示すことです。通常の中心極限定理は、独立確率変数を含むため、適用できません。時系列プロセスは通常、独立していません。ここで定常性の重要性が発揮されます。定常過程の大部分で中心極限定理が適用できるため、古典的な回帰分析を適用できることが示されています。Xtk

時系列回帰の主な注意点は、リグレッサが静止していない場合、大規模に失敗する可能性があることです。次に、通常の回帰法では、傾向が説明されていることを示すことができますが、実際には説明されていません。したがって、傾向を説明する場合は、続行する前に非定常性を確認する必要があります。そうしないと、誤った結論に達する可能性があります。


1
お待ち頂きまして、ありがとうございます。それでも、GDPは私の変数を説明する可能性があります。おそらく、成長率を使用する方が良いでしょう。それ以外の場合は、ここでは時間の傾向を表しているだけだからです。回帰を使用したいのは、GDPのような時間トレンド変数によって実際に説明されていないものを抽出することに興味があるからです。
hans0l0 2011年

1
@ ran2、それは実際の値の代わりにGDP成長を使用することが常に最善です。回帰分析では、傾向を説明しない変数もわかるため、傾向を説明できる変数がない(または、考えた変数が傾向を説明しない)という結果になる可能性があることに注意してください。
mpiktas 2011年

1
@raegtin、たとえば二次モーメントのない定常プロセス。
mpiktas 2011年

1
私が付け加える唯一のことは、「説明する」という世界の使用に注意することです。一部のレビュアーはこれを気に入らないでしょう。
Jase、

1
@Jase、まあ私はOPが尋ねた意味でこの用語を使用しました。つまり、意味のある統計的関係を見つけました。
mpiktas

3

サポート/因果関係/支援/右側系列/外因性/予測子系列がある場合、推奨されるアプローチは、単一の方程式、複数入力の伝達関数を作成することです。不特定/省略された決定論的入力の両方について可能なモデルの残差を調べる必要があります。つまり、ARIMAコンポーネントを介して介入検出ala Ruey Tsay 1988 Journal of Forecastingと不特定の確率的入力を行います。したがって、ユーザーが提案した因果関係(および必要な遅延!)だけでなく、省略された2種類の構造(ダミーとARIMA)を明示的に含めることができます。

最終モデルのパラメーターが時間の経過とともに大幅に変化しないように注意する必要があります。そうしないと、データのセグメント化が適切に行われ、最終モデルの残差が不均一な分散を示すことが証明されない場合があります。

元の系列の傾向は、予測子系列の傾向、または対象系列の自己回帰ダイナミクスが原因であるか、定常状態定数または1つ以上のローカル時間傾向によってプロキシされた決定論系列が省略されていることが原因である可能性があります。


0

あまり技術的でない観点から、傾向を説明するだけではあまり役に立たないことがよくあります。つまり、時間を主要な関心事の予測因子として扱うことです。時間の経過に伴う系列の変動は、他の変数の根本的な影響を示唆することが多く、調査にはより概念的に関連する、自己回帰および/または外因性プロセスが含まれます。したがって、これらの変数も時間とともに変化する場合、@ mpiktasが示したように、時間の影響を制御することは、実際には人為的に重要な関係にならないようにする必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.