変数が異なる場合の通常の回帰と回帰


13

変数が異なる場合の通常の重回帰/単純回帰と多重回帰/単純回帰の関係を理解し​​ようとしています。

例えば、私は預金残高(関係分析しています市場レート(対)私は回帰直線的シンプルを実行する場合、私は、ログを取る場合)、相関が、しかし(-.74周り)負のとはかなり重要であり、従属変数の差と独立変数の差なので、私の方程式ははで回帰され、相関とR ^ 2はまったく重要ではありません()。YTRTdln(YT)dR(T)R2=.004

この低い何か意味があるのか​​と思っていました。それは私のモデルが適合していないことを意味しますか、それとも異なるデータを見ているときにを無視しますか?データから、元の2つの変数の間に有意な相関関係があることがわかりますが、私のモデルでは、変数の違いを調べる必要があるので、どうすればよいのでしょうか。R2R2

回答:


16

単純なバージョンでは、時間の経過とともに一方向に変化する傾向がある2つの変数は、それらの間に関係があるかどうかに関係なく、相関しているように見えます。以下の変数を考慮してください。

set.seed(1)
time = seq(from=1, to=100, by=1)
x  = .5 + .3*time +        rnorm(100)
y1 =  3 + .3*time +        rnorm(100)
y2 =  7 + .1*time + .8*x + rnorm(100)

はと同様に時間の関数です。 は時間との両方の関数です。ポイントは、と間に実際に関係があり、と間に関係がないことをコードから認識することです。次の図を見てください。3行すべてがひどく似ていますよね。バツy1y2バツバツy2バツy1

ここに画像の説明を入力してください

実際、と関係の値R2バツy1R2バツy2バツy1バツy2、実際の外観と単なる外観をどのように区別しますか?ここで差異が生じます。変数のうち2つについては、両方とも時間が経つにつれて上昇する傾向があるため、あまり有益ではありません。差分により、その質問に答えることができます。次の2つの図に注意してください。3つの変数すべてを差分した後に作成した散布図です。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

バツy2R2=.43バツy1R2=.07R2

いくつかの他のポイント:図では、これらが同時に変更されることを指摘します。それには何の問題もありません。それは私が問題を設定した方法から来ていますが、通常、人々は何らかの遅れで効果に興味を持っています。(つまり、ある時点で1つのことを変更すると、後で別の何かが変更されることになります。)次に、シリーズの1つのログを取ることについて言及します。ログを取得すると、データがレベルからレートに切り替わります。したがって、違いがある場合は、レベルの変化ではなくレートの変化を見ています。それは非常に一般的ですが、デモではその要素を含めませんでした。それは私が議論した問題に直交しています。最後に、時系列データは多くの場合、デモで説明するよりも複雑であることを認識したいと思います。


10

@gungは良い答えを提供しますが、私はあなたが提案していることにいくつかの警告を提供したいと思います。

たとえば、プロセスが相関係数1のAR(1)である場合、差分は主に単位根の問題に対処するために使用されます。差分は、誤差項がホワイトノイズ(特に、@ gungが上で示したように、連続的な相関関係はありません)。ただし、誤差項に絶対値が1未満の相関係数を持つシリアル相関がある場合、差分を使用して線形時間トレンドを削除すると、非常に複雑な構造の誤差が生成されます。この場合、正確な標準誤差を取得して有効な推論を行うことは困難です。

そのため、最初にユニットルートをテストし、ユニットルートが検出された場合は、差分によって修正するのが最善です。次に、線形の時間トレンドを確認します。トレンド除去によりこの問題を修正します。後者を行わなくても、@ gungがうまく示している、省略された変数型の問題を受け入れることになります。


1
+1これは私の答えを補完するものです。私は答えをシンプルで直感的なものにしようとしました。ただし、私が説明したよりも複雑な点があり、非常に重要になる可能性があることは確かです。私は最後の段落でそれを認めるべきでした。正直にしてくれてありがとう。
GUNG -復活モニカ

1

目的が2つ以上の系列間の関係を形成/識別することである場合、定常X変数をフィルター処理してノイズに変換する必要があります。これは、必要な差分化とARMA構造の2段階のプロセスです。客観性を保持し、モデル仕様バイアスを回避するには、フィルターを想定するのではなく、静止Xシリーズの自己相関性を使用してそのフィルターを構築する必要があります。次に、Yシリーズを取得し、静止させるために必要な差分演算子を適用してから、以前に開発したフィルターを静止Yに適用します。この手順には1つだけの目的があり、それはYとXの間の関係を識別することです。必要な差分演算子についての結論にジャンプしてはいけません。データを観察する前にモデルを知っている計量経済学者であるか、全能者と直接話す場合を除き、ARMAフィルターと変数間の関係。計算される統計的検定を信じるには、エラー要件の正常性に関する注意深い分析が必要です。Fテスト/ Tテストの計算は必要ですが、十分ではありません。要約すると、「伝達関数モデルを識別する方法」の主題を追求することをお勧めします。他の人と私はこのテーマに何度も取り組んできました。希望する場合は、タグ「時系列」が添付されている質問への回答のいくつかを熟読してください。ヨギが言ったように、「読むだけでたくさん見られます」。時には素晴らしくて単純な答えはあなたを迷わせることがあり、私のような複雑すぎる/保守的な答えは時系列データのモデリングのより良い理解を必要とするかもしれません。かつて言われたように、「トト、私たちはもうカンザス州(横断データ)ではありません!」

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.