自己相関とは何ですか?


13

これに先立ち、私はかなり深い数学的背景を持っていますが、時系列や統計モデリングを実際に扱ったことはありません。だからあなたは私にとても優しくする必要はありません:)

私は商業ビルでのエネルギー使用のモデリングに関するこの論文を読んでおり、著者はこの主張をしています:

[自己相関が存在する]モデルは、本質的に自己相関のエネルギー使用の時系列データから開発されたためです。時系列データの純粋に決定論的なモデルには、自己相関があります。[より多くのフーリエ係数]がモデルに含まれている場合、自己相関が減少することがわかります。ただし、ほとんどの場合、フーリエモデルのCVは低くなります。したがって、このモデルは、高い精度を要求しない(本来の)実用的な目的に適している場合があります。

0.)「時系列データの純粋に決定的なモデルには自己相関がある」とはどういう意味ですか?これが何を意味するか、漠然と理解できます。たとえば、自己相関が0だった場合、時系列の次のポイントをどのように予測しますか。確かにこれは数学的な議論ではないので、これが0である理由です:)

1.)自己相関は基本的にあなたのモデルを殺したという印象を受けましたが、考えてみると、なぜそうなるべきなのか理解できません。では、なぜ自己相関が悪い(または良い)ものなのでしょうか?

2.)自己相関を扱うために聞いた解決策は、時系列を比較することです。著者の心を読もうとせずに、無視できない自己相関が存在する場合、なぜ差分を行わないのでしょうか?

3.)モデルに無視できない自己相関はどのような制限を課しますか?これはどこかの仮定ですか(つまり、単純な線形回帰でモデリングする場合の正規分布の残差)。

とにかく、これらが基本的な質問であればごめんなさい。助けてくれてありがとう。

回答:


10
  1. 著者はおそらくモデルの残差について話していると思います。これは、フーリエ係数をさらに追加することに関する彼の声明によるものです。私が信じているように、彼がフーリエモデルに適合している場合、係数を追加すると、CVが高くなりますが、残差の自己相関が減少します。

    これを視覚化できない場合は、次の例を考えてください。ホワイトガウスノイズが追加された2係数フーリエモデルから得られる次の100ポイントのデータセットがあるとします。

    データポイント

    次のグラフは、2つの近似を示しています。1つは2つのフーリエ係数で実行され、もう1つは200のフーリエ係数で実行されました。

    ぴったり

    ご覧のとおり、200のフーリエ係数はDATAPOINTSによりよく適合し、2係数適合(「実際の」モデル)はMODELにより適合しています。これは、200個の係数を持つモデルの残差の自己相関は、2つの係数モデルの残差よりもすべてのラグでほぼ確実にゼロに近づくことを意味します。ほとんどすべてゼロである)。しかし、たとえば10個のデータポイントをサンプルから外し、同じモデルに適合させた場合、どうなると思いますか?2係数モデルは、サンプルから除外したデータポイントをより良く予測します!したがって、200係数モデルとは異なり、CVエラーは低くなります。これはオーバーフィットと呼ばれます。この「魔法」の背後にある理由は、CVが実際に測定しようとするのは予測エラー、つまりモデルがデータセットにないデータポイントをどれだけうまく予測するかです。

  2. このコンテキストでは、残差の自己相関は「不良」です。これは、データポイント間の相関を十分にモデリングしていないことを意味するためです。人々がシリーズを変えない主な理由は、彼らが実際に根本的なプロセスをそのままモデリングしたいからです。周期性または傾向を取り除くために通常時系列に違いがありますが、その周期性または傾向が実際にモデル化しようとしているものである場合、それらを区別することはラストリゾートオプション(または残差をモデル化するためのオプション)より複雑な確率過程)。
  3. これは、実際に作業している領域に依存します。決定論的モデルにも問題がある可能性があります。ただし、自己相関の形式によっては、フリッカーノイズ、ARMAに似たノイズなどが原因で自己相関が発生した場合や、基になる周期的なソースが残っている場合(この場合、増加させたい場合があります)フーリエ係数の数)。

ご回答いただきありがとうございます。ご希望の場合は、一度に1つずつ消化してみてください。1.)について、より多くのフーリエ係数を含めると自己相関が減少し、CVが増加する理由を理解する直感的な方法はありますか?
ベンダンディー

1
例を追加しました。それが役に立てば幸い。はい、彼は残差のCVを参照しています。
ネスター

ああ、わかりました。これは、2に関して私が尋ねようとしていたことと結びついています。相関関係をよりよく理解するために、このモデルに(一般的に)パッチを適用するにはどうすればよいでしょうか。フーリエ係数の相関行列に関する制約を追加できますか?
ベンダンディー

1
それも私がしている難しい仕事です。特に、周期的な決定論的モデルでは、どの種類のノイズモデルを使用するのかを知るのは非常に難しくなります。大きな問題は、フーリエモデルの係数の数をアプリオリに知らないことです。したがって、これらはモデル化する必要があるランダム変数です。データポイントの数が少ない場合、これをモデル化するために、リバーシブルジャンプMCMCを明確に選択します。異なるノイズモデルを試し、それらの間でAIC / BICを比較します。ただし、大規模なデータセットの場合、これは実行不可能です。
ネスター

3

この論文「計量経済学における偽りの回帰」は、なぜトレンドを排除することが必要なのかを理解しようとするときに役立ちました。基本的に、2つの変数がトレンドになっている場合、それらは共変します。これはトラブルの原因となります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.