時系列と回帰の関係と違い?


12

時系列と回帰の関係と違いは何ですか?

モデルと仮定について、時系列モデルはそうではないが、回帰モデルは入力変​​数の異なる値の出力変数間の独立性を仮定するのは正しいですか?他のいくつかの違いは何ですか?

以下のための方法から、ダーリントンによってウェブサイト

時系列分析には多くのアプローチがありますが、最もよく知られている2つの方法は、回帰法とBox-Jenkins(1976)またはARIMA(AutoRegressive Integrated Moving Average)法です。このドキュメントでは、回帰方法を紹介します。3つの主な理由から、回帰法はARIMAよりもはるかに優れていると考えています

時系列の「回帰方法」がウェブサイト上にあるものと、Box-JenkinsまたはARIMA方法とどのように異なるかについて、私はよくわかりません。誰かがそれらの質問について洞察を与えてくれれば幸いです。

よろしくお願いします!


2
ここでの回答とコメントのほとんどは、最後に向かってより具体的な質問に焦点を当てています。これは、時系列分析がBox-JenkinsやARIMAよりもはるかに多いことを示す単なるフラグです。時系列分析のフィールド全体は、まったく異なる(または少なくともより一般的な)焦点を持っています。観測されていないコンポーネントモデルは、いくつかの例の1つにすぎません。
ニックコックス

回答:


17

これは良い質問であり、答えに値すると思います。提供されるリンクは、Box-Jenkinsよりも自家醸造法が時系列分析を行うのに適した方法であると主張している心理学者によって書かれています。私の答えへの試みが、時系列についてより知識のある他者に貢献することを奨励することを願っています。

zt=α1zt1++αkztk+εt
ztzt12kar関数。私はそれをテストしましたが、RでARモデルを適合させるためのデフォルトの方法に同様の答えを与える傾向があります。

zttt

しかし、彼はオーバーフィッティングを提唱しているようで、フィッティングされたシリーズとデータの間の平均二乗誤差の減少を、彼の方法が優れている証拠として使用しているようです。例えば:

現在、コレログラムは陳腐化しています。彼らの主な目的は、労働者がどのモデルがデータに最も適合するかを推測できるようにすることでしたが、現代のコンピューターの速度(少なくとも時系列モデルフィッティングでない場合は回帰分析)により、労働者は複数のモデルを簡単に適合させ、正確にどのようにそれぞれが平均二乗誤差で測定されるように適合します。[偶然の大文字の問題は、この選択には関係ありません。2つの方法はこの問題の影響を受けやすいためです。]

モデルのテストは、既存のデータにどれだけ適合しているかではなく、どれだけうまく予測できるかを想定しているため、これは良い考えではありません。彼の3つの例では、フィットの品質の基準として「調整されたルート平均二乗誤差」を使用しています。もちろん、モデルを過剰適合させると、誤差のサンプル内推定が小さくなります。そのため、RMSEが小さいためモデルが「より良い」という彼の主張は間違っています。

一言で言えば、彼はモデルの良さを評価するために間違った基準を使用しているため、回帰対ARIMAについて間違った結論に達します。彼が代わりにモデルの予測能力をテストしていたならば、ARIMAがトップに出ていただろうと、私は賭けていました。おそらく、彼がここで言及した本にアクセスできれば、誰かがそれを試すことができます

[補足:回帰のアイデアの詳細については、ARIMAが最も一般的になる前に書かれた古い時系列の本をチェックしてください。たとえば、ケンドール、 Time-Series、1973、第11章には、この方法とARIMAとの比較に関する章全体があります。]


問題は、(固有の)違いは何ですか?
hbaghishani

私が知る限り、著者は査読付きの出版物で自家醸造法を説明したことはなく、統計文献への参照は最小限であり、方法論のトピックに関する彼の主な出版物は70年代に遡ります。厳密に言えば、これは何も「証明」しませんが、クレームを自分で評価するのに十分な時間または専門知識がなければ、私はそれを使用することを非常に嫌がります。
ガラ

@hbaghishaniの実質的な違いは、自己相関データ、つまり各系列内で相互相関解釈がゆがんでいることです。さらに、ガウスの違反、たとえば、一定のエラーの平均、一定の分散、時間の経過、一定のパラメータの経時変化を考慮する/修正する必要があります。
IrishStat

@flounderer人々は教科書を書いてそれらを販売し、報酬を得る。以前のある時点では正しいと考えられていたため、誤って教えられている時代錯誤的な方法が含まれている場合があります。売り上げを伸ばすために、出版者は(私の個人的な経験から)時代遅れだが間違った方法論を要求することがよくあります。これらの方法はシラバスにあるからです。
IrishStat

@IrishStatの自己相関データのモデリングは、動的回帰モデルによって実行できます。また、このようなデータには、混合モデルなどの他のモデルを使用できます。したがって、この機能は実質的な違いではないと思います。
hbaghishani

7

E. Parzen教授は、おそらくBoxとJenkinsの革新的な方法を提案しなかったことに多少うらやましがり、過剰適合してから辞退するこのアプローチを提案しました。パルス、レベルシフト、季節的パルス、ローカルタイムトレンドを特定および修正しないなど、さまざまな理由で失敗します(多くの場合、Floundererがうまくまとめています)。さらに、経時的なパラメーターの変化または経時的な誤差分散の変化を考慮する必要があります。

あなたが興味を持っているかもしれない作品を書きました。それは「Regression vs Box-Jenkins」と呼ばれ、 http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting。 / doc_download / 24-regression-vs-box-jenkins

予測子として時間、時間*時間、時間*時間*時間*時間を反映するダーリントンの手順に関する1つのコメント。外れ値効果の分離につながる介入検出がない場合、時間のより高い力について結論を出すことは非常に可能です(そして間違っています!)。統計学者が脳外科手術を行うのを警戒するので、統計分析を行う非統計学者に注意してください。公平を期すために、時系列分析の限られたトレーニングで時系列分析を実行しようとする非時系列統計学者/数学者に注意してください。

このリストの他のポスター(特にwhuber)は、主に単変量の設定で、この「フィッティングアプローチ」の使用に対して繰り返し警告しています。この警告は、因果モデルにも適用されます。

お役に立てれば。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.