私は現在、データ工学の修士号を取得するために勉強しているビジネスと経済学を卒業しています。線形回帰(LR)を研究してから、時系列分析(TS)を研究しているときに、疑問が浮かびました。多重線形回帰を使用し、それにラグ変数を追加するのではなく、時系列(ARIMA)などのまったく新しいメソッドを作成する理由(ラグの順序はACFとPACFを使用して決定)?そこで、先生は私がこの問題について少しエッセイを書くことを提案しました。私は手ぶらで助けを求めに来ませんでしたので、私はこのトピックに関する研究を行いました。
LRを使用する場合、ガウスマルコフの仮定に違反すると、OLS回帰は正しくないこと、そしてこれは時系列データ(自己相関など)を使用するときに発生することを既に知っていました。(これに関する別の質問、GMの仮定の1つは、独立変数を正規分布させるべきか、それとも独立変数の条件付き従属変数だけかということです。)
また、ここで提案している分散ラグ回帰を使用し、OLSを使用してパラメーターを推定すると、変数間の多重共線性が(明らかに)発生する可能性があるため、推定が間違っていることもわかっています。
でTSとLRについて同様のポストここで、@IrishStatは言いました:
...回帰モデルは、動的回帰モデルまたはXARMAXモデルとも呼ばれる伝達関数モデルの特定のケースです。際立ったポイントは、時系列でのモデルの識別、つまり、適切な違い、Xの適切なラグ、適切なARIMA構造、パルスなどの不特定の決定論的構造の適切な識別、レベルシフト、ローカル時間傾向、季節的パルス、および組み込みです。パラメータの変化またはエラー分散を考慮する必要があります。
(私はBox JenkinsとLRについてのAutoboxの彼の論文も読んでいます。)しかし、これでも私の疑問は解決しません(または、少なくとも私にとってRLとTSの異なるメカニズムを明確にしません)。
遅れた変数でもOLS問題が発生し、効率的でも正確でもないことは明らかですが、最尤法を使用する場合、これらの問題は持続しますか?ARIMAは最尤法で推定されることを読んだので、遅れのあるLRがOLSではなくMLで推定される場合、「正しい」係数が得られます(順序のMAのように、遅延誤差項も含めると仮定します) q)。
要するに、問題はOLSですか?MLを適用して問題は解決しましたか?