断面データでOLS回帰を実行する場合、残差の自己相関をテストする必要がありますか？

時間に関係なく、一連の観察結果があります。自己相関テストを実行する必要があるかどうか疑問に思っていますか？私のデータには時間コンポーネントがないので、それは意味がないように思えます。しかし、実際にシリアル相関LMテストを試したところ、残差の強い自己相関が示されました。それは意味がありますか？私が考えていることは、実際にデータセット内の観測値を可能な限り任意の順序に並べ替えることができ、これにより残差の自己相関が変化することです。だから問題は-この場合、自己相関についてまったく気にする必要がありますか？また、テストで示されている場合、Newey-Westを使用してSEを調整する必要がありますか？ありがとう！

— ユーザー28479
ソース

時間コンポーネントがないと、残差を連続的に相関させることができないと正しく述べました。したがって、この場合のシリアル相関のテストは無効です。断面データで最も一般的な問題は、不均一性または空間相関です（たとえば、A市の犯罪率はB市の犯罪率に影響します）。

— アンディ

シリアル相関または自己相関という用語を使用せずに、これを言い換えてみましょう。回帰モデルの従属変数には、条件付き分散行列があります。つまり、独立変数を条件とします。行列の対角要素、つまりyの要素の条件付き分散がゼロ以外になることを期待しています。モデルが断面の場合、非対角要素、つまりyの要素のペアの共分散がゼロでなければならないことを推測できますか？確かに、時系列解釈の欠如はこの可能性を排除しませんが、可能性を低くする可能性はありますか？

— アダムベイリー

... Andyが示唆する1つの例は、空間的に関連する要素間の共分散です。考えられる非空間の例は、依存変数が異なる国のGNPである（同時に）場合であり、遠く離れた2つの国が（たとえば、歴史的な理由により）密接な貿易関係を結んでいる可能性があり、その結果共分散がゼロになります。

— アダムベイリー

データにクラスターがある場合、横断的な依存が可能です。@Andyの提案に従って、SEを調整できます。クラスターロバストSEに関する注意点の1つは、データ内の各クラスターが小さく、多くのクラスターが観測されている場合、ロバストSEが機能することです。ただし、いくつかの大きなクラスターがある場合、クラスターの堅牢なSEは無効です。実際、大規模なクラスターの場合、プールされたOLSが不整合になる可能性があります。Andrews（2005、Econometrica）を参照してください。

— 2013

データ間の真の違いは、実際の構造に対応する自然な順序付けが存在するかどうかであり、当面の問題に関連しています。

もちろん、最も明確な（そして議論の余地のない）「自然な順序」は時間の順序であり、したがって通常の二分法の「断面/時系列」です。しかし、コメントで指摘されているように、自然な空間順序を持っている非時系列データがある場合があります。そのような場合、意味のある空間的順序が存在することを認識し、それを保持するだけでなく、それが何を意味するかも検討するため、時系列分析のコンテキストで開発されたすべての概念とツールがここでも等しく適用されます。一連のエラー項、特にモデル全体に関連するもの（たとえば、傾向の存在など、データを非定常にする）

（粗雑な）例として、高速道路に沿ったさまざまな立ち寄り施設で特定の日に停止した車の数に関するデータを収集するとします（これは従属変数です）。リグレッサーは、各立ち寄り先が提供するさまざまな施設/サービスを測定し、高速道路の出口/入口からの距離などの他のものも測定します。これらの施設は自然に高速道路に沿って注文されています...

しかし、これは問題ですか？順序を維持する必要があります。エラー項が自己相関しているかどうかも疑問に思いますか？確かに：施設No 1の一部の施設/サービスは、この特定の日中は実際には機能していないと想定します（このイベントはエラー期間によってキャプチャされます）。これらの特定の施設やサービスを使用する予定の車は、問題について知らないため、立ち寄ります。しかし、彼らは問題について知ることになるので、問題のために、彼らは次の施設、No 2にも立ち寄ります。彼らが望んでいるものは提供され、彼らはサービスを受け、彼らは設立3号で止まらない-しかし、設立2は高価に見える可能性があるので、結局、彼らは設立3も試してみるでしょう：この手段3つの所の従属変数は、対応する3つの誤差項の相関の可能性があると言うことに相当する、独立して、なくてもよいことはない「均等」が、それぞれの位置に応じ。

そのため、空間的な順序が保持され、自己相関のテストを実行する必要があります-そしてそれらは意味があります。

一方、そのような「自然な」意味のある順序付けが特定のデータセットに存在しないように見える場合、観測間の可能な相関は誤解を招く可能性があるため、「自己相関」として指定しないでください。データは対象外です。しかし、相関は非常によく存在するかもしれませんが、そのような場合、それを検出して推定することはかなり困難です。

— アレコスパパドプロス
ソース