サンプルの均一性は回帰分析の仮定ですか?


8

私は、回帰分析ではサンプルが均質であると想定していると想定しました(つまり、覚えていたよりもずっと前に、私は教えられたと思います)。そうでない場合は、サンプルに含まれているさまざまなグループのコードにダミー変数を追加するか、ANCOVAを実行してグループパラメータが等しいかどうかをテストするのが適切です。サンプルの不均一性を無視すると、回帰分析が無効になりますか?

回答:


8

サンプルは、典型的には、誤差項があるという意味で均質であると仮定される、式中、Y I = β 0 + β 1 X 1 + β 2 X 2 + ... + ε iは、以下の条件をsatisify。ϵiyi=β0+β1x1+β2x2++ϵi

  1. すべてに平均ゼロがあります:すべてのiに対して0E(ϵi)=0i
  2. Cov(ϵi,ϵj)=0ij
  3. Cov(ϵi)=σ2i

これらはガウスマルコフ条件として知られており、通常の最小二乗推定量が適切に機能することを保証します(不偏、最良の線形不偏推定量...)。

異なるグループからの観測があっても、これらの条件は満たされることに注意してください。しかし、多くの場合、そうではありません。グループ間で平均に違いがある場合、1番目と2番目の条件に違反します。グループ内に相関がある場合、2番目の条件に違反します。グループの差異が異なる場合、3番目のグループは違反になります。

ガウスマルコフ条件の違反は、あらゆる種類の問題を引き起こす可能性があります。非一定分散の結果のいくつかについては、分散性に関するウィキペディアのページを参照してください

変換は3番目の条件が満たされない場合に役立ちますが、異なるグループが条件1と2で問題を引き起こす場合は、グループのダミー変数を追加するか、ANCOVAを使用する方が合理的です。


1
E(ε)=0

何かが間違っているからではなく、MansTによる後者の回答が、Ray Carrollの本に記載されている分散関数のモデリングに関する部分を除いて、より完全にカバーしているため、私の回答を削除しています。
マイケルR.
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.