生データで回帰的なモデ​​ルの仮定をテストする人と、残差でテストする人がいるのはなぜですか?


12

私は実験心理学の博士課程の学生であり、データの分析方法に関するスキルと知識の向上に努めています。

心理学の5年目まで、私は回帰的モデル(ANOVAなど)が次のことを想定していると考えていました。

  • データの正常性
  • データの分散均一性など

私の学部課程では、仮定はデータに関するものであると信じるようになりました。しかし、私の5年目に、私のインストラクターの何人かは、仮定が生データではなく誤差(残差によって推定される)についてであるという事実を強調しました。

最近、私の同僚の何人かと仮定の質問について話していました。同僚も、大学の最後の年にのみ残差の仮定をチェックすることの重要性を発見したことを認めました。

私がよく理解していれば、回帰的なモデ​​ルはエラーを仮定しています。したがって、残差の仮定を確認することは理にかなっています。もしそうなら、なぜ一部の人々は生データの仮定を確認しますか?そのようなチェック手順は、残差をチェックすることで得られるものに近いためでしょうか?

私はこの問題について、同僚や私よりも正確な知識を持っている人たちと議論することに非常に興味を持っています。あなたの答えを前もって感謝します。

回答:


13

基本的に、あなたは正しい軌道に乗っています。従属変数の正規性=残差の正規性に正規性の側面に関する議論がありますか?

古典的な線形モデルのいくつかの仮定は、実際には誤差に関するものです(それらの実現として残差を使用):

  • それらは無相関ですか?(OLS推定器の推論と最適性に関連)
  • それらは等しい分散を持っていますか?(OLS推定器の推論と最適性に関連)
  • それらは0を中心にしていますか?(公平な推定量と予測を得るための重要な仮定)
  • サンプルが非常に小さい場合:それらは正常ですか、少なくとも対称的に分布していますか?(推論に関連)

その他の条件は「生データ」に関するものです。

  • 回帰変数に大きな異常値はありませんか?(高レバレッジの観測はモデル全体を破壊する可能性があります)
  • 完全な多重共線性はありませんか?(少なくとも一部のソフトウェアパッケージでは、計算上の問題が発生します)

今、あなたの学部の先生も正しいかもしれません:

  • たぶん、あなたは1標本t検定のような単変量検定に焦点を合わせていたかもしれません。そこでは、生データに関する仮定があります。
  • R2
  • 生データに基づいて等分散性などをどのようにチェックしますか?たぶんあなたは彼または彼女を誤解したでしょう。

回答と、非常に役立つリンクに感謝します。私の同僚の何人かと私は、生データの分散が等しいはずだと最近まで信じていました。あなたが言ったように、私たちはコースで何かを見逃したかもしれません。一部の本では、次のことを読むことができます
。– Psychokwak

「最も一般的な統計手順では、このトピックに関連する2つの仮定を行います。(a)変数(または技術的にはエラー項)が正規分布しているという仮定、および(b)分散の等式(同相性または均一性変数の分散は、他の変数の観測範囲全体で一定のままであることを意味します。」「可変」について話すとき、彼または彼女は「彼らのエラー用語」について体系的に話すことを意味しますか?もしそうなら、私はそれで大丈夫ですが、明示的な言及がなければ、それは明らかではありません(少なくとも私にとって)。
サイコクワック

最後に、あなたの答えについて最後の質問があります。t検定とANOVAが回帰の特定のケースである場合、1サンプルt検定のデータに関する仮定が必要なのはなぜですか?有益な回答をありがとうございます。
サイコクワック

1
最後のコメントに答えるには:1サンプルのt検定は、回帰の特殊なケースと見なすこともできます。モデルは、インターセプト(=平均)と誤差項で構成されています。つまり、応答はシフト誤差です。シフトは仮定とは無関係であるため、データまたは残差について話すのと同じです。
マイケルM

4

残差と生データの区別は役に立たないことがわかります。両方とも、基礎となる母集団分布ではなく実際のサンプルを参照しているためです。いくつかの要件は「グループ内の要件」であり、他の要件は「グループの仮定の間」であると考える方が適切です。

たとえば、分散の同質性は「グループ間仮定」です。これは、グループ内の分散がすべてのグループで同じであると言うためです。

正規性は「グループ内」の仮定であり、各グループ内でyが正規分布している必要があります。

生のy全体に正規性を持たせることは、通常、効果がないことを意味することに注意してください。女性と男性を区別せずに性別の分布を見てください。性別の影響が大きいため、正規分布しません。しかし、それぞれの性別の中で、それは非常によく成り立っています。


1
あなたの答えもありがとう。質問を見るのに面白い方法です。このような方法で正規性について考えたことはありませんでした(つまり、「生のy全体に正規性があるということは、通常は効果がないことを意味する」)。
サイコクワック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.