2x2 ANOVAで正規性をテストする方法は?


8

研究デザイン:海面上昇に関するいくつかの情報を参加者に示し、時間スケールと潜在的な上昇の大きさの両方の観点から、さまざまな方法で情報に焦点を合わせました。したがって、2(時間:2050または2100)x 2(マグニチュード:中または高)のデザインがありました。情報を受け取らなかった2つのコントロールグループもあり、私のDVへの質問に答えるだけでした。

質問: 私は常にセル内の正規性をチェックしました。このデザインの2x2の部分では、4つのグループ内の正規性を探すことになります。ただし、ここでいくつかの議論を読んだことで、自分の方法を2番目に推測してしまいました。

最初に、私は残差の正規性を見なければならないことを読みました。(SPSSまたはその他の場所で)残差の正規性を確認するにはどうすればよいですか?4つのグループ(コントロールを含めて6つ)ごとにこれを行う必要がありますか?

また、グループ内の正規性は残差の正規性を意味することも読みましたこれは本当ですか?(文献参照)繰り返しますが、これは4つのセルのそれぞれを個別に見ることを意味しますか?

つまり、(2x2)データが正常性の仮定に違反していないかどうかを判断するためにどのような手順を実行しますか?

たとえ私を正しい方向に向けるだけであっても、参照は常に高く評価されています。

回答:


6

ほとんどの統計パッケージには、モデルから残差を保存する方法があります。GLM - UNIVARIATESPSSで使用すると、残差を保存できます。これにより、各観測の残差を表す変数がデータファイルに追加されます。

残差を取得したら、それらを調べて、それらが正規分布であるか、等分散性であるかなどを確認できます。たとえば、残差変数に対して正式な正規性検定を使用したり、おそらくより適切には、残差をプロットして正規性からの大きな逸脱をチェックしたりできます。等分散性を調べたい場合は、グループごとに残差を調べたプロットを取得できます。

ANOVAのモデルはグループ平均を予測するため、セル内の正規性は残差の正規性を意味します。したがって、残差はグループの平均と観測されたデータの違いにすぎません。

以下のコメントへの応答:

  • 残差は、モデル予測に関連して定義されます。この場合、モデル予測はセル平均です。個々のセル平均をプロットするのではなく残差をプロットすることに焦点を当てれば、この特定のケースではそれらが基本的に同じであるとしても、これは仮定テストについてより一般的な方法です。たとえば、共変量(ANCOVA)を追加する場合、残差はセル内の分布よりも調べるのに適しています。
  • 正規性を調べるために、標準化された残差と標準化されていない残差は同じ答えを提供します。標準化された残差は、データによってモデル化が不十分なデータ(つまり、外れ値)を識別しようとする場合に役立ちます。
  • 分散の均一性と等分散性は、私が知っている限り同じことを意味します。繰り返しになりますが、グループ/セル全体の分散を比較することにより、この仮定を調べるのが一般的です。あなたの場合、各セルの残差の分散を計算するか、各セルの生データに基づいて計算するかに関係なく、同じ値が得られます。ただし、y軸に残差をプロットし、x軸に予測値をプロットすることもできます。これは、共変量を追加する場合や重回帰を行う場合など、他の状況にも適用できるため、より一般化可能なアプローチです。
  • 異分散性(つまり、セル内の分散が母集団内のセル間で異なる)と、セル内の正規分布残差がある場合、その結果よりも低いポイントが発生しました。結果のすべての残差の分布は非正規になります。結果は、平均がゼロの変数の混合分布と、セルサイズに対する比率を持つ異なる分散になります。結果の分布にはスキューはありませんが、おそらくある程度の尖度があります。残差を対応するセル内標準偏差で割ると、異分散性の影響を取り除くことができます。結果の残差をプロットすると、残差が通常の分散とは無関係に分布するかどうかの全体的なテストが提供されます。

ああ、はい、どうやって保存するかわかります。私はあなたが言うことから、それが節約するものはグループごとの残差であると仮定しています-つまり、セルからのサンプル値の差であり、総平均ではありません。標準化または非標準化残差を調べる必要がありますか?しかし、それが細胞内の正常性を調べることと同等である場合、なぜ残差を調べるのですか?これは確かに簡単です。そして最後に、あなたは同等分散性について言及します。私は通常、細胞間の分散の均一性をチェックします。これは残差の検査も必要になるかもしれませんか?
リー

@リーオーケー。私はあなたのコメントに返信するために私の答えを編集しました。
Jeromy Anglim

+1、本当にたくさんの良い情報がここにあります。1つ目の注意点として、3番目の箇条書きの一部を解析できません。いくつかの編集が役立つ場合があります。
gung-モニカの復活

@gungフィードバックをありがとう。ポイント3をもう少し明確にするために、少し編集を加えました。
Jeromy Anglim、2012年

ありがとう。ここにはたくさんの素晴らしい情報があります。(セル内の)生データの正規性を見るという私の習慣から抜け出すのは難しいでしょうが、私は確かに将来の分析のために残差を考慮します。
リー

3

それを強調する多くの入門教科書にもかかわらず、あなたは正常性を必要としません。適度なサンプルサイズと各グループ内の同じ分散、つまりホモスケダシティで、ANOVAはグループ間の平均応答の違いを正確に推測します。非一定の分散を疑う理由があり、その可能性がある場合は-不均一分散一貫性のある標準誤差を使用できます。

これらのプロパティは、t検定でよく知られているものの拡張です。一定の分散を使用すると、正規性(フィッシャーが知っている結果)に関係なく、「単純バニラ」t検定を使用できます。非一定の分散を使用すると、不平等分散も正常性なしで正常に機能します。不等分散バージョンは、不均一分散一貫性のある標準誤差を使用するWald検定と同等です。


正常性は問題ではないとあなたが言う理由は何ですか?ANOVAとt検定はどちらも歪度に非常に敏感です。基になる分布が非対称である場合、サンプルサイズが小さい場合はどちらの方法も使用しないでください。
MånsT

このステートメントをサポートするリファレンス、特に最近のリファレンスを調べていただければ幸いです。しかし、そのような参照がなければ、私はほとんどの教科書に頼らなければなりません。
リー

2
ここに1つの参照があります。極端な例を挙げて、彼らは実際にメソッドを壊そうとしていることに注意してください。極端なデータが少ない場合でも、すべてのサンプルは適度なサイズで機能します。(一般化された)線形モデルに関するMcCullaghとNelderの古典的なテキストを参照することもできます。この場合、重要な仮定であるため、「一定の分散」モデルによる線形回帰を注意深く説明します。堅牢な標準誤差については、導入計量経済学のテキストを参照してください。STATAソフトウェアのドキュメントも良い情報源です。
ゲスト
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.