非正規分散DVのANOVA結果を信頼できますか?


22

反復測定ANOVAを使用した実験を分析しました。ANOVAは、被験者間要因が2つ、3つ以内(N = 189)の3x2x2x2x3です。エラー率は従属変数です。エラー率の分布は、スキューが3.64、尖度が15.75です。スキューと尖度は、エラー率の90%が0であることの結果です。ここで、正規性テストで以前のスレッドの一部を読むと、少し混乱します。正規に配布されていないデータがある場合は、可能であれば変換するのが最善であると考えましたが、多くの人が、ANOVAまたはT検定で非正規データを分析することは受け入れられると考えているようです。ANOVAの結果を信頼できますか?

(FYI、将来的には、二項分布の混合モデルを使用してRのこのタイプのデータを分析する予定です)


1
これらのスレッドのいくつかにリンクできますか?私の直感は「NOOO no no no」ですが、私はほとんど専門家ではなく、これらの議論のいくつかを読むことに興味があります。
マットパーカー

4
これらの種類のデータを使用して、F分布から派生したp値を信頼することはできません。
whuber

3
多くの人は、ANOVAの堅牢性を非正規データで使用する理由として挙げています。私見、堅牢性はテストの一般的な属性ではありませんが、a)その仮定の違反に対してテストが堅牢である(正規性、球形性、...)、b)これらの違反にはどの程度大きなものがないかを正確に述べる必要があります効果、c)堅牢性を示すためのテストの前提条件(セルサイズが大きくて等しい...)。分割プロットの設計では、共分散行列の球形性と等価性の正確な仮定を誰かに述べてもらいたいと思います。2階乗の場合、すでに気が遠くなります。
カラカル

3
@Matt残差の90%がゼロのように聞こえます。その場合、変換は、残差をリモートで正常に近づけることはありません。シミュレーション研究により、F検定のp値は正規性からの偏差に非常に敏感であることが示されています。(あなたの場合、F検定のいくつかの分母はゼロになる可能性がかなり高い:物事がどこまでうまくいかないかの鋭い指標。)別のアプローチが必要です。何をするかは非常に多くの残差がゼロである理由によって異なります。測定の十分な精度の欠如?
whuber

2
データがカウントであると仮定すると、@ Mattはより適切に聞こえます。もう1つの魅力的な考慮事項は、ゼロで膨らんだ負の二項応答(ats.ucla.edu/stat/r/dae/zinbreg.htm)です。
whuber

回答:


20

他のパラメトリックテストと同様に、分散分析では、データが正規分布に適合すると仮定しています。測定変数が正規分布していない場合、正規性を前提とするanovaまたはその他のテストでデータを分析すると、誤検出の可能性が高くなる可能性があります。幸いなことに、アノーバは正規性から中程度の逸脱に対してあまり敏感ではありません。さまざまな非正規分布を使用したシミュレーション研究では、この仮定の違反によって偽陽性率があまり影響を受けないことが示されています(Glass et al。1972、Harwell et al。1992、Lix et al。1996)。これは、母集団から多数のランダムサンプルを取得すると、母集団が正常でない場合でも、それらのサンプルの平均がほぼ正規分布するためです。

正規分布に対するデータセットの適合度をテストすることができます。これを行うことはお勧めしません。なぜなら、非常に非正常な多くのデータセットは、anovaに完全に適しているからです。

代わりに、十分な量のデータセットがある場合は、頻度ヒストグラムを確認することをお勧めします。多かれ少なかれ正常に見える場合は、先に進み、分散分析を実行します。上記の硫酸塩データのように、片側にプッシュされた正規分布のように見える場合は、異なるデータ変換を試して、ヒストグラムがより正規に見えるかどうかを確認する必要があります。それが機能せず、データが依然として非常に非正常に見える場合、anovaを使用してデータを分析しても大丈夫でしょう。ただし、ノンパラメトリックテストを使用して分析することもできます。ほぼすべてのパラメトリック統計検定には、一元配置のanovaの代わりにKruskal–Wallis検定、ペアのt検定の代わりにWilcoxonの符号付きランク検定、線形回帰の代わりにスピアマンの順位相関などのノンパラメトリック代替があります。これらのノンパラメトリック検定では、データが正規分布に適合するとは想定していません。ただし、異なるグループのデータは互いに同じ分布を持っていると想定しています。異なるグループが異なる形状の分布を持っている場合(たとえば、1つが左に傾いており、別のグループが右に傾いている)、ノンパラメトリックテストはパラメトリックテストよりも優れているとは限りません。

参照資料

  1. Glass、GV、PD Peckham、およびJR Sanders。1972.分散および共分散の固定効果分析の基礎となる仮定を満たさなかった場合の結果。牧師教育 解像度 42:237-288。
  2. Harwell、MR、EN Rubinstein、WS Hayes、およびCC Olds。1992.方法論研究におけるモンテカルロ結果の要約:1因子および2因子の固定効果ANOVAケース。J.エデュック。統計 17:315-339。
  3. Lix、LM、JC Keselman、HJ Keselman。1996.想定違反の結果の再検討:一元配置分散分析F検定の代替案の定量的レビュー。牧師教育 解像度 66:579-619。

7
ここで自分の無知を示​​しているかもしれませんが、ANOVAの背後にある残差は正常であるという仮定ではないでしょうか?その場合、残差がパターンに適合する限り、変数自体が非正常であるかどうかは実際には関係ありません。
-richiemorrisroe

5
おそらく質問は編集されたかもしれませんが、なぜこの答えが支持され受け入れられたのか、私には本当にわかりません。それはまともな一般的なアドバイスですが、「スキューと尖度はエラー率の90%が0であることの結果である」というこの特定のケースとはほとんど関係がありません。この場合、答えはノー、ノー、ノーでなければなりません。
エリック

8

具体的には、エラー率をDVとして、Dixon(2008)は、ANOVAを介した帰無仮説のテストが、誤警報率の増加(そうでない場合に効果を「有意」と呼ぶ)ミス率の増加(実際の効果を失う)の両方を引き起こすことを非常に慎重に実証しています。また、二項分布誤差を指定する混合効果モデリングが、レートデータを分析するためのより適切なアプローチであることも示しています。


4

そのようなスキューと多数の0を持つANOVAを信頼することはできません。より適切な方法は、DVとしてエラーの数を使用し(DVをカウントデータに変換する)、ポアソン分析を行うことです。このアプローチでは、混合効果分析を使用し、エラー分布ファミリーをポアソンとして指定する必要があります。ディクソン(2008) *マイク・ローレンスが言及した記事は、Rではなく、二項転帰と混合効果分析を使用しています。結果変数の多くは二項分布であるため、繰り返し測定分析のほとんどでRを使用することに完全に移行しました。適切なRパッケージはlme4です。


2

Juanは多くを提供しましたが、他のものをエコーし​​、残余がそうでない限り、最高の正確さのために変数自体が非正常であり得ることを繰り返します。また、簡略化され、少し構造化された回答(注釈付きのフローチャートによる)がyellowbrickstats.comで入手できます。


1
申し訳ありませんが、私から-1。これは一般的に真実ですが、ゼロのインフレーションがある場合、残差はそうなりません。答えは一般性だけでなく、特定の問題を扱うべきだと思います。
エリック

1

ここでは天井効果が問題です。ノンパラメトリック検定は最も安全な賭けです。ただし、nが大きい場合、ANOVAはこの正規性の違反に対して堅牢です。通常、人々はこれをテストするためにヒストグラムを使用しますが、問題が残差にある場合、それよりも進んでいる可能性があります。また、これが結果にどのように影響するかを念頭に置いてください(それだけでなく)。Pallant(2007)は、おそらくこれによりタイプ1のエラーが発生する可能性が高くなると言うでしょう。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.