他のパラメトリックテストと同様に、分散分析では、データが正規分布に適合すると仮定しています。測定変数が正規分布していない場合、正規性を前提とするanovaまたはその他のテストでデータを分析すると、誤検出の可能性が高くなる可能性があります。幸いなことに、アノーバは正規性から中程度の逸脱に対してあまり敏感ではありません。さまざまな非正規分布を使用したシミュレーション研究では、この仮定の違反によって偽陽性率があまり影響を受けないことが示されています(Glass et al。1972、Harwell et al。1992、Lix et al。1996)。これは、母集団から多数のランダムサンプルを取得すると、母集団が正常でない場合でも、それらのサンプルの平均がほぼ正規分布するためです。
正規分布に対するデータセットの適合度をテストすることができます。これを行うことはお勧めしません。なぜなら、非常に非正常な多くのデータセットは、anovaに完全に適しているからです。
代わりに、十分な量のデータセットがある場合は、頻度ヒストグラムを確認することをお勧めします。多かれ少なかれ正常に見える場合は、先に進み、分散分析を実行します。上記の硫酸塩データのように、片側にプッシュされた正規分布のように見える場合は、異なるデータ変換を試して、ヒストグラムがより正規に見えるかどうかを確認する必要があります。それが機能せず、データが依然として非常に非正常に見える場合、anovaを使用してデータを分析しても大丈夫でしょう。ただし、ノンパラメトリックテストを使用して分析することもできます。ほぼすべてのパラメトリック統計検定には、一元配置のanovaの代わりにKruskal–Wallis検定、ペアのt検定の代わりにWilcoxonの符号付きランク検定、線形回帰の代わりにスピアマンの順位相関などのノンパラメトリック代替があります。これらのノンパラメトリック検定では、データが正規分布に適合するとは想定していません。ただし、異なるグループのデータは互いに同じ分布を持っていると想定しています。異なるグループが異なる形状の分布を持っている場合(たとえば、1つが左に傾いており、別のグループが右に傾いている)、ノンパラメトリックテストはパラメトリックテストよりも優れているとは限りません。
参照資料
- Glass、GV、PD Peckham、およびJR Sanders。1972.分散および共分散の固定効果分析の基礎となる仮定を満たさなかった場合の結果。牧師教育 解像度 42:237-288。
- Harwell、MR、EN Rubinstein、WS Hayes、およびCC Olds。1992.方法論研究におけるモンテカルロ結果の要約:1因子および2因子の固定効果ANOVAケース。J.エデュック。統計 17:315-339。
- Lix、LM、JC Keselman、HJ Keselman。1996.想定違反の結果の再検討:一元配置分散分析F検定の代替案の定量的レビュー。牧師教育 解像度 66:579-619。