ANOVAの正規性の仮定からの逸脱:尖度または歪度はより重要ですか?


12

Kutnerらによる線形統計モデルの適用。ANOVAモデルの正規性の仮定から、次に関する逸脱を述べている:誤差分布の尖度は、(どちらか多かれ少なかれ、正規分布よりもピークに達した)推論への影響の点では分布の歪度よりも重要です

私はこの声明に少し戸惑っていて、本やオンラインで関連情報を見つけることができませんでした。裾が重いQQプロットは線形回帰モデルにとって正規性の仮定が「十分」であることを示すのに対し、歪んだQQプロットはより重要である(つまり、変換が適切である)こともわかったため、混乱しています。

同じ推論がANOVAにも当てはまり、それらの単語の選択(推論への影響の観点からより重要)が不適切に選択されただけであることは正しいですか?つまり、歪んだ分布はより深刻な結果をもたらすため、避ける必要がありますが、少量の尖度は許容できる場合があります。

編集:rolando2によって扱われるように、すべての場合において一方が他方よりも重要であると述べることは困難ですが、私は単に一般的な洞察を探しています。私の主な問題は、単純な線形回帰では、F検定がこれに対して非常にロバストであるため、より重いテール(尖度?)を持つQQプロットはOKであることを教えられたことです。一方、歪んだQQプロット(放物線形状)は通常、大きな懸念事項です。これは、ANOVAモデルを回帰モデルに変換でき、同じ仮定を持つ必要があるにもかかわらず、私の教科書がANOVAに提供するガイドラインに直接反するようです。

私は何かを見落としているか、または誤った仮定を持っていると確信していますが、それが何であるかを理解することはできません。


3
尖度のレビューで、DeCarlo(1997)は正反対のことを提案しました。ANOVAや平均の同等性のテストでは、スキューがより重要であるということです。297ページの引用が役立つと思うかもしれません:columbia.edu/~ld208/psymeth97.pdf
アンソニー

1
「スキューネスは尖度よりも推論にとって非常に重要であるため、___のレベルでのスキューネスは、通常___のレベルでの尖度と同じくらい結果を歪める」というようなステートメントに解決できる場合、私は質問を最も生産的だと思います」そのような定量化がなければ、どちらか一方が重要であると言うだけではあまり役に立ちません。
rolando2

このシミュレーションemis.de/journals/HOA/ADS/Volume7_4/206.pdf KhanとRayner(2003)のJOURNAL OF APPLYED MATHMATICS AND DECISION SCIENCESには、「ANOVAとKruskal-Wallisの両方のテストは尖度の影響がはるかに大きい」歪度ではなく誤差分布の」(p。204)。
bsbk

2サンプルのt検定に関する非常に密接に関連する質問-事実上、因子に2つのレベルを持つ一元配置分散分析-stats.stackexchange.com/questions/38967/… ...現在、追加の報奨金があります既存の回答には引用が含まれていないため、この質問の回答者はそれを見てみたいかもしれません。
シルバーフィッシュ

私は@ rolando2に同意します:「歪度は尖度よりも悪い」またはその逆は、歪度/尖度の程度に言及せずにかなり空虚な声明です。しかし、さらに考慮する必要があります!例えば、正規の違反のこれらの種類の頑健性は、部分的に依存し、グループサイズが等しいかどうか、および歪度に対するロバスト性が依存することができます歪度の方向一方のグループには1つのスキュー1の方法であれば、それは悪いことだし、他のグループが偏っ-逆に、両方のグループが同じ方向に歪んでいた場合よりも。(これはメモリからのものであり、t検定です。これはANOVAの一種です。)
シルバーフィッシュ

回答:


6

難点は、歪度と尖度が依存していることです。それらの効果を完全に分離することはできません。

問題は、高度に歪んだ分布の影響を調べる場合、尖度の高い分布も必要になることです。

2+1

*(過剰な尖度ではなく、通常のスケーリングされた第4モーメント尖度)

カーンとレイナー(以前の回答で言及されています)は、歪度と尖度の影響をある程度調査できる家族と連携しますが、この問題を回避することはできないため、それらを分離しようとする試みは、歪度を調べることができます。

β2β21

たとえば、歪度が5を超えるなど、歪度が高い場合の効果を確認する場合、尖度が26未満の分布を取得することはできません

したがって、高歪度の影響を調査したい場合、高尖度の影響の調査を避けることはできません。したがって、それらを分離しようとすると、実際には、歪度を高レベルに増加させる効果を評価できなくなります。

とはいえ、少なくとも彼らが検討した流通ファミリについては、それらの間の関係がもたらす限界内で、カーンとレイナーによる調査は尖度が主な問題であることを示唆しているようです。

ただし、結論が完全に一般的であっても、(たとえば)歪度5の分布がある場合、「問題は歪度ではありません!」と言うのは少し安らいでしょう。-歪度がたら>2


11

この問題は、KhanとRaynerによる「多数サンプルの場所の問題に対する一般的なテストの非正規性に対する堅牢性」で対処されています。

彼らは、ANOVAテストは歪度よりも尖度の影響を大きく受けており、歪度の影響はその方向とは無関係であることを発見しました。

正規性からの逸脱が疑われる場合、クラスカル・ワリス検定がより適切な選択である可能性があります。Kruskal-Wallis検定は、治療の中央値が同一であるという仮説を検証するため、正規性からの逸脱に対してより堅牢です。ANOVAは、治療手段が同一であるという仮説を検証します。


これは、線形回帰とANOVAについてQQプロットを異なる方法で解釈する必要があることも示していますか?私が行った変換の大部分は歪度を低減しましたが、わずかに重い尾(=尖度?)を残しました。私は、F検定は前者ではなく後者に対処するのに十分堅牢であるという印象を受けていました。または、この「重い尾は問題ありません」は私の側の誤解ですか?ANOVAモデルは線形回帰モデルとして書き直すことができるため、この2つの間に根本的な違いがあるとは想像できません。
ゼニット
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.