正規性の仮定に対してF検定がそれほど敏感なのはなぜですか?


16

が大きい場合でも、分散の差のF検定が正規分布の仮定に非常に敏感なのはなぜですか?N

私はウェブを検索してライブラリーにアクセスしようとしましたが、良い答えはありませんでした。このテストは、正規分布の仮定の違反に対して非常に敏感であると言っていますが、その理由はわかりません。誰かがこれに対して良い答えを持っていますか?


6
どの テストFに興味がありますか?
回復モニカ- S. Kolassa

分散の差を測定するためのF検定。
マグナスヨハネ

回答:


35

サンプルの分散のペアの等値性をテストするとき、分散比のF検定を意味すると思います(これは、正規性に非常に敏感な最も単純なものであるため、ANOVAのF検定はそれほど敏感ではありません)

サンプルが正規分布から引き出される場合、サンプル分散はスケーリングされたカイ二乗分布を持ちます。

正規分布から引き出されたデータの代わりに、正規よりも裾が重い分布があったと想像してください。次に、そのスケーリングされたカイ二乗分布に比べて非常に多くの大きな分散を取得します。そして、サンプル分散が右端に出る確率は、データが描画された分布の裾に非常に敏感です。(小さな分散が多すぎることもありますが、その影響はそれほど顕著ではありません)

両方のサンプルがより重いテール分布から引き出される場合、分子の大きいテールは過剰な大きなF値を生成し、分母の大きなテールは過剰な小さなF値を生成します(左テールの場合その逆

両方のサンプルの分散が同じあっても、これらの効果は両方とも両側検定で棄却される傾向があります。これは、真の分布が通常よりも裾が重い場合、実際の有意水準が必要以上に高くなる傾向があることを意味します。

逆に、より裾の薄い分布からサンプルを描画すると、裾が短すぎるサンプル分散の分布が生成されます。分散値は、正規分布のデータを使用する場合よりも「中程度」になる傾向があります。繰り返しますが、衝撃は下尾よりもはるかに上尾で強くなります。

両方のサンプルがその裾の狭い分布から引き出されると、中央値付近でF値が過剰になり、いずれの尾でも数が少なすぎます(実際の有意水準は望ましい値よりも低くなります)。

これらの効果は、サンプルサイズが大きくても必ずしも大幅に減少するとは限りません。場合によっては悪化するようです。

部分的な説明として、正規分布、分布および均一分布の10000サンプル分散()を、と同じ平均を持つようにスケーリングしてい。n=10t5χ92

ここに画像の説明を入力してください

遠い尾はピークに比べて比較的小さいため(そして、の場合、尾の観測値はプロットした場所をかなり過ぎて広がっているため)遠い尾を見るのは少し難しいですが、分散の分布。これらをカイ二乗累積分布関数の逆数で変換することは、おそらくさらに有益です。t5

ここに画像の説明を入力してください

これは通常の場合は均一に見えますが(そうあるべきです)、tケースでは上部の尾部に大きなピークがあり(そして下部の尾部に小さなピークがあります)、均一の場合はより丘のようですが広いピークは0.6から0.8付近であり、正規分布からサンプリングした場合の極端な可能性ははるかに低くなります。

これらは、前述の分散比の分布に影響を及ぼします。繰り返しますが、テールへの影響を確認する能力を向上させるために(見づらい場合があります)、cdfの逆関数(この場合は分布の場合)で変換しました。F99

ここに画像の説明を入力してください

両側検定では、F分布の両側を調べます。から描画する場合は両方のテールが過剰に表示され、ユニフォームから描画する場合は両方が過小表示されます。t5

完全な調査のために調査する他の多くのケースがありますが、これは少なくとも効果の種類と方向、およびそれがどのように発生するかの感覚を与えます。


1
本当にいいデモ
-shadowtalker

3

Glen_bは彼のシミュレーションで見事に例示した、分散の比率のためのF検定は、分布の尾に敏感です。これは、サンプル分散の分散が尖度パラメーターに依存するため、基礎となる分布の尖度がサンプル分散の比率の分布に強い影響を与えるためです。

SN2Sn2n<N

SN2Sn2およそn1N1+NnN1FDFCDFn

κ

DFn=2nκn3/n1DFC=2Nn2+κ312/N+1/Nn

κ=3DFn=n1DFC=Nn

κ^


N1N


+1これは非常に興味深い投稿です。確かに中間屈折分布では、全範囲の分布選択で可能な限り分散比分布をFからできるだけ遠ざけることは難しくなりますが、ケースを識別することはそれほど難しくありません(私の回答のサンプルサイズで、10 10)実際のタイプIのエラー率は、公称0.05率から少し離れています。私が試した最初の3つのケース(人口尖度= 3の分布-すべて対称)は、タイプIの拒否率が0.0379、0.0745、0.0785でした。... ctd
Glen_b -Reinstate Monica

ctd ...近似を悪化させる方法を少し考えれば、より極端なケースを特定できることはほとんど疑いありません。ただし、大きなサンプルでは有意性レベルがそれほど影響を受けないことを想像してください。
Glen_b-モニカの復活
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.