正規分布データでノンパラメトリックテストを使用するとどうなりますか?


8

Shapiro-WilkテストのタイプIエラーがメインの分析に影響を与えるかどうか、また、データが正常に分布しているかどうかが問題になるかどうかに関係なく、間違ったテストが使用されるかどうかを尋ねられました...


@a_statistician-それを少し拡大して回答として投稿したいかもしれません。
jbowman 2018

回答:


14

統計分析では、データがパラメトリック分布に従う場合、その分布を知ることの利点を活用し、その分布に基づく統計的手法を採用する必要があります。

ただし、確率変数の分布がわからない場合があるため、効率を犠牲にして広範囲の分布を採用するためにノンパラメトリック統計手法が開発されました。

確率変数の分布がわかっていて、分布の把握に基づくパラメトリック統計手法ではなく、ノンパラメトリック統計手法を使用すると、非効率になります。つまり、検定の検出力が低下し、標準誤差が増大し、信頼区間がパラメトリック法よりも広くなります。


12

データが通常の母集団から抽出された場合(および通常のt検定の他の通常の仮定が適用される場合)、テストは正常に機能します(ノンパラメトリックであり、機能するはずです)。そのスコアにはドラマはありません。

正規性を仮定する自信があることを十分に理解している場合は、その知識を利用することをお勧めしますが、多くのテストではそれはあまり役に立ちません。

一般的なロケーションテスト(Wilcoxon符号付きランクテスト、Wilcoxon-Mann-Whitneyテスト)の1つを実行している場合、正規性を無視することによるロケーションシフトのテストでは、ほとんど(パワーの観点から)何も失われません。[すべての仮定が当てはまる場合、21の観測ごとに1つの追加の観測が最も強力なテストの能力に一致する必要があります。]

あなたが他のいくつかのテストを扱っている場合、もう少し重要になるかもしれません(いくつかはもっと重要ではないかもしれませんが)。やや大きな違いが生じる1つの例は、ランダムブロック設計で対応するANOVA検定と比較してフリードマン検定を使用することです。


これらのテストは、分布が同じ形状(ここでは正規)同じ分散を持っている場合のロケーションシフトテストだけではありませんか?
Alexis

1
@Alexis置換テストのnullの下での仮定は交換可能性です(したがって、必要に応じてラベル/記号などの置換を行っても統計の分布は変わりません)。通常、H0にはやや強力な「独立して同一に分布した」と想定され、ランク検定の有意水準の計算に便利です。ロケーションシフトの選択肢(既に私の回答で指定されています)と組み合わせると、これは、あなたが言及する形と広がりの識別を提供します。おそらく、私は人々がそれをカバーしています見ることができるように代数的に代数的にどのような「位置シフト代替」手段を書き留めする必要がある
Glen_b -Reinstateモニカ

1
ロケーションシフトの代替案を指定するつもりがない場合(または、少なくとも「それが、対抗力を確認することに関心があることです」と言う場合)、t検定をaとして保持するべきではありません。場所のシフトの選択肢がなかった場合も影響を受けるため、最初の比較の基準です。比較の場所のシフトの部分を放棄する場合は、関心のある選択肢のシーケンスを指定するまで、では、電源オンを計算するには少なすぎる指定の質問が残ります
Glen_b -Reinstate Monica

1
@Alexis実は、リフレクションでは、代数と説明の両方を含めると思います。質問と回答ですでに与えられている状況によって何が暗示されているのかを明確にすることが重要ですが、残念ながら今はできません。コメントありがとうございます。ここでは十分に説明していません。
Glen_b-モニカを復活させる'11
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.