パラメトリックテストでnullが拒否されない場合、ノンパラメトリックテストでも同じことが行われますか?


12

ノンパラメトリックテストがそのパラメトリック代替よりもパワーが低いと想定される場合、これは、パラメトリックテストがヌルを拒否しない場合、そのノンパラメトリック代替もヌルを拒否しないことを意味しますか?パラメトリックテストの前提条件が満たされておらず、テストがとにかく使用されている場合、これはどのように変化しますか?


4
(a)想定されるいくつかの状況下でテストAがテストBよりも低い場合、Aが拒否するケースがBのケースのサブセットであることを意味しません(実際、固定有意水準では不可能です)。それらは、サンプル空間の異なる(ただし、重度に重なっている)部分を拒否します。常に、お互いが拒否する場合とそうでない場合があります。(b)パラメトリックテストの前提条件が満たされていない場合(実際に満たされたことがありますか?)、パラメトリックテストのパワーは比較的低い可能性があります(たとえば、t検定対
マントン

回答:


9

パラメトリック検定が帰無仮説の棄却に失敗した場合、そのノンパラメトリック同等物は間違いなく帰無仮説を棄却できます。@Johnが言ったように、これは通常、パラメトリックテストの使用を保証する前提に違反したときに発生します。たとえば、2サンプルのt検定をWilcoxonのランクサム検定と比較すると、データに外れ値を含めると、この状況が発生する可能性があります(外れ値では2つのサンプル検定を使用しないでください)。

#Test Data
x = c(-100,-100,rnorm(1000,0.5,1),100,100)
y = rnorm(1000,0.6,1)

#Two-Sample t-Test
t.test(x,y,var.equal=TRUE)

#Wilcoxon Rank Sum Test
wilcox.test(x,y)

テストの実行結果:

> t.test(x,y,var.equal=TRUE)

    Two Sample t-test

data:  x and y 
t = -1.0178, df = 2002, p-value = 0.3089
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.6093287  0.1929563 
sample estimates:
mean of x mean of y 
0.4295556 0.6377417 

> 
> wilcox.test(x,y)

    Wilcoxon rank sum test with continuity correction

data:  x and y 
W = 443175, p-value = 5.578e-06
alternative hypothesis: true location shift is not equal to 0 

9

番号。

パラメトリックテストはより強力になる可能性がありますが、常にそうとは限りません。そうでない場合は、通常、パラメトリックテストを実行すべきではない状況にあります。

ただし、パラメトリックテストの検出力が高い等分散の正規分布から適切なサイズのサンプルを収集している場合でも、特定の実験で有意でないパラメトリックテストが有意でないノンパラメトリックテストであることを保証するものではありません。これは、正規分布からのランダムサンプリングを使用したシミュレーションであり、t検定でp> 0.05のとき、ウィルコクソン検定でp <0.05のときに約1.8%の時間を検出します。

nsim <- 10000
n <- 50
cohensD <- 0.2
Y <- replicate(nsim, {
    y1 <- rnorm(n, 0, 1); y2 <- rnorm(n, cohensD, 1)
    tt <- t.test(y1, y2, var.equal = TRUE)
    wt <- wilcox.test(y1, y2)
    c(tt$p.value, wt$p.value)})
sum(Y[1,] > 0.05 & Y[2,] < 0.05) / nsim

このシミュレーションでは、パラメトリックテストの能力がノンパラメトリックテストよりも大きいことに注意してください(ただし、これらは類似しています)。

sum(Y[1,] < 0.05) / nsim #t-test power
sum(Y[2,] < 0.05) / nsim #wilcox.test power

しかし、上に示したように、それは、パラメトリックテストが、ノンパラメトリックテストも失敗するという効果を見つけることができないすべての場合を意味するわけではありません。

このシミュレーションで遊ぶことができます。nを非常に大きく、たとえば1000にし、エフェクトサイズをさらに小さく、たとえば0.02にします(テストが失敗するサンプルをたくさん持つには、低電力が必要です)。nが1000であれば、非正規性(検査、バカなテストではない)でサンプルが拒否されないこと、または疑わしい外れ値を持つことはほとんどありません。それでも、いくつかのパラメトリックテストは重要ではありませんが、ノンパラメトリックテストは重要です。

また、Hunter&May(1993)もご覧ください。

ハンター、マサチューセッツ、およびメイ、RB(1993)。パラメトリックおよびノンパラメトリックテストに関するいくつかの神話。カナダ心理学、34(4)、384-389。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.