Barnardの検定は、帰無仮説の下で迷惑パラメーターが不明な場合に使用されます。
ただし、女性のテイスティングテストでは、帰無仮説の下で迷惑パラメーターを0.5に設定できると主張することができます(情報のない女性は、カップを正しく推測する確率が50%です)。
次に、帰無仮説の下での正しい推測の数は二項分布になります:各カップについて50%の確率で8カップを推測します。
他の機会では、帰無仮説についてこの些細な50%の確率がないかもしれません。そして、固定マージンがないと、その確率がどうあるべきかわからないかもしれません。その場合、バーナードのテストが必要です。
女性のテイスティングティーテストでBarnardのテストを行う場合でも、最高のp値を持つ迷惑度パラメーターは0.5であり、自明な二項検定(実際には、2つの二項検定を組み合わせたもので、1つは牛乳1杯目、もう1つは茶1杯目です)。
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
以下は、より複雑な結果を得る方法です(すべての推測が正しいわけではない場合(2対4など))、極端なものとそうでないもののカウントは少し難しくなります
(同様に、バーナードのテストでは、4-2の結果の場合、迷惑パラメーターp = 0.686が正しくないことを主張していることに注意してください。領域を定義するのはそれほど簡単ではありませんが、これは別の領域を考慮するとさらに小さくなり、代わりにWaldの統計に基づいた領域になります)
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)