私は次の質問を解決しようとしています:
プレーヤーAは25ゲーム中17勝、プレーヤーBは20ゲーム中8勝-両方の比率に大きな違いはありますか?
Rで頭に浮かぶことは次のとおりです。
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
したがって、このテストでは、95%の信頼レベルでは差は有意ではないと述べています。
prop.test()
近似のみを使用していることがわかっているので、正確な二項検定を使用してより正確にしたい-と私は両方の方法でそれを行う:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
さて、これはおかしいですね。p値は毎回完全に異なります!どちらの場合も、結果は(非常に)重要ですが、p値は偶然に飛び跳ねるように見えます。
私の質問
- 毎回p値が異なるのはなぜですか?
- Rで正確に2つのサンプル比率の二項検定を正しく実行するにはどうすればよいですか?
prop.test
vschisq.test
)が、この問題には同じ基本概念があります。3つの例のそれぞれで、異なる「帰無仮説」で3つの異なるテストを実行しています。