非常に短い答え:
カイ2乗検定(chisq.test()
R)は、分割表の各カテゴリで観測された頻度を、予想される頻度(限界頻度の積として計算)と比較します。観測されたカウントと期待されたカウントの偏差が大きすぎて偶然に起因していないかどうかを判断するために使用されます。独立性からの逸脱は、残差を調べることで簡単に確認できます(?mosaicplot
またはまたはを試してください?assocplot
が、vcd
パッケージも確認してください)。fisher.test()
正確なテストに使用します(超幾何分布に依存)。
prop.test()
R の関数を使用すると、比率がグループ間で同等であるか、理論的な確率と変わらないかをテストできます。テスト統計が次のように見えるため、テストと呼ばれます。z
z=(f1−f2)p^(1−p^)(1n1+1n2)−−−−−−−−−−−−−−−−√
ここで、、およびインデックスはテーブルの1行目と2行目を参照します。双方向の分割表 、これは通常のテストに匹敵する結果をもたらすはずです:(1、2)H0:p^=(p1+p2)/(n1+n2)(1,2)χ 2H0:p1=p2χ2
> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)
Pearson's Chi-squared test with Yates' continuity correction
data: tab
X-squared = 0.8823, df = 1, p-value = 0.3476
> prop.test(tab)
2-sample test for equality of proportions with continuity correction
data: tab
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided
95 percent confidence interval:
-0.15834617 0.04723506
sample estimates:
prop 1 prop 2
0.8333333 0.8888889
Rを使用した離散データの分析については、Laura ThompsonのAgrestiのCategorical Data Analysis(2002)に付属するR(およびS-PLUS)マニュアルを強くお勧めします。