カイ二乗検定は、サンプルが期待値のセットと大きく異なるかどうかを確認するのに役立ちます。
たとえば、ここに人々のお気に入りの色に関する調査の結果の表があります(n = 15 + 13 + 10 + 17 = 55回答者):
red,blue,green,yellow
15,13,10,17
カイ二乗検定は、このサンプルが、各色を好む人々の等しい確率の帰無仮説と有意に異なるかどうかを教えてくれます。
質問:特定の色を好む回答者の合計の割合でテストを実行できますか?以下のように:
red,blue,green,yellow
0.273,0.236,0.182,0.309
もちろん、0.273 + 0.236 + 0.182 + 0.309 = 1です。
この場合、カイ二乗検定が適切でない場合、どのような検定になりますか?ありがとう!
編集:私は以下の@RomanLuštrikの答えを試して、次の出力を得ました、なぜp値が得られないのですか?なぜRは「カイ二乗近似が間違っている可能性がある」と言うのですか?
> chisq.test(c(0,0,0,8,6,2,0,0),p = c(0.406197174,0.088746395,0.025193306,0.42041479,0.03192905,0.018328576,0.009190708,0))
Chi-squared test for given probabilities
data: c(0, 0, 0, 8, 6, 2, 0, 0)
X-squared = NaN, df = 7, p-value = NA
Warning message:
In chisq.test(c(0, 0, 0, 8, 6, 2, 0, 0), p = c(0.406197174, 0.088746395, :
Chi-squared approximation may be incorrect