計算していると主張しているExcelシートを見ていますが、この方法を認識していないため、何か不足しているのではないかと思っていました。
これが分析しているデータです:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
そして、これはカイ二乗を計算するために各グループに対して行う合計です:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
したがって、各グループのは次のとおりです。
2.822793
2.822793
1.759359
4.136448
そして、総カイ広場は次のとおり11.54139
です。
ただし、を計算するすべての例は、これとはまったく異なります。私は各グループに対して行います:
chiSq = (Observed-Expected)^2 / Expected
したがって、上記の例の場合、合計カイ二乗値はになり11.3538
ます。
私の質問は-なぜExcelシートでをこのように計算しているのですか?これは認められたアプローチですか?
更新
これを知りたいのは、これらの結果をR言語で再現しようとしているためです。私はchisq.test関数を使用していますが、Excelシートと同じ番号で出力されません。したがって、Rでこのアプローチを行う方法を知っている人がいると、非常に役立ちます。
アップデート2
誰かが興味を持っているなら、ここに私がRでそれを計算した方法があります:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))