chisq.test()
R の関数でのモンテカルロシミュレーションの使用について理解したいと思います。
128レベル/クラスの質的変数があります。私のサンプルサイズは26です(これ以上「個人」をサンプリングできませんでした)。したがって、明らかに、「個人」が0のレベルがいくつかあります。しかし、実際には、127のクラスのうち、非常に少数のクラスしか表現されていません。カイ二乗検定を適用するには、各レベルに少なくとも5人の個人がいる必要があると聞いたので(その理由は完全にはわかりません)、simulate.p.value
モンテカルロシミュレーションを使用して分布を推定するオプションを使用する必要があると思いましたそしてp値を計算します。モンテカルロシミュレーションなしでは、Rはp値を与えます< 1e-16
。モンテカルロシミュレーションでは、でのp値が得られ4e-5
ます。
26の1と101の0のベクトルでp値を計算しようとしましたが、モンテカルロシミュレーションでは、1のp値が得られました。
可能なクラスの数と比較してサンプルサイズが小さい場合でも、観測された分布は、すべての可能なクラスが実際の母集団で同じ確率(1/127)で存在する可能性が非常に低いということを示してもよいですか? ?