4
条件付き確率でデータセットを作成する方法は?
ある病気(DDD)の有病率 3100031000\dfrac3{1000}。また、ある症状(SSS)有病率(一般集団=その病気の人) Dおよびその疾患のない人(おそらく他の疾患にかかっているが、それは重要ではない))の 5100051000\dfrac5{1000}。以前の研究では、条件付き確率がP(S|D)=30%P(S|D)=30%P(S|D) = 30\% (症状が出る確率 SSS、病気を考えると DDD です 30%30%30\%)。 最初の質問:P(S|D)P(S|D)P(S|D) 症状の有病率と同等と解釈される SSS 病気にかかっている人々のグループで DDD? 2番目の質問:Rでデータセットを作成します。 P(D|S)=P(S|D)P(D)P(S)P(D|S)=P(S|D)P(D)P(S)P(D|S) = \frac{P(S|D)P(D)} {P(S)} 私の架空のデータを使って、 P(D|S)=0.18P(D|S)=0.18P(D|S)=0.18、それはこのように解釈されます:症状のある患者がいる場合 SSS、彼が病気にかかっている確率 DDD です 18%18%18\%。 これを行う方法?sample関数を単純に使用すると、データセットには次の情報が不足しています。P(S|D)=30%P(S|D)=30%P(S|D)=30\%: symptom <- sample(c("yes","no"), 1000, prob=c(0.005, 0.995), rep=T) disease <- sample(c("yes","no"), 1000, prob=c(0.002, 0.998), rep=T) だから私の質問は:私が望む条件付き確率を含めて、良いデータセットを作成する方法は? 編集:私の意見では、私の質問のため、私は同じ質問をstackoverflow.com(/programming/7291935/how-to-create-a-dataset-with-conditional-probability)にも投稿しましたR言語プログラムに継承されますが、統計理論にも継承されます。