健康上の問題を予測したい。「正常」、「軽度」、「重度」の3つの結果カテゴリがあります。これを2つの予測変数、テスト結果(連続、間隔共変量)およびこの問題の家族歴(はいまたはいいえ)から予測したいと思います。私のサンプルでは、確率は55%(正常)、35%(軽度)、および10%(重度)です。この意味で、私は常に「正常」を予測し、55%の確率で正しいことができますが、個々の患者に関する情報は得られません。私は次のモデルに適合します:
相互作用がなく、すべてがモデルに問題がないと仮定します。一致率cは60.5%であり、モデルが提供する最大の予測精度であると理解しています。
私は次のデータで2人の新しい患者に出くわしました:1. test = 3.26、family = 0; 2. test = 2.85、family =1。彼らの予後を予測したい。式を使用して:
cut1 <- -2.18
cut2 <- -4.27
beta <- c(0.6, 1.05)
X <- rbind(c(3.26, 0), c(2.85, 1))
pred_cat1 <- exp(-1*(X%*%beta)-cut1)/(1+exp(-1*(X%*%beta)-cut1))
pred_cat2.temp <- exp(-1*(X%*%beta)-cut2)/(1+exp(-1*(X%*%beta)-cut2))
pred_cat3 <- 1-pred_cat2.temp
pred_cat2 <- pred_cat2.temp-pred_cat1
predicted_distribution <- cbind(pred_cat1, pred_cat2, pred_cat3)
すなわち:1. 0 = 55.1%、1 = 35.8%、2 = 9.1%。および2. 0 = 35.6%、1 = 46.2%、2 = 18.2%。私の質問は、確率分布から予測応答カテゴリにどのように行くのですか?
結果がわかっているサンプルデータを使用して、いくつかの可能性を試しました。max(probabilities)を選択した場合、精度は57%で、nullをわずかに上回っていますが、一致率は下回っています。さらに、サンプルでは、このアプローチで「重大」を選択することはありません。これは、私が本当に知りたいことです。ヌルとモデルの確率をオッズに変換し、max(odds ratio)を選択することにより、ベイジアンのアプローチを試みました。これはときどき「重度」を選択しますが、精度は49.5%低下します。また、確率と丸めによって重み付けされたカテゴリの合計を試しました。これもまた、「重度」を選択することはなく、51.5%の低い精度です。
上記の情報を取得し、最適な精度(60.5%)をもたらす方程式は何ですか?