次のコードを使用してロジスティック回帰を作成しました。
full.model.f = lm(Ft_45 ~ ., LOG_D)
base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg)
step(base.model.f, scope=list(upper=full.model.f, lower=~1),
direction="forward", trace=FALSE)
次に、出力を使用して最終モデルを作成しました。
final.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg + IP_util_E2_m02_flg +
AE_NumVisit1_flg + OP_NumVisit1_m01_flg + IP_TotLoS_m02 +
Ft1_45 + IP_util_E1_m05_flg + IP_TotPrNonElecLoS_m02 +
IP_util_E2pl_m03_flg + LTC_coding + OP_NumVisit0105_m03_flg +
OP_NumVisit11pl_m03_flg + AE_ArrAmb_m02_flg)
次に、予測関数を使用して、異なるデータセットの結果を予測しました。
log.pred.f.v <- predict(final.model.f, newdata=LOG_V)
心地よいROC曲線の確立を使用して、感度と特異性を確立するためのテーブルを作成することができました。
しかし、私がやろうとしているのは、Ft_45が1になる確率をデータの各行ごとに確立することです。log.pred.fvの出力を見ると、たとえば、
1 -0.171739593
2 -0.049905948
3 0.141146419
4 0.11615669
5 0.07342591
6 0.093054334
7 0.957164383
8 0.098415639
.
.
.
104 0.196368229
105 1.045208447
106 1.05499112
私は自分がやっていることを暫定的にしか把握していないため、確率が0から1の間になると予想される1以上の負の値を解釈する方法を理解するのに苦労しています。
したがって、私の質問は、出力を変換する必要があるか、または完全に間違っているステップが不足していることです。あなたが提供できる助けを事前にありがとうございます。