3
ランダムフォレストの予測式を出力するためのアイデア
私が尋ねようとしていた質問に答えた次の投稿を読みました: ランダムフォレストモデルを使用してセンサーデータから予測を行う 出力予測の決定木 これまでに行ったことは次のとおりです。私はロジスティック回帰をランダムフォレストと比較し、RFがロジスティックを上回りました。今、私が一緒に働く医学研究者は私のRF結果を医学診断ツールに変えたいと思っています。例えば: 25〜35歳のアジア人男性で、ビタミンDがxx未満で、血圧がxxを超えている場合、76%の確率で病気xxxを発症します。 ただし、RFは単純な数式に適していません(上記のリンクを参照)。だから私の質問です:RFを使用して診断ツールを開発するためにあなたは皆どんなアイデアを持っていますか(数百本の木をエクスポートする必要はありません)。 ここに私のアイデアのいくつかがあります: 変数の選択にRFを使用してから、ロジスティックを使用して(考えられるすべての相互作用を使用して)、診断方程式を作成します。 どういうわけか、RFフォレストを1つの「メガツリー」に集約します。これにより、ツリー全体でノード分割が平均化されます。 #2や#1と同様に、RFを使用して変数を選択し(合計でm個の変数など)、何百もの分類ツリーを構築します。これらすべてですべてのm変数を使用し、最適な単一ツリーを選択します。 他のアイデアは?また、#1を行うのは簡単ですが、#2と#3を実装する方法に関するアイデアはありますか?