ランダムフォレストによるバイナリターゲットクラスをデータセットに適合させます。Pythonでは、randomforestclassifierまたはrandomforestregressorのいずれかでそれを行うことができます。
randomforestclassifierから直接分類を取得することも、randomforestregressorを最初に実行して推定スコアのセット(連続値)を取得することもできます。次に、スコアのセットから予測クラスを導出するためのカットオフ値を見つけることができます。どちらの方法でも同じ目標を達成できます(つまり、テストデータのクラスを予測します)。
それも観察できます
randomforestclassifier.predict_proba(X_test)[:,1])
とは違う
randomforestregressor.predict(X_test)
だから私は両方の方法が有効であることを確認したいのですが、ランダムフォレストアプリケーションではどちらが良いですか?