scikit学習におけるRandomForestClassifierとExtraTreesClassifierの違いを誰かが説明できますか?私は紙を読むのにかなりの時間を費やしました:
P. Geurts、D。Ernst。、およびL. Wehenkel、「Extremely randomized trees」、機械学習、63(1)、3-42、2006
これらはETの違いのようです:
1)分割で変数を選択する場合、サンプルはトレーニングセットのブートストラップサンプルではなく、トレーニングセット全体から抽出されます。
2)分割は、各分割でのサンプルの値の範囲から完全にランダムに選択されます。
これら2つのことの結果は、はるかに多くの「葉」になります。