2つのグループ間でサンプルを分類するランダムフォレストの機能をテストしようとしています。分類に使用される54のサンプルとさまざまな数の変数があります。
50kのツリーを使用している場合でも、out-of-bag(OOB)の見積もりが互いに5%も異なる場合があるのはなぜですか。これはブートストラップが役立つものですか?
6
いくつかのサンプルが必要です。5万本の木はサンプルが少ないので意味がありません。ほとんどの場合、バリエーションは、1つのサンプルが実行間で誤って分類されています。
—
2017年
@ThiS木の数を増やすと、得られる差異の量が減ると思った。効果的にゼロにするか、どれが最も正確かを知る方法はありますか?
—
Sethzard 2017年