私が見た限りでは、これについて意見が異なる傾向があります。最善の方法は、クロス検証を使用することです(特に、同じデータセット上のRFと他のアルゴリズムを比較する場合)。一方、元のソースは、モデルトレーニング中にOOBエラーが計算されるという事実は、テストセットのパフォーマンスの指標として十分であると述べています。Trevor Hastieでさえ、比較的最近の講演で「ランダムフォレストは無料の相互検証を提供する」と述べています。直感的に、1つのデータセットでRFベースのモデルをトレーニングして改善しようとする場合、これは理にかなっています。
誰かがランダムフォレストとの交差検証の必要性に対する賛成論と反対論を並べてください。