これは簡単な質問だと思いますが、なぜか、なぜそうでないかの背後にある推論はそうではないかもしれません。私が尋ねる理由は、最近RFの独自の実装を記述したためです。RFのパフォーマンスは良好ですが、期待したパフォーマンスを発揮していません(Kaggle Photo Quality Prediction競争データセット、勝利スコア、および使用された手法について入手可能になった後続の情報)。
このような状況で最初に行うことは、モデルの予測誤差をプロットすることです。そのため、与えられた予測値ごとに、正しいターゲット値からの平均バイアス(または偏差)を決定します。私のRFについて、私はこのプロットを得ました:
これがRFで一般的に観察されるバイアスパターンであるかどうか疑問に思っています(そうでない場合は、データセットや私の実装に固有のものである可能性があります)。もちろん、このプロットを使用してバイアスを補正することで予測を改善できますが、RFモデル自体に対処する必要があるより根本的なエラーや欠点があるのではないかと思っています。ありがとうございました。
==補遺==
私の最初の調査は、このブログエントリ「ランダムフォレストバイアス-更新」です。