ランダムフォレストはの集まりである決定木ランダムに(そして時にはトレーニングデータを袋詰め)と、各ツリーを構築するためのいくつかの特徴のみを選択することで形成されます。どうやら彼らはよく学び、一般化しています。誰かが決定木空間のMCMCサンプリングを行ったか、ランダムフォレストと比較しましたか?MCMCを実行してすべてのサンプリングされたツリーを保存すると、計算コストが高くなる可能性があることはわかっていますが、計算コストではなく、このモデルの理論的な機能に興味があります。つまり、次のようなものです。
- ランダムな決定木を構築します(恐らく恐ろしく実行されます)
- ようなものでツリーの尤度を計算するか、おそらくP p r i o r(T r e e )を追加します期間。
- ランダムなステップを選択してツリーを変更し、尤度基づいて選択します。
- Nステップごとに、現在のツリーのコピーを保存します
- 大きなN * M回の場合は3に戻ります
- 保存されたM個のツリーのコレクションを使用して予測を行う
これにより、ランダムフォレストと同様のパフォーマンスが得られますか?ここでは、ランダムフォレストとは異なり、適切なデータや機能を破棄するわけではありません。