極端なランダムフォレストとランダムフォレストの違いは何ですか?


18

ERはより効率的な実装ですか(Extreme Gradient Boosting勾配ブースティングに似ています)-実際の観点からの違いは重要ですか?それらを実装するRパッケージがあります。それは、効率の点だけでなく、他のいくつかの分野でも「一般的な」実装(RのRandomForestパッケージ)を克服する新しいアルゴリズムですか?

エクストリームランダムフォレストhttp://link.springer.com/article/10.1007%2Fs10994-006-6226-1

回答:


20

これは非常に簡単です。RFはツリーの分割を最適化し(つまり、決定に関して最良の情報を得るものを選択する)、ERFはランダムに分割します。さて、

  • 最適化コスト(それほどではありませんが、それでも)なので、ERFは通常より高速です。
  • 最適化は、アンサンブルまたは全体的なオーバーフィッティングにおけるツリーの相関に寄与する可能性があるため、特に信号が弱い場合、ERFはおそらくより堅牢です。

この方向にさらに進むと、各ツリーレベルで分割を均等化することで速度を上げることができます。これにより、ツリーをシダに変換することもできます。私が存在するRの実装などindividuumのは。


そのリンクが壊れています、CVLABを
-smci

I RFは小さい木の上のデータセットから、最適化され圧縮ナレッジを使用しているため、ERFによって作成された木は、その後、RFのものをはるかに大きいと仮定
Qbik
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.