ランダムフォレストは、最も効果的な分類手法の1つであると実務家の間で定評があります。それでも、学習理論の文献ではそれらにあまり遭遇していません。そこから、深い理論的な結果がないことを推測します。この理論を掘り下げたい場合、どこから始めればよいでしょうか。
ランダムフォレストは、最も効果的な分類手法の1つであると実務家の間で定評があります。それでも、学習理論の文献ではそれらにあまり遭遇していません。そこから、深い理論的な結果がないことを推測します。この理論を掘り下げたい場合、どこから始めればよいでしょうか。
回答:
Simoneの回答に続いて、Gerard Biauは、ランダムフォレストの収束と一貫性について検討している非常に優れた論文をいくつか持っています。分析は、Breiman 2001と比較してアルゴリズムのわずかに簡略化されたバージョンに対するものですが、以前の結果よりも簡略化されていません。
Biauの論文(および彼の共同研究者)はすべて彼のWebサイトで入手できます。
http://www.lsta.upmc.fr/BIAU/publications.html
特に関連があるのは、一貫性に関する「印刷中」の作業です。http: //www.lsta.upmc.fr/BIAU/sbv.pdf
ランダムな森の内容で他の2-3の論文があります。私はcstheoryに参加したばかりなので、2つを超えるリンクを投稿することはできませんが、上記の出版物サイトにはそれらすべてが含まれています。
これがお役に立てば幸いです。この方法の大部分は経験的な使用期間の後、2008年以降、最近の活動が急増しているようです。そして良いニュースは、理論的な調査は、メソッドが堅牢で優れた特性を持っていることを示しているようです。
ブライマンの2001年のRFに関する論文をすでにご覧になっていると思います。私は他のいくつかの参照を指摘することができます:
証明の定理を可能にするさまざまなRFの単純化の経験的比較: ギャップを狭める:理論と実際のランダムフォレスト
これは私が提供できる最新のリファレンスです。このホワイトペーパーでは、RFの理論結果に関する最初の研究について、Biauの論文の引用を見つけることもできます。
RFの変数の重要性に関する理論的な結果に興味がある場合:ランダム化されたツリーのフォレストの変数の重要性を理解する
実際、私は最後の論文の著者(Gilles Louppe)が博士論文(v2)をarxivに投稿したばかりだと知りました。ランダムフォレストの理解:理論から実践へ