質問:
- ブースト回帰ツリー(BRT)と一般化ブーストモデル(GBM)の違いは何ですか?それらは交換可能に使用できますか?一方は他方の特定の形式ですか?
- RidgewayがFriedmanが以前に "Gradient Boosting Machine"(GBM)として提案していたものを説明するために "Generalized Boosted Regression Models"(GBM)というフレーズを使用したのはなぜですか?これらの2つの頭字語は同一であり、同じことを説明していますが、異なるフレーズに由来しています。
バックグラウンド:
BRTとGBMの用語の違いを判断するのに苦労しています。私が理解していることから、両方とも、ある種のブースティング(たとえば、バギング、ブートストラップ、クロス検証)を通じて確率論が組み込まれた分類および回帰ツリーを説明する用語です。また、私が収集したものから、GBMという用語は、フリードマン(2001)の論文「グリーディ関数近似:勾配ブースティングマシン」で最初に作られたものです。Ridgewayは、2006年にパッケージ「Generalized Boosted Regression Models(GBM)」でFriedmanが説明した手順を実装しました。私の分野では(生態学)Elith et al。(2008)は、gbm
種分布モデリングのためのリッジウェイのパッケージを最初に実証したものです。しかし、エリスらの著者。「ブースト回帰ツリー」(BRT)という用語を使用して、フリードマンとリッジウェイを説明します。
これらの用語を同じ意味で使用できるかどうか混乱していますか?ある著者が、前の著者が提案したのと同じ理論を説明するのに同じ頭字語を(別のフレーズから)使用することはやや混乱します。この理論を生態学的な用語で説明するときに、3人目の著者がまったく異なる用語を使用したことも混乱しています。
私が思いつくことができる最高のものは、BRTが分布が二項分布であるGBMの特定の形式であるということですが、私はこれについて確信が持てません。
エリス他 このようにブーストされた回帰ツリーを定義します... "ブーストされた回帰ツリーは、2つのアルゴリズムの強みを組み合わせたものです:回帰ツリー(再帰的なバイナリ分割によって予測子への応答を関連付けるモデル)とブースティング(多くの単純なモデルを組み合わせて予測パフォーマンスを向上させる適応手法) )最終的なBRTモデルは、個々の項が単純なツリーであり、順方向の段階的な方法で当てはめられた加法回帰モデルとして理解できます」(Elith et al。2008)。