教科書の答えはありません。しかし、ここにいくつかの考えがあります。
ブースティングは、バギングと直接比較して見ることができます。これらは、バイアス分散のトレードオフジレンマの2つの異なるアプローチです。バギングには弱い学習器がありますが、バイアスが低く分散が大きい学習者の中には、バギング集団を平均化することにより、少しのバイアスの分散が減少します。一方、ブースティングは、さまざまな弱学習器でうまく機能します。ブースティング弱学習器は、高いバイアスと低い分散を持っています。ある学習者を別の学習者の上に構築することにより、ブースティングアンサンブルはバイアスを減らし、少しの差異を試みます。
その結果、たとえば、弱学習器としてツリーでバギングとブースティングを使用することを検討する場合、ブースティングを使用した小さな/短いツリーと、バギングを使用した非常に詳細なツリーを使用するのが最良の方法です。このため、ブースティング手順では、可能な限り最短のツリー(単一のディメンションでの単一のif条件)である弱点学習器として決定スタンプを使用します。この決定の切り株は非常に安定しているため、分散が非常に低くなります。
ブースティング手順でツリーを使用する理由は何もありません。ただし、短いツリーはシンプルで、実装も理解も簡単です。ただし、ブースティング手順で成功するためには、弱い学習者は分散が低く、剛性が高く、自由度が非常に少ない必要があります。たとえば、私は弱い学習者としてニューラルネットワークを持っている意味がありません。
さらに、ある種のブースティング手順(たとえば、勾配ブースティング)では、弱学習器がツリーの場合、ブースティングのしくみを最適化できることがわかりました。したがって、勾配ブースティングツリーがあります。ESTLブックには、ブースティングの良い露出があります。