回答:
Tanによるデータマイニングの概要で見つけたように。al:
研究では、不純物尺度の選択が決定木誘導アルゴリズムのパフォーマンスにほとんど影響しないことが示されています。これは、多くの不純物測定値が互いに非常に一貫しているためです[...]。実際、ツリーの剪定に使用される戦略は、不純物測定の選択よりも最終ツリーに大きな影響を与えます。
したがって、CARTなどのGiniインデックスまたはC4.5などのエントロピーを使用することを選択できます。
Quinlan:C4.5 Programs for Machine Learningのよく書かれた本を簡単にたどることができるため、エントロピー、より具体的にはC4.5のゲイン比を使用します。