XGBoost のチュートリアルから、各ツリーが成長すると、すべての変数がスキャンされてノードが分割され、最大のゲイン分割を持つ変数が選択されると思います。だから私の質問は、いくつかのノイズ変数をデータセットに追加すると、これらのノイズ変数は変数の選択に影響しますか?私の論理では、これらのノイズ変数は最大ゲイン分割をまったく提供しないため、それらが選択されることはなく、ツリーの成長に影響を与えません。
答えが「はい」の場合、「変数が多いほどXGBoostに適している」というのは本当ですか?トレーニング時間は考慮しません。
また、答えが「はい」の場合、「モデルから重要でない変数を除外する必要がない」というのは本当です。
ありがとうございました!