xgboostのmin_child_weightパラメーターの定義は次のとおりです。
子に必要なインスタンスの重み(ヘシアン)の最小合計。ツリーパーティションのステップの結果、インスタンスの重みの合計がmin_child_weightより小さいリーフノードが生成される場合、構築プロセスはさらにパーティションを放棄します。線形回帰モードでは、これは単に各ノードに必要なインスタンスの最小数に対応します。アルゴリズムが大きくなるほど、保守的になります。
元の論文(式8と式9の直後のもの)、この質問、およびGoogle検索の最初の数ページに表示されるxgboostで行うほとんどのことを含め、xgboostでかなり多くのことを読みました。;)
基本的に、ヘシアンの合計に制約を課している理由について、私はまだ満足していませんか?元の論文からの私の唯一の考えは、それが各インスタンスの「重み」としてを持つ重み付き分位点スケッチセクション(および式3の重み付き2乗損失の再定式化)にているということです。
さらなる質問は、それが単に線形回帰モードのインスタンスの数である理由に関するものですか?これは二乗和方程式の二次導関数に関係していると思いますか?