XGBoostは予測フェーズで欠落データを処理できます

最近、XGBoostアルゴリズムを確認しましたが、このアルゴリズムは、トレーニングフェーズで欠落データを（補完を必要とせずに）処理できることに気付きました。XGboostが新しい観測値の予測に使用される場合、または欠損データを補完する必要がある場合、XGboostが欠損データを（補完を必要とせずに）処理できるかどうか疑問に思っていました。

前もって感謝します。

— リカルドUES
ソース

xgboostは、トレーニング時に欠損値を右ノードにするか左ノードにするかを決定します。損失を最小限に抑える方法を選択します。トレーニング時に欠損値がない場合、デフォルトで新しい欠損値が正しいノードに送信されます。

欠損の分布にシグナルがある場合、これは基本的にモデルに適合しています。

スコアリングデータの欠損値がトレーニングデータとは異なる方法で分布している場合は注意してください。xgboostの欠けている処理は便利ですが、マスキングから保護しません。

出典：この回答

— デックスグローブ
ソース