11 最近、XGBoostアルゴリズムを確認しましたが、このアルゴリズムは、トレーニングフェーズで欠落データを(補完を必要とせずに)処理できることに気付きました。XGboostが新しい観測値の予測に使用される場合、または欠損データを補完する必要がある場合、XGboostが欠損データを(補完を必要とせずに)処理できるかどうか疑問に思っていました。 前もって感謝します。 machine-learning missing-data data-imputation xgboost — リカルドUES ソース
14 xgboostは、トレーニング時に欠損値を右ノードにするか左ノードにするかを決定します。損失を最小限に抑える方法を選択します。トレーニング時に欠損値がない場合、デフォルトで新しい欠損値が正しいノードに送信されます。 欠損の分布にシグナルがある場合、これは基本的にモデルに適合しています。 スコアリングデータの欠損値がトレーニングデータとは異なる方法で分布している場合は注意してください。xgboostの欠けている処理は便利ですが、マスキングから保護しません。 出典:この回答 — デックスグローブ ソース