XGBoostは予測フェーズで欠落データを処理できます


11

最近、XGBoostアルゴリズムを確認しましたが、このアルゴリズムは、トレーニングフェーズで欠落データを(補完を必要とせずに)処理できることに気付きました。XGboostが新しい観測値の予測に使用される場合、または欠損データを補完する必要がある場合、XGboostが欠損データを(補完を必要とせずに)処理できるかどうか疑問に思っていました。

前もって感謝します。

回答:


14

xgboostは、トレーニング時に欠損値を右ノードにするか左ノードにするかを決定します。損失を最小限に抑える方法を選択します。トレーニング時に欠損値がない場合、デフォルトで新しい欠損値が正しいノードに送信されます。

欠損の分布にシグナルがある場合、これは基本的にモデルに適合しています。

スコアリングデータの欠損値がトレーニングデータとは異なる方法で分布している場合は注意してください。xgboostの欠けている処理は便利ですが、マスキングから保護しません。

出典:この回答

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.