ブースティング方法は外れ値に敏感であると述べている記事を多く見つけましたが、その理由を説明する記事はありません。
私の経験では、外れ値はどの機械学習アルゴリズムにとっても悪いのですが、なぜブースティング法が特に敏感であると特定されているのですか?
ブースターツリー、ランダムフォレスト、ニューラルネットワーク、SVM、ロジスティック回帰などの単純な回帰法など、外れ値に対する感度の観点から、次のアルゴリズムはどのようにランク付けされますか?
ブースティング方法は外れ値に敏感であると述べている記事を多く見つけましたが、その理由を説明する記事はありません。
私の経験では、外れ値はどの機械学習アルゴリズムにとっても悪いのですが、なぜブースティング法が特に敏感であると特定されているのですか?
ブースターツリー、ランダムフォレスト、ニューラルネットワーク、SVM、ロジスティック回帰などの単純な回帰法など、外れ値に対する感度の観点から、次のアルゴリズムはどのようにランク付けされますか?
回答:
ブースターは、前のツリーの残差/エラーに基づいて各ツリーを構築するため、外れ値はブースティングに悪い場合があります。異常値は非異常値よりもはるかに大きな残差を持つため、勾配ブースティングはそれらのポイントに不均衡な注意を集中させます。
指定したアルゴリズムは分類用であるため、ターゲット変数の外れ値ではなく、入力変数の外れ値を意味すると想定しています。ブーストツリーメソッドは、基本学習器がツリー分割であるため、入力フィーチャの外れ値に対してかなり堅牢である必要があります。たとえば、スプリットがx > 3
5の場合、5,000,000は同じように扱われます。これは良いことかもしれませんし、そうでないかもしれませんが、それは別の質問です。
代わりに、ターゲット変数の回帰と外れ値について話している場合、ブーストツリー法の感度は使用するコスト関数に依存します。もちろん、差は二乗され、ブーストは損失(の勾配)を収めようとするため、二乗誤差は外れ値の影響を受けやすくなります。ただし、フーバー損失や絶対損失などのブーストツリー法に使用できるより堅牢なエラー関数があります。