監視対象のバイナリ分類の問題を扱っています。GBMパッケージを使用して、個人を未感染/感染として分類したいと思います。私は、感染した個人の15倍も感染していない。
クラスサイズが不均衡な場合にGBMモデルが影響を受けるかどうか疑問に思っていましたか?この質問に答える参考文献は見つかりませんでした。
感染していない人に1の重みを、感染した人に15の重みを割り当てることで重みを調整しようとしましたが、結果は良くありませんでした。
1
(補足)GBMの略語とパッケージへのリンクを提供していただければ助かります。
—
Memming
勾配ブースティングモデルにどの損失関数を使用していますか?不均衡なクラスに関しては、最も一般的なクラスを優先するように思われるため、平均絶対誤差を使用したときにパフォーマンスが低下しました。私は平均二乗誤差を使用するとパフォーマンスが大幅に向上
—
ライアンZotti
将来の参考のために、キャレットの対数損失(クロス偏差)で使用されるデフォルトの損失関数も非常に役立つと思います。(負の対数スケールで間違った場合に大きなペナルティを課します)
—
リリーロング