データセットでサポートベクターマシン(SVM)を使用しようとしています。しかし、問題を試みる前に、SVMは極端に不均衡なデータに対してうまく機能しないと警告されました。私の場合、95〜98%の0と2〜5%の1を使用できます。
スパース/アンバランスデータでSVMを使用することについて説明したリソースを見つけようとしましたが、見つけることができたのは 'sparseSVM'(少量のサポートベクターを使用)だけでした。
私は誰かが簡単に説明できることを望んでいました:
- そのようなデータセットでSVMがどの程度うまくいくと予想されるか
- SVMアルゴリズムに変更を加える必要がある場合
- これについて議論するリソース/論文