訓練されたモデルを不均衡なデータセットでテストしてもらいたいのですが。バランスのとれたラベル付きデータセット(スパム/非スパム)から合成データを生成するために利用できるアルゴリズムはありますか?
1つのクラスをアンダーサンプリングするだけで、常にデータセットのバランスをとることができます。
—
user2974951