Python sklearnには、不均衡データを処理するためのclass_weightパラメーターを持つ複数のアルゴリズム(たとえば、回帰、ランダムフォレストなど)があります。
ただし、MLLibアルゴリズムにはそのようなパラメーターはありません。一部のMLLibアルゴリズムにclass_weightを実装する計画はありますか?または、MLLibに不均衡データに対するアプローチはありますか?それとも実際に、MLLibですべてのアップ/ダウンサンプリングを自分で処理する必要がありますか?
ありがとう!