次のアイテムを含む3つのクラスのデータセットがあります。
- クラス1:900要素
- クラス2:15000要素
- クラス3:800要素
規範からの重要な逸脱を示すクラス1とクラス3を予測する必要があります。クラス2はデフォルトの「通常の」ケースで、私は気にしません。
ここではどのような損失関数を使用しますか?CrossEntropyLossの使用を考えていましたが、クラスの不均衡があるため、重み付けする必要があると思いますか?実際にはどのように機能しますか?このように(PyTorchを使用)?
summed = 900 + 15000 + 800
weight = torch.tensor([900, 15000, 800]) / summed
crit = nn.CrossEntropyLoss(weight=weight)
または、重量を逆にする必要がありますか?つまり、1 /重量?
これは最初から正しいアプローチですか、それとも私が使用できる他の/より良い方法がありますか?
ありがとう