クラスの1つが「他のどれでもない」によって定義されている分類問題にどのようにアプローチしますか


9

3つのクラスc1c2、ます。しかし、私のデータセットには実際にはさらにいくつかの実際のクラスます。c3(cj)j=4n

明白な答えは、新しいクラスを定義することで、C 4、すべてのクラスを意味し、C JJ > 3を、私は、これは中のサンプル以来、良いアイデアではありません疑いますc^4cjj>3互いに非常に類似したまれではないだろう。c^4

私は、私は、次の2つの変数空間を持っているとクラスとし、言うことをしようとしているものを可視化するためにC 2C 3C 4 = N J = 4のC jは緑、ゴマ、赤で描かれており、それぞれ黒。これは私のデータがどのように見えるかと私が思う方法です。c1c2c3c^4=j=4ncj

ここに画像の説明を入力してください

この問題に取り組むための標準的な方法はありますか?最も効率的な分類器は何ですか?なぜですか?


片方と残りの
両方

1
ラベルのないポジティブモデルを探索することをおすすめします。これは、ほとんどのPU問題のようにバイナリではなくマルチクラスであることを除いて、同様の問題のように見えます。
Ricardo Cruz

回答:


4

c4^

最初のステップでは、バイナリ分類子(データセット全体でトレーニング)を使用して、サンプルがクラス属しているかどうかを判断しますc4^(つまり、興味のないクラス)にます。このため、「興味深い」クラスに属するサンプルが他のクラスと大きく異なる場合は、外れ値検出方法を調べることもできます。

c1,c2,c3

centj=xiD:yi=jxixiD:yi=j1c1,c2,c3,c4^


クラスの重複があまりない場合は、Bogasの提案が最適です。それ以外の場合は、マルチラベルモデルを使用します。
Ricardo Cruz

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.