単純な分類では、クラス0とクラス1の2つのクラスがあります。一部のデータでは、クラス1の値しかないため、クラス0の値はありません。現在、クラス1のデータをモデル化するモデルを作成することを考えています。したがって、新しいデータが来ると、このモデルが新しいデータに適用され、新しいデータがこのモデルにどれだけ当てはまるかを示す確率がわかります。次に、しきい値と比較して、不適切なデータをフィルタリングできます。
私の質問は:
- これは、そのような問題を処理するための良い方法ですか?
- この場合、RandomForest分類器を使用できますか?分類子がノイズと見なすことを望んでいるクラス0の人工データを追加する必要がありますか?
- 他のアイデアがこの問題に役立つでしょうか?