SVMの分類を学習していますが、問題が発生しています。このジレンマに用語があるかどうかはわかりません。
(両方の性別の)健康な人と(両方の性別の)肝臓がんの人のサンプルを前提として、SVMで患者を分類するとします。健康な人のサンプルをクラス1、癌の人をクラス2とラベル付けすると、バイナリSVMをトレーニングして分類子1を取得し、新しい患者を予測できます。次に、別のシナリオをイメージします。SVM分類の前に、最初にすべてのサンプルを性別で割るとします。性別ごとに、健康な患者と癌患者を2つのクラスに分類し、バイナリSVMをトレーニングして、女性と男性のサンプルの分類子2と分類子3をそれぞれ取得します。問題は、より正確な予測を得るために使用する分類子1または2の新しい女性患者がいるかどうかです。ここに私が持っている議論のジレンマがあります
(1)サンプル数が多い場合、予測はより正確になります。この議論に基づいて、分類子1は良い選択のようです。
(2)ただし、サンプルを最初に女性と男性のグループに分けた場合、新しい患者(未知のテストサンプル)は女性であるため、分類子2の方が適しているようです。
この種のジレンマには用語がありますか、それともこのような問題を解決するための詳細情報や方法を誰かが知っていますか?これが正当な質問であるかどうかさえわかりませんし、事前にナイーブな質問で申し訳ありません。ありがとう