私は12のポジティブトレーニングセットを持っています(12の異なる作用機序のそれぞれを備えた薬物で処理された癌細胞)。これらのポジティブトレーニングセットのそれぞれについて、サポートベクターマシンをトレーニングして、実験からサンプリングされた同じサイズのネガティブセットと区別します。各セットには1000〜6000のセルがあり、各セルには476の特徴(画像の特徴)があり、それぞれ[0、1]に線形にスケーリングされます。
LIBSVMとGaussian RGBカーネルを使用しています。5分割の相互検証を使用して、log₂C∈[-5、15]およびlog₂ɣ∈[-15、3]のグリッド検索を実行しました。結果は次のとおりです。
12の分類問題すべてに高い精度を与える単一のパラメータセットがないことにがっかりしました。また、グリッドは一般に、低い精度で囲まれた高精度の領域を示していないことにも驚きました。これは、検索パラメータースペースを拡張する必要があるということだけですか、それともグリッド検索は何か他の問題があることを示しているのですか?