SVMグリッド検索は、精度が低く高精度の領域を示す必要がありますか?


12

私は12のポジティブトレーニングセットを持っています(12の異なる作用機序のそれぞれを備えた薬物で処理された癌細胞)。これらのポジティブトレーニングセットのそれぞれについて、サポートベクターマシンをトレーニングして、実験からサンプリングされた同じサイズのネガティブセットと区別します。各セットには10​​00〜6000のセルがあり、各セルには476の特徴(画像の特徴)があり、それぞれ[0、1]に線形にスケーリングされます。

LIBSVMとGaussian RGBカーネルを使用しています。5分割の相互検証を使用して、log₂C∈[-5、15]およびlog₂ɣ∈[-15、3]のグリッド検索を実行しました。結果は次のとおりです。

グリッド検索の結果

12の分類問題すべてに高い精度を与える単一のパラメータセットがないことにがっかりしました。また、グリッドは一般に、低い精度で囲まれた高精度の領域を示していないことにも驚きました。これは、検索パラメータースペースを拡張する必要があるということだけですか、それともグリッド検索は何か他の問題があることを示しているのですか?


2
残念なことに、各問題が同じパラメータを持つとは思わないでしょう。なぜ、問題がハイパーパラメータ(ログガンマとC)の適切な値を共有すると期待するのでしょうか。
共役前の

@Conjugate Prior:トレーニングセットは同じ実験のサブセットであり、負のトレーニングセットは同じ母集団からサンプリングされているため、同じRBFカーネル幅beが有効であることを期待していました。ポジティブセットは同じバックグラウンド(ネガティブ)集団から区別されているため、理想的なペナルティCも同様になることを期待していました。これが当てはまらない場合、SVMの適用が本当に難しくなります。たとえば、穏やかなブーストは調整がはるかに簡単に思えます。
Vebjorn Ljosa、2011

あは。しかし、物理的な意味では同じ実験ですが、統計的な意味で別の異なる問題を攻撃しているように見えます。特に、ネガティブケースが処理ごとに再サンプリングされる場合。
共役前の

1
ところで、グリッド検索はかなり非効率的です。勾配降下最適化法と同様に、ネルダーミードシンプレックス最適化アルゴリズムは非常に効果的です。グリッド検索は単純ですが、少し「総当たり」です。
Dikran Marsupial 2011

@Vebjorn Ljosa(1年後)、5つの値はどのくらい散らばっていますか?12のプロットはすべて同じスケールですか?たとえば、50%.. 100%正しい予測ですか?ありがとう
denis

回答:


9

ハイパーパラメーターの最適値は、学習タスクごとに異なります。問題ごとに個別に調整する必要があります。

単一の最適値が得られない理由は、カーネルパラメーターと正則化パラメーターの両方がモデルの複雑さを制御するためです。Cが小さい場合、滑らかなモデルが得られます。同様に、カーネルが広い場合、滑らかなモデルが得られます(基底関数はあまり局所的ではないため)。これは、Cとカーネル幅のさまざまな組み合わせにより、同様のパフォーマンスを持つ同様に複雑なモデルがもたらされることを意味します(これにより、多くのプロットで対角線の特徴が得られます)。

最適値は、トレーニングセットの特定のサンプリングにも依存します。クロス検証エラーを過剰に適合させることが可能であるため、クロス検証によってハイパーパラメーターを選択すると、運が悪ければ実際にパフォーマンスが低下する可能性があります。これについての議論については、CawleyとTalbotを参照してください。

同様に適切な値が得られるハイパーパラメーターの値の広いプラトーがあるという事実は、モデル選択における過剰適合に対して過度に脆弱ではないことを示唆しているため、実際にはサポートベクターマシンの優れた機能です。最適な値で鋭いピークがあった場合、有限のデータセットを使用してそのピークを見つけるのは困難であり、そのピークが実際にどこに存在するかについて信頼できない指標を提供するため、それは悪いことです。


ところで、私はグリッドサーチを使用したモデル選択の過剰適合に関する研究を行っています。これは、私が思っていたよりもはるかに興味深いことがわかりました。ハイパーパラメータが少ない場合でも、グリッド上で最適化すると細かすぎるため、モデル選択基準を過剰適合させる可能性があります。
Dikran Marsupial 2012

シミュレーション作業の終わりに
近づいてい

完成したらその論文を読みたいのですが。グリッド検索の最適化で奇妙なスパイクなどに遭遇しました。これは、あなたがここで説明しているものに似ているようです。
BGreene 2012

これですべてのシミュレーション作業が完了しました。現時点では紙をまとめています(ほとんどすべてが完全に再現可能であることを確認しています)。私はすべてのグリッドを保存したので、当時は考えていなかった他の質問を調べるために、いくつかの再分析が可能になるはずです。
Dikran Marsupial 2012
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.