現在、グリッドサーチを使用して、サポートベクターマシンをトレーニングしています。パラメータガンマとCがある場合、R関数tune.svmがこれら2つのパラメーターのすべての組み合わせに対して10分割交差検証を実行することを理解しています。
開始方法がわからなかったので、それについていくつかの情報を取得しようとしました。たとえば、wikipedia 2は線形ではない値を提案しています(例:{10、100、1000}の範囲のC)。
これまでのところ、2番目のウィキペディアリンクの例を使用しています。
gammas = 2^(-15:3)
costs = 2^(-5:15)
その結果、399の組み合わせになります。
これには非常に時間がかかります(約2000サンプル)。たとえば、カーネル「放射状」の場合、最善の結果はガンマ= 0.5、コスト= 2です。
コストに(1、2、3、4、... 10)とガンマに(0、0.5、1、1.5、2)のような値を使用しただけでは、同じ結果が得られませんか?結果がわかっているので、この例が構成されていることを知っています。
私の質問:
しかし、なぜこの指数スケールなのでしょうか?
0と1の間には非常に多くの値があるため、これは計算時間の浪費であり、非常に大きな数が少ないため、とにかく正確な結果を見つけることができませんでした。これが狭い範囲を見つけるために使用された場合にのみ意味があります。たとえば、最適なコストが2 ^ 3であることがわかっていて、そのあたりを検索するとします。しかし、そのように実行されることはどこにも言及されていません。