SVMがまだ優れているアプリケーションはありますか?


10

SVMアルゴリズムはかなり古く、1960年代に開発されましたが、1990年代と2000年代には非常に人気がありました。これは、機械学習コースの古典的な(そして非常に美しい)部分です。

今日、メディア処理(画像、音声など)ではニューラルネットワークが完全に支配しているようですが、他の分野では、勾配ブースティングが非常に強力な位置を占めています。

また、最近のデータ競争では、SVMベースのソリューションは見られません。

SVMが最新の結果を出すアプリケーション例を探しています(2016年現在)。

更新: SVMを説明するときに、学生や同僚に例を挙げて、純粋に理論的または非推奨のアプローチのように見えないようにしたいと思います。


3
どのような意味で優れていますか?いくつかのパフォーマンス指標?ディープニューラルネットをトレーニングするには、かなりの量のコンピューター時間が必要ですが、ラップトップでサービス可能なSVMをトレーニングできます。
Sycoraxは、モニカを2016

@ user777もちろん、アプリケーション分野に適した分類/回帰指標を意味します。DLの計算の複雑さに関する問題は重要ですが、これはこの質問の範囲から少し外れています。
Alleo

回答:


11

論文によると、実際の分類問題を解決するには何百もの分類子が必要ですか?SVMは、ランダムフォレストおよびグラデーションブートマシンと共に、120以上のデータセットの大規模なセット(メトリックとして精度を使用)の最高の分類アルゴリズムの1つです。

私はいくつかの変更を加えて実験を繰り返しましたが、これらの3つの分類子は他の分類子よりも優れたパフォーマンスを発揮しますが、無料ランチ定理が言うように、他のアルゴリズムがこれら3つよりも優れたパフォーマンスを発揮するという問題が常にあります。

だからはい、私はSVM(Gaussianカーネルを使用-これは私が使用したものです)がまだメディアに関連しないデータセットに関連するアルゴリズムであると言います。


こんにちは、応答をありがとう!この興味深い研究を見てきました。私が理解している限り、このアイデアは、深刻な調整なしで分類子が与える量を確認することでした(データアナリスト IMOの調整実行する必要があります)。地域に関連した研究はもっと興味深いでしょう。
Alleo、2016年

1
Delgado et allは、最良のハイパーパラメータの非常に詳細な検索を実行しなかったが、何らかの検索を実行した場合を覚えています。質問(私には答えはありません)は、最高のハイパーパラメーターをよりきめ細かく検索すると異なる結果になるかどうかです。それが本当なら、SVMと競合するアルゴリズムは一般に、特定のハイパーパラメーターの精度に非常に鋭いピークがあることを意味します。
Jacques Wainer、2016年

また、マイナーなコメントの1つは、UCIデータセット(テストに使用される)はほとんど非常に小さいということです。これがブースティングの悪い結果の説明になるのだろうか?kaggleの課題のほとんど(データが多い)は、GBの優れたパフォーマンスを示しています。
Alleo、2016年

データセットが小さいことに同意します。大規模なデータセットの場合、現時点でランダムフォレストを使用しています。ハイパーパラメータに慣れたらすぐにGBMの使用を開始します。GBMがどの程度適切かはわかりません。
Jacques Wainer、2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.