(なぜ)コホーネンスタイルのSOMは支持されなくなったのですか?


33

私の知る限り、コホーネンスタイルのSOMは2005年頃にピークを迎えましたが、最近はあまり好まれていません。私は、SOMが別の方法に包まれている、または他の方法と同等であると証明されている(とにかく高次元で)ことを示す論文を見つけませんでした。しかし、たとえばWikipediaやSciKit Learnなどでは、tSNEや他のメソッドがより多くのインクを獲得しているように思われ、SOMは歴史的なメソッドとしてより多く言及されています。

(実際、Wikipediaの記事は、SOMが競合他社に対して一定の利点を持ち続けていることを示しているように見えますが、リストの中で最も短いエントリでもあります。編集:gungのリクエストにより、私が考えている記事の1つは、非線形次元削減です。SOMは他の方法よりも記述されていないことに注意してください。SOMが他のほとんどの方法よりも優れているという利点を述べた記事を見つけることができません。)

洞察はありますか?他の誰かがなぜSOMが使用されていないのかを尋ね、しばらく前から参考文献を入手し、SOM会議の議事録を見つけましたが、SVMやtSNEなどの台頭がポップ機械学習でSOMを覆い隠しただけではないかと思っていました。

編集2:純粋な偶然の一致により、私は今晩、非線形次元削減に関する2008年の調査を読んでいたが、例としてのみ言及している:Isomap(2000)、locally linear embedding(LLE)(2000)、Hessian LLE(2003)、Laplacian eigenmaps(2003)、および半正定値埋め込み(SDE)(2004)。


3
参照しているリソースにリンクできますか?(例えば、Wikipediaの記事は"示すように見える..."?)
GUNG -復活モニカ

11
彼らは、SOMが何を指しているのか私には分からないという程度まで、好意を失っているようです。
マシュードゥルーリー

5
どうやら、自己組織化マップ
クリストフハンク

SOMは、はるかに古い多次元スケーリング(MDS)の一種です。
kjetil bハルヴォルセン

@kjetilbhalvorsen:SOMとMDSに関する参考資料はありますか?私が理解しているように、MDSは本質的にグローバル(PCAに関連)ですが、SOMは本質的にローカルです。または多分私はそれらを誤解しています。
ウェイン

回答:


18

機械学習が現在、次元削減のための「最良の」アルゴリズムと宣伝しているものの影響に注目することで、何かに取り組んでいると思います。t-SNEはMerck Viz Challengeなどの競技会でその有効性を示していますが、個人的には特徴抽出とバイナリ分類の両方にSOMを実装することに成功しています。確かに、アルゴリズムの年齢以外に正当化せずにSOMを却下する人もいます(この議論を確認してください) 2013 ; Frenkel et al。、2013例えば)。Google Scholarの検索により、SOMが多くのアプリケーションドメイン内で依然として使用されていることが明らかになります。ただし、一般的なルールとして、特定のタスクに最適なアルゴリズムは、まさにその特定のタスクに最適なアルゴリズムです。ランダムフォレストが特定のバイナリ分類タスクでうまく機能している場合、別のフォレストで恐ろしく実行される可能性があります。同じことは、クラスタリング、回帰、および最適化タスクにも当てはまります。この現象は、無料昼食の定理に結びついていますが、これは別の議論のトピックです。要するに、特定のタスクでSOMが最適に機能する場合、それは人気のあるものに関係なく、そのタスクに使用すべきアルゴリズムです。


5

SOMとt-SNEなどを比較する研究を行い、SOMを新しいレベルの効率にするSOMの改善も提案しました。こちらをご覧になり、フィードバックをお寄せください。人々がそれについてどう考えているか、そして人々が使用するためにPythonで公開する価値があるかどうかについてのアイデアを得たいと思います。

IEEEの論文へのリンク:http : //ieeexplore.ieee.org/document/6178802/

Matlabの実装。 https://www.mathworks.com/matlabcentral/fileexchange/35538​​-cluster-reinforcement--cr--phase

ご意見をいただきありがとうございます。


4
Cross Validatedへようこそ!調査結果の簡単な要約、およびあなたが行った改善を提供すること、そしておそらくより直接質問に対処することも助けになります。
Scortchi -復活モニカ

1

私の主観的な見方では、SOMは他の多くの方法よりもあまり知られておらず、「セクシー」ではないと認識されていますが、それでも特定のクラスの問題に非常に関連しています。それらがより広く使用された場合、彼らが作るために重要な貢献をするであろうことはよくあるかもしれません。探索的データサイエンスの初期段階では、多変量データの「風景」または「トポロジ」を把握するために非常に貴重です。

Somocluなどのライブラリの開発、およびGuénaëlCabanes(他の多くのものも含む)による研究などは、SOMが依然として関連していることを示しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.