優れたアルゴリズム、機械学習、線形代数なし


30

私は高度なアルゴリズムコースを教えていますが、機械学習に関連するいくつかのトピックを含めたいと思います。これらのトピックは、生徒にとって興味深いものです。その結果、機械学習で現在最も興味深い/最大のアルゴリズム結果についての人々の意見を聞きたいと思います。潜在的にトリッキーな制約は、学生が線形代数や機械学習の他の主要なトピックに関する特定の以前の知識を持っていないということです。

これは本当にトピックについて彼らを興奮させ、MLがアルゴリズムの専門家にとって潜在的に刺激的な研究分野であることを彼らに知らせることです。

編集:これは最終年度の学部課程です(主に英国には大学院課程がないため)。彼らは事前に少なくとも1つの基本的なアルゴリズムコースを実施しており、おそらく高度なフォローアップコースを選択するのに十分な成績を収めているでしょう。上級コースの現在のシラバスには、完全ハッシュ、ブルームフィルター、van Emde Boas木、線形プログラム、約 NP困難問題などのアルゴリズム。MLだけに複数の講義を費やすつもりはありませんが、アルゴリズムコースとMLコースの両方に本当に関連がある場合は、もちろんそれも含めることができます。


1
次の2つのことを明確にしてください。1)学部課程ですか、大学院課程ですか?どの関連コース(もしあれば)合格しましたか?2)MLにどのくらいの時間を費やしますか?
MS Dousti

3
うーん、少なくとも機械学習の面では、線形代数は必須の重要な基礎コースだと思います。線形モデルは機械学習アルゴリズムの非常に優れた入門書だと思います。K最近傍アルゴリズムやロジスティック回帰アルゴリズムなど、他の基本レベルのアルゴリズムを考えることもできます。これはあなたを助けるかもしれませんen.wikipedia.org/wiki/List_of_machine_learning_algorithms
Deyaa

1
おそらく、どのようにハルDaumeからいくつかのアイデアは、機械学習を教えて- nlpers.blogspot.com/2010/04/how-i-teach-machine-learning.html
ヤロスラフBulatov

3
親愛なるラファエル、アヴリム・ブルームは通常、機械学習といくつかの関連トピックで上級レベルのアルゴリズムクラスを締めくくります。最近の繰り返しは、次のリンクcs.cmu.edu/~avrim/451f09/index.htmlにあります。詳細については、彼のWebページから入手できます。このクラスをTAで受講し、受講したことから、受講生は非常に温かく迎えられていると言えます。
-matus

回答:


29

ブースティングをカバーできます。非常に賢く、実装が簡単で、実際に広く使用されており、理解するために必要な知識はあまり必要ありません。


5
私は、Aroraらによる調査の一部を発表しました。(cs.princeton.edu/~arora/pubs/MWsurvey.pdf)数年前の大学院理論クラスで。人々はそれを気に入っているようで、この資料を理解するのに背景はほとんど必要ないと思います。
ダヌ

9

1回の講義で食欲をそそりたいだけの場合は、強力なアプリケーションを提示するのが最もエキサイティングかもしれません。たとえば、サポートベクターマシン、およびその他の機械学習アルゴリズムは、創薬の化学情報学で使用されます。

学習の問題は基本的に、化学物質に見せたい動作を与え、類似の(または異なる)動作を示す既知の構造のデータベースから推定することで、その動作を示す構造を考案します。学習の問題には余分なしわがあります。新薬は、特許財産を設立するために、以前から知られている薬とグローバルな構造で「離れている」必要があります。

1つのソースは、クラスタリング手法と計算化学におけるそれらの使用です。


1
参照いただきありがとうございます。SVMを凸最適化のアプリケーションとして教えることを考えていました。それはアルゴリズム部分とML部分をうまく関連付けます。
ラファエル

2
線形代数のないSVMをどのようにカバーしますか?
レフレイジン

私は彼らに私のコースでそれのための最小の前提条件を教えることを望んでいました。たぶんそれは楽観的すぎる:
ラファエル

サポートベクターマシンが最良の選択である重要な例はまだありますか?たとえば、kaggleコンテストでは、それらが優勝作品の主要な部分になることはありません。少なくとも最近私が見たことはありません。(もちろん修正される予定です。)
レンビク

7

K-MeansおよびKNNは非常に強力であり、ポイントの距離の計算を除き、線形代数を必要としません。


特にK-Meansは非常に強力なアルゴリズムです。目的関数のパフォーマンスに限界があることが証明されていないにもかかわらず、信じられないほど効果的です。これは、シンプレックスアルゴリズムの有効な多項式複雑度(実際の指数関数的複雑度にもかかわらず)とほぼ同じくらい不気味な程度です。オンライン版は、大規模なデータアプリケーションでも役立ちます。
エリオットJJ

5

クリストファー・ビショップ(MSR)による「ニューラルネットワークと機械学習」の第2部は、MLのアルゴリズムについてです。Bishopの教科書は、一般に大学院(およびその後の学部)の教科書に使用され、非常によく書かれています。


4

このアルゴリズムは、グラフの最小カットを使用して、少量のラベル付きサンプルのみを使用して、大量のラベルなしサンプルを分類します。

その学部に優しい。ランダムに選ばれた数人の学部生にこれを説明しましたが、彼らはそれを理解しました。

参照: Blum、A.、&Chawla、S.(2001)。グラフミニカットを使用したラベル付きデータとラベルなしデータからの学習。

セルフプロモーションyoutubeでのアルゴリズムの視覚化。



1

強化学習アルゴリズム(特にQ-LearningとSARSA)は、理解するのが非常に簡単で、学習の問題を解決するのに非常に強力です。収束証明と収束率を除き、線形代数の高度な知識は必要ありません。

リットマンおよびその他の有名な調査を使用できます:http ://www.cs.cmu.edu/afs/cs/project/jair/pub/volume4/kaelbling96a-html/rl-survey.html


1

古典的なアルゴリズムまたは直感的なアルゴリズムをカバーできます。

たとえば、C4.5およびCARTは、古典的な決定木アルゴリズムです。

また、いくつかのアンサンブルメソッド(例:AdaBoost(Boosting)、Bagging)をカバーできます。これらのメソッドは、実際のアプリケーションで非常に優れたパフォーマンスを発揮します。

さらに、ディープラーニングも非常に暑いので良いトピックです。



0

ネイティブベイズおよびベイジアンネットワーク、決定木アルゴリズムは、ニュートラルネットワークまたはsvmで開始するよりも視覚化が非常に簡単です


0

遺伝的プログラミングは本当にクールです。生物学からのインスピレーションを使用し、膨大な数の問題(たとえば、n-queens問題やTSP)に適用できます。

深い数学のスキルは必要ありません。

編集:それは、潜在的な解決策がどれほど優れているかを推定する方法のみを必要とします。たとえば、一連の数値の背後にあるルールを推測し、多変量問題の最小/最大を見つけ、巨大なパラメーター空間を検索するために使用できます。最適なソリューションに興味がない場合に適していますが、十分なソリューションが必要な場合に適しています。これは、ゲームの優れた戦略(Starcraft 2で注文を作成し、Marioで最適なプレイ)を見つけるために使用されたと思います。


それが最良の方法である重要な問題はありますか?確かに、たとえばTSP向けではないということです。
レンビク
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.