AIの研究で「高度な数学」はどの程度必要/有用ですか?


19

現在、数学を勉強しています。しかし、将来、プロの数学者になりたいとは思わない。数学の知識を人工知能の研究に応用することを考えています。しかし、数学コースを何回履修すればよいのかわかりません。(そして私が従うべきCS理論コース。)

Quoraから、線形代数、統計、凸最適化の主題が機械学習に最も関連していることを学びました(この質問を参照)。人工知能を研究するには、線形代数、確率/統計、計算、基本アルゴリズム、およびロジックの学習が必要であると他の誰かが言及しました(この質問を参照)。

私の大学で数学の学士号を取得した最初の1.5年間で、これらすべての科目について学ぶことができます。

しかし、人工知能を研究するのに役立つ、または必要な大学院レベルの数学の科目の上位学部があるのではないかと思っていました。ODE、PDE、トポロジ、測定理論、線形解析、フーリエ解析、多様体の解析はどうですか?

いくつかの非常に高度な数学が人工知能の研究に役立つことを示唆している1つの本は、パターン理論です。DavidMumfordとAgnes Desolneuxによる現実世界の信号の確率的分析ですこのページを参照)。マルコフ連鎖、区分的ガウスモデル、ギブス場、多様体、リー群、リー代数、およびパターン理論への応用に関する章が含まれています。この本はAIの研究にどの程度役立ちますか?


22
このサイトでの2年以上の間に、「どのような数学が必要なのか...」というタイプの質問が6数件以上ありました。プリンストンコンパニオンオブ数学の内容のように読めるQueの回答。1)AIは巨大なフィールドであり、そのサブフィールドで使用される数学にはあらゆる種類があります。2)基本的な数学コースを受講し、興味に基づいてより高度なコースを選択します。3)AIの研究を行い、好きなものを見つけ、そこで使用されている数学を見つけます。4)この問題やその問題に役立つ数学をアプリオリに知ることはできません。
サショニコロフ

回答:


56

conめたくはありませんが、学部レベルや大学院レベルのコースで学んでいる数学は進んでいません。それが基本です。あなたの質問のタイトルは次のようにすべきです:「基本的な」数学はAI研究に必要/有用ですか?ですから、できる限り飲み込んで、数学を知りすぎていると文句を言うコンピューター科学者に会ったことはありません。AIの大学院生がページランクスタイルのアルゴリズムを理解するのを助けたことを覚えています。それはかなり簡単な線形代数でしたが、彼は固有値と固有ベクトルが何であるかについての感覚を持っていなかったために苦しみました。AIの人々が実際に多くの数学を知っていた場合にできることを想像してみてください!

私は数学科で教えており、数学の学生を好むので、CS PhDの数学専攻を推薦するように、CSの同僚から定期的に依頼を受けています。数学を独力で学ぶのは本当に難しいのですが、コンピューターサイエンスのほとんどの側面はそうではありません。私は、CSの大学院に入学した数学専攻でした。確かに、私はオペレーティングシステムの知識については「背後」にありました(UnixとVMSについてはある程度の知識はありましたが)が、「理論」についてはずっと先を行っていました。対称的な状況ではありません。


6
測定理論と確率理論は、すべての確率論的推論の基礎です。トポロジは、トポロジカルデータ分析にとって非常に重要になりました。フーリエ解析は理論の学習に重要であり(関数の感度とその学習がいかに難しいかを理解するために使用されます)、多様体の学習には多様体のジオメトリの深い理解が必要です。
スレシュヴェンカト

2
@MaxMuller:そして、リストを続けるために、グループ理論と代数(リー代数のような)は、トポロジーが非常に必要な画像の分解理論のパターン認識で広く使用されます(そしてリー代数と多様体の間には深いつながりがあります)途中で学びます)。Monique Pavelの「Fundamentals of Pattern Recognition」などの書籍では、カテゴリ理論とその応用についても紹介されています。これは、AIで形式言語および証明理論(推論の理論になり得る)の基礎で使用するためにも非常に重要です...
ex0du5

1
過去のイントロレベルの大学院コース、数学者は自分ですべての数学を学ぶ(またはグループやセミナーを読んで)...それがすべてではないことをあなたには、いくつかの基礎を持っているハード場合は... [OK]を、それは難しいことができますが、それは不可能ではありません。
サショニコロフ

1
マックス、合気道も教えます。合気道の生徒が「なぜ基礎を学ばなければならないのか(どのように倒れ、攻撃ラインから移動するのか)」と尋ねた人はいません。教師が自分のしていることを知っていることを少し信頼する必要がある場合があります。しかし、特に高校生や小学校で数学を教えているのは、あたかも学生の好奇心を抑えることであるかのように、多くのがらくたを教えることを認めるのは私が最初です。しかし、あなたの場合、あなたがリストした主題は、がらくたではありません。私を信じて。
アンドレイバウアー

13
そして、もう1つコメントがあります。CSの一部の分野で既に有用であることが証明されている数学のみを学んだ場合、新しい数学を適用する機会はありません。あなたはいつも後ろにいます。科学は芸術であり、9対5の仕事ではありません。「物理学を学ぶべきなのか、AIになりたい」と聞かれたら、「絶対にそうだ!」と言います。そして、「社会学を学ぶべきなのか、AIになりたい」と尋ねたとしても、私の答えは同じです。
アンドレイバウアー

6

マックス、これは(必然的に)部分的なリストです:

あらゆる場所で基本的な線形代数と確率が必要です。そのための参照は必要ないと思います。

私の知る限り、フーリエ解析はいくつかの学習理論関連の調査で使用されています。たとえば、このペーパーをご覧ください。

多岐にわたる学習の概念が普及しつつあり、ミハイル・ベルキンとパルタ・ニヨギの作品を見てみましょう。この一連の作業では、多様体とリーマン幾何学に関連するさまざまな概念を理解する必要があります。

機械学習にはもう1つの側面があります。これは、統計の根底にあります。つまり、 情報ジオメトリです。この領域は、リーマン幾何学、情報理論、フィッシャー情報などのさまざまな概念と結びついています。この種の研究のいとこは、代数統計にあります。これは、多くの可能性を秘めた新生分野です。

渡辺純夫は、異なるフロンティア、すなわち学習モデルにおける特異点の存在と、代数幾何学からの解像度の深い結果を適用して多くの質問に対処する方法を調査しました。渡辺の結果は、彼がフィールズメダルを獲得した広中平助の著名な作品に大きく依存しています。

私は比較的重い計算を必要とする他の多くの分野を省略していると思います。しかし、アンドレイが指摘したように、それらのほとんどはおそらく数学の最前線にあるのではなく、比較的古く確立された領域です。

しかし、とにかく、Amazonの推奨システムやApache Mahoutにある機械学習ライブラリなど、メインストリームコンピューティングに入ったAIの現在の状態は、高度な数学を必要としないと思います。私は間違っているかもしれません。


2

高度な定義、およびどのようなAIを学習するかによって異なります。

AIの多くの問題は難治性です-POMDPの最適な解決策はNP完全であり、DEC-POMDPの最適な解決策はNEXP完全であるなどです。そして、それらの理論的基盤が優れています。(メジャー理論などに加えて、POMDPモデルの基礎となるベイズ確率を真に理解する必要がありました。)

特に、マルチエージェント人工知能はゲーム理論と交差しています。そのため、ゲーム理論を知ることは役に立ちます。ゲーム理論は、トポロジー、測定理論などに依存します。同様に、ゲーム理論の多くの問題は扱いにくいものです。近似によっては扱いにくいものもあり、有用に近似できる場合を理解することでさえ、かなりの量の数学が必要になります。

(ゲーム理論家は過去数年間、ノーベル経済学の分野でかなり良い成績を収めており、それは本質的に非常に数学的なことです。20年後には、今日のアルゴリズムゲーム理論家もほぼ同じになるでしょうポジション。)


1

AIに関係する数学は高度ではなく、学部レベルで教えられます。AIトレーニングと推論アルゴリズムは、高度なコンピューターサイエンスの領域にあります。

ちょっとした単語ゲームです。AIを研究する際には、いくつかの履歴も含める必要があります。

たとえば、現在の命名法では、ディープラーニングはAIのトレンドキーワードのようです。

ディープラーニングは、ヒントンの逆伝播パーセプトロンネットワークモデル(BACKPROP)などの人工ニ​​ューラルネットワーク(ANN)と呼ばれていたものです。

(たとえば)BACKPROP ANNに関係する数学は、基本的にトレーニング用の微分計算、および推論用の行列代数です。

ディープラーニングの新しい側面は、トレーニングアルゴリズムと推論アルゴリズムの物理的な分離です。CPUはトレーニングに引き続き使用されますが、現在は推論にGPUが使用されています。

たとえば、ANN行列は、補正導関数計算を使用して誤差を逆伝播することによりトレーニング(重み付け)されます。これはCPUに最適であり、ANN展開ごとに1回だけ実行する必要があります。

その後、ANNは高度に並列化されたGPUアーキテクチャに展開されます。前方推論数学には、GPU向けに設計された集中的な行列代数が含まれます。

これにより、以前のCPUベースの展開と比較して、展開されたANNのパフォーマンスが数桁向上し、任意の数の専用GPUでより効率的にスケーリングできます。

NvidiaやAMDなどの企業は現在、非常にハイエンドのGPUチップセットをDeep Learning Machinesとして販売しています。GPUという用語は、実際には汎用の並列プロセッサであるため、常に少し間違った呼び名でした。たとえば、GPUはブロックチェーンアプリケーションではビットマイナーとも呼ばれます。

それで、古いものは新しいものになりました。関係する数学は変更されておらず、コンピューターサイエンスの用語のみが変更されています(主にマーケティングのプレッシャーによる)。

AIという用語は、常に少し暗い馬と見なされてきました。ディープラーニングは現在、政治的に正しい、市場に優しい用語です。


2
前の回答は、すでに最初の文でのご請求に反例を与えています。(他にもたくさんあります。)投稿する前に以前の回答を読みましたか?この回答を編集して、申し立てを絞り込むことができます。
DW

2
「CPUはまだトレーニング[深いネットワーク]に使用されているが、現在はGPUが推論に使用されている」という主張はかなり誤解を招く(間違っていなければ)。誰もが最新のニューラルネットワークをGPUでトレーニングしています。ほとんどの人はGPUでもそれらを展開しますが、一部の展開環境(携帯電話など)ではCPUを使用しています。
マイクIzbicki

マイクに同意します。「GPUは推論のための訓練とCPUのために使用されている」「CPUが推論のための訓練のために使用し、GPUをしている」と言っ未満間違っている
ASDF

@MikeIzbicki CUDA、OpenCLなどのパイプラインアーキテクチャは、エラー修正のためにCPUコアに大きく依存するディープラーニングのトレーニングに必要です。推論パイプラインに必要なのは、GPUコアの供給と収集にCPUコアのみです。電力効率と熱効率が目標であるため、コアタイプのバランスがトレーニングと推論の間でシフトします。これは私がすでに言ったことです。
ビルケンソックス

-1

AIは、可能なルートの範囲が非常に広い分野です。非常に数学的なものもあれば、かろうじて数学に触れるものもあります。他の人は、より数学的なアプローチに対してすでに良い答えを与えています。あなたが指摘した主題のうち、

「線形代数、確率/統計、計算、基本的なアルゴリズムとロジック」

-基本的にそれらすべてを必要とするか、すべての恩恵を受けるでしょう。多くのアプローチは、確率と統計に少なくとも部分的に直接基づいています-ヒューリスティック、ニューラルネットワーク、遺伝的アルゴリズム、ファジーロジック。微積分も同様に有用です-AIや一般的なコンピューティングサイエンスでは、ほぼすべての場所で使用できます。線形代数もあなたが間違いなく必要なものです。

CS / AIの観点から最も重要な2つの主題は、アルゴリズムとロジック、アルゴリズムはコンピューティングサイエンスの真の核、そしてロジックはアルゴリズムの根底にある「言語」です。基本プログラミングの練習は、ほぼすべてのコンピューターサイエンスまたはAI科目の最も重要な基盤の1つです。プログラミングは、大学が常に教えることを特に得意とするスキルでもありません。ロジックは、AIのほとんどのブランチにとって本当に不可欠です。ブール論理、述語計算、記号論理、置換の基礎理論、設計の階層、再帰、有限状態機械、チューリング機械、CPU設計など。

「Strong AI」数学の私自身の分野への拡張は、根底にあるが絶対に不可欠な役割を果たします。基本的な数学を非常によく理解することは、おそらく高等な数学よりも重要ですが、実際に取り上げたものはどれでも役に立ちます。Strong AIのような初期のフィールドでの本当の問題は、すべてが空中にあるため、フィールドが完全に流れていることです。
潜在的に有用な科目には、ニューラルネットワーク、遺伝的アルゴリズム、神経学、遺伝学、心理学、サイバネティックス、ロボット工学、3Dグラフィックス理論、画像処理理論、コンピューターゲームデザイン、哲学、芸術理論、デジタルエレクトロニクス、言語理論などがあります。この読書は学ぶための最も重要な方法の一つです。私にとって出発点であった本は、ロジャー・ペンローズの「皇帝の新しい心」、RLグレゴリーの「目と脳」ですが、ほとんどどこからでも洞察を得ることができました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.