私の博士号 純粋な数学であり、私は理論的なCSについてあまり知らない(つまり何も)ことを認めます。しかし、私は自分のキャリアのための非学術的オプションの調査を開始し、機械学習を紹介する中で、「ニューラルネットワークがうまく機能する理由を誰も理解していない」などの文句を見つけました。
私の質問は、本質的に、研究者はどのような答えを望んでいるのですか?トピックに関する簡単な検索で見つけたものは次のとおりです。
- 単純なニューラルネットワークを実装するアルゴリズムは非常に簡単です。
- SGDのプロセスは、統計理論と同様に数学的に十分に理解されています。
- 普遍的な近似定理は強力で証明されています。
- 素晴らしい最近の論文https://arxiv.org/abs/1608.08225があります。これは、モデル化しようとしている関数について強力な単純化仮定を立てることができるため、普遍的な近似は実際に実際に必要なものよりもはるかに多いという答えを本質的に提供します神経網。
前述の論文では、「GOFAIアルゴリズムは分析的に完全に理解されていますが、多くのANNアルゴリズムは発見的にしか理解されていません」と述べています。実装されたアルゴリズムの収束定理は、ニューラルネットワークについて持っていると思われる分析的理解の例であるため、この一般性のレベルでのステートメントは、既知のものと未知のもの、または「答え」とみなされるものについてあまり教えてくれません」
著者らは、結論として、与えられた多項式を近似するために必要なニューラルネットワークのサイズの有効な境界などの質問は、オープンで興味深いものであると示唆しています。私たちがニューラルネットワークを「理解している」と言うために答える必要がある数学的に特定の分析的な質問の他の例は何ですか?より純粋な数学言語で答えられる質問はありますか?
(この論文では物理学を使用しているため、表現理論の方法を具体的に考えています-そして、勝手に、それは私の研究分野であるためです。しかし、組み合わせ論/グラフ理論、代数幾何学などの分野も想像できます、実行可能なツールを提供するトポロジ。)