回答:
ディープネットワークには、「通常の」ネットワークとの主な違いが2つあります。
1つ目は、計算能力とトレーニングデータセットが大幅に増加したことです。つまり、大規模なネットワークを実行し、統計的に有効であることが実用的です(つまり、大規模なネットワークで適合しすぎた問題に遭遇しないだけの十分なトレーニング例があります)。
2つ目は、レイヤーが多いほど、バックプロパゲーションが制限されることです。各層はエラーの勾配を表すため、約6層の深さまでに、ニューロンの重みを変更するためのエラーはほとんど残っていません。しかし、生の入力により近い「概念」を表すので、初期のニューロンが後期のニューロンよりも重要であると合理的に期待できます。
新しいトレーニング手法はこの問題を回避します。通常、生の入力に対して教師なし学習を行い、教師付き学習の入力として役立つ高レベルの「概念」を作成します。
(たとえば、画像にピクセルの猫が含まれているかどうかを判断する問題を検討してください。ネットワークの初期のレイヤーは、エッジの検出などを行う必要があります。これは、すべての画像で共有され、ほとんどの場合は独立していると期待できます。 1つは出力層を処理しようとしているため、多くの層の「猫ではなく猫」信号を介してトレーニングすることも困難です。
人工ニューラルネットワークの一般的な構造
入力レイヤー+非表示レイヤー+出力レイヤー
人工ニューラルネットワークにより多くの隠れ層がある場合、ニューラルネットワークはディープニューラルネットワークと呼ばれます。ディープニューラルネットワークを正確に何個構成するかは議論のポイントですが、一般的に、隠れ層が多いほど、ニューラルネットワークは深くなります。
なぜそれらが非常に人気があるか重要であるかを考えると、オブジェクト検出、分類、顔認識、音声認識などの多くの問題がディープニューラルネットワークの登場で解決されました。ディープニューラルネットワークのパフォーマンスは、上記のタスクの多くで人間のパフォーマンスさえも超えていたと言っても過言ではありません。つまり、コンピュータは人間よりも上記のタスクを実行するのに最適です。上記のすべての問題は、ほぼ50年前から研究分野にありました。ディープニューラルネットワークの成功により、これらすべてが過去4、5年間で完全に解決されました。それが彼らが非常に人気があり重要である理由です。私が取り組んだ問題はほとんどありませんでした。過去10年間でディープニューラルネットワークが簡単に解決した多くの同様のタスクがあります。
そして、現時点では、世界中の多くの人々が、ディープニューラルネットワークを使用して無数のアプリケーションを解決することに取り組んでいます。