ディープニューラルネットワーク—画像分類専用ですか？

深い信念または畳み込みニューラルネットワークを使用して見つけたすべての例は、画像分類、チャットの検出、または音声認識にそれらを使用します。

ディープニューラルネットワークは、特徴が構造化されていない（たとえば、シーケンスまたはグリッドに配置されていない）古典的な回帰タスクにも役立ちますか？はいの場合、例を挙げることができますか？

— ジュリアン
ソース

最初の文は、畳み込みニューラルネットワークを表示します。それらを深い信念のネットワークと混同しているようです。どちらもニューラルネットワークの形式ですが、これらは同じではありません。

— -MSalters

私は@msaltersに同意しますが、深い信念ネットワークは本当に深いネットワークであり、限られた成功しか収めていませんが、畳み込みネットはハイブリッドに似ています-畳み込み層の適応画像フィルタは浅いnnに続きます。

— seanv507

「観測」が「構造化されていない（シーケンスまたはグリッドに配置されていない）」とはどういう意味ですか？個々のピクセルがグリッド上に配置されているという意味で、「構造化された」画像を参照していますか？しかし、それは「観測」ではなく「構造化された」機能です（個々の画像になります）。

— アメーバは、モニカを復活

すべての畳み込みネットワークは深く、すべてが深いネットワークではなく畳み込みであり、同様にすべての深い信念ネットワークは深く、すべての深いネットワークは深い信念ネットワークではありません。実際、深くも畳み込み的でもない深いネットワークを持つことができます。それらは訓練するのが難しい傾向があります。ただし、用語に関する無意味な議論の余地は確かにあります。

— リンドンホワイト

畳み込みネットワークを非構造化（シーケンス/グリッドなどではない）データに適用することはできません。基本的に意味がありません。たたみ込みネットワークは、入力のフーリエ変換の取得に密接に関連しています。たとえば、時間領域から周波数領域に変換するシーケンスの場合です。

— リンドンホワイト

回答:

ディープニューラルネットワークによる分類に適した画像の特徴は、多数の特徴（RGB、強度などを備えた数十億ピクセルではない場合は数百万）があり、正確なラベルがあればノイズの多いデータではないことです。最近のカメラは非常に優れており、誤測定はありません。インターネットのおかげで、今では正確にラベル付けされた画像がたくさんあります。ディープネットワークは任意の複雑な関数を表現できます。これはノイズを非常に簡単にオーバーフィットできるため、ノイズの多いデータの問題です。そのため、多くの学習方法が複雑なモデルにペナルティを課す傾向があります。しかし、画像認識の場合、実際の機能は実際には非常に複雑であるように見え、機能的なフォームがどのように見えるかわかりません。また、多くの場合、関連する機能が何であるかさえわかりません。

これは、深いネットワークを使用して、画像とは関係のない機能を学習できないという意味ではありません。マイナス面については非常に注意する必要がありますが、ほとんどが過剰適合になりがちですが、計算コストが高く、トレーニングに時間がかかる可能性があります（最近では並列化されたSGDとGPUではそれほど問題ではありません）。もう1つの欠点は、モデルの解釈にはほとんど関係ないモデル解釈がほとんどないかまったくないことです。チンパンジーとオランウータンの違いをコンピューターに認識させようとしているだけです。数式の人間の理解は重要ではありません。他の分野、特に医療診断、政策研究などについては、人間の理解が必要な場合があります。

— アダム・アコスタ
ソース

画像や音声認識以外の多くの問題に対して、ディープニューラルネットワークを使用できます。問題は、本当に必要な場合です。

ディープニューラルネットワークは単純なMLPよりもはるかに強力ですが、より多くのリソースを必要とし、開発がより困難です。したがって、それらは本当に複雑なドメインで使用されます。これらを使用して簡単な問題を解決できますが、通常は単純なモデルでも良い結果が得られます。

簡単な問題にディープニューラルネットワークを使用することは、バズーカでハエを殺すようなものです。ハエを殺すことは確かですが、より簡単な方法を見つけることができませんでしたか？

— ダビディバッド
ソース

これは非回答です。簡単なことと難しいことは何ですか？株式市場の予測/限られた例からの外挿/ ...多くの困難な問題がありますが、それらはどれも良いですか？

— seanv507

ディープニューラルネットワークで何でも解決できるとは言いませんでした。つまり、膨大な数のエントリがある複雑なドメインで使用されるということです。私は彼らがすべての問題を解決できるわけではないことを知っていますが、それはこの質問のポイントではありません。ポイントは、画像/音声認識以外の問題にも適用できることを強調していますが、他のモデルを適用できる場合には考慮に値する欠点があります。

— -davidivad

davidivadの答えに同意します。しかし、ディープニューラルネットワークの画像への応用は、画像（さらに重要なことに、ラベル付き画像）の収集が比較的安価であると考えています。他のドメインでは、特に典型的な産業または政府企業の制約の範囲内で、大規模にデータを収集することは非常に高価になる可能性があります。この問題をさらに複雑にしているのは、多くのアプリケーションで関心のある現象が比較的まれであるため、学ぶべき例がほとんどないため、比較的大規模なデータ収集の努力でも、一部のクラスのメンバーが少数しか得られない場合があることです。

— シコラックス、モニカを復職させる
ソース