抽象データをグラフィカルに表現するなど、既存の画像がない問題領域でパターン認識に畳み込みニューラルネットワークを使用できますか?それは常に効率が悪いでしょうか?
この開発者によると、現在の開発はさらに進む可能性があるが、画像認識以外の制限がある場合はそうではないという。
抽象データをグラフィカルに表現するなど、既存の画像がない問題領域でパターン認識に畳み込みニューラルネットワークを使用できますか?それは常に効率が悪いでしょうか?
この開発者によると、現在の開発はさらに進む可能性があるが、画像認識以外の制限がある場合はそうではないという。
回答:
畳み込みネット(CNN)は、信号処理に一般的に使用される数学的畳み込み(2Dまたは3D畳み込みなど)に依存しています。画像は一種の信号であり、畳み込みは音、振動などにも同様に使用できます。したがって、原則として、CNNはあらゆる信号へのアプリケーションを見つけることができます。
実際には、NLP(Matthew Gravesが述べたように)にはすでに作業があり、一部の人々は再帰ネットワークではなくCNNでテキストを処理します。サウンド処理には他のいくつかの作品が適用されます(ここでは参照しませんが、未公開の作品はまだ進行中です)。
元のコンテンツ:現在変更されている元のタイトルの質問への回答。おそらくこれを削除する必要があります。
敵対的なネットワーク(および関連する)の研究は、深いネットワークでさえ簡単にだまされる可能性があることを示しており、人間がそれを見るとランダムノイズのように見えるもので犬(または任意のオブジェクト)を見るようになります(記事には明確な例があります)。
別の問題は、ニューラルネットワークの一般化能力です。たたみ込みネットは、他の手法よりも優れた方法で一般化する能力で世界を驚かせています。しかし、ネットワークに猫の画像のみが供給される場合、猫のみが認識されます(そして、敵のネットワークの結果によると、おそらくどこにでも猫がいます)。つまり、CNでさえ、学んだことをはるかに超えて一般化するのに苦労しています。
認識限界を正確に定義することは困難です。学習データの多様性が限界を押し上げていると単純に言います(詳細については、より適切な議論の場になると思います)。
簡単な答えは「いいえ、画像に限定されない」です。CNNは自然言語処理にも使用されています。(紹介はこちらをご覧ください。)
まだグラフィカルデータに適用されているのを見たことはありませんが、見ていません。試すべき明らかなことがいくつかありますので、私はそれがうまくいくと楽観しています。
畳み込みニューラルネットワークは、パターンがローカルに相関し、変換可能な場合(シフト可能な場合など)に使用できます。これは、CNNには入力のあらゆる場所で特定のローカルパターンを検索するフィルターが含まれているためです。写真、テキスト、時系列などにローカルおよび翻訳可能なパターンがあります。
データが無関係な順序の機能のバッグのようなものである場合、CNNを使用することはあまり意味がありません。その場合、入力ベクトルで離れているフィーチャを含むパターンの検出に問題が生じる可能性があります。情報を失うことなく入力ベクトルのデータポイントを並べ替えることができる場合、データ内にローカルおよび翻訳可能なパターンは見つかりません。