ニューラルネットワークを使用して画像から複数のパラメーターを抽出する

ニューラルネットワークを使用して画像からパラメーターを抽出したい。

例：

レンガの壁の画像が与えられた場合、NNはレンガの幅と高さ、色、粗さを抽出する必要があります。

特定のパラメーターの画像を生成してNNをトレーニングし、それを使用して実際の画像からパラメーターを抽出することができます。

CNNを調査しました。彼らと一緒にこのタスクを実行できますか？分類の代わりに複数のパラメーターを抽出するには、特別な学習アルゴリズムが必要ですか？そのようなタスク用に設計されたNNはありますか？

neural-network deep-learning computer-vision

— H4kor
ソース

覚えているサンプル画像をいくつか添付していただけませんか？CNNはこのタスクにはやり過ぎかもしれませんが、一方で、「従来の」CVアルゴリズムとは対照的に、ニューラルネットワークの使用を最優先するかどうかを検討して試す価値があります。

— NikoNyrh 2016年

@NikoNyrhはサンプル画像を提供できますが、テクスチャのさまざまなクラスにこのテクニックを使用したいと思います。目標は、画像からシェーダーパラメーターを抽出することです。ブリックの例にはほとんど直感的なパラメーターが含まれていますが、他のシェーダーはおそらく、巧妙に設計されたアルゴリズムでは簡単に取得できないパラメーターを使用します。現在、さまざまなアプローチをテストしていて、「無限」のトレーニングデータを生成できるので、ニューラルネットワークを試してみたいと思っています。

— H4kor 2016年

元の画像のスケールや回転照明などの変動が予想され、トレーニングデータもたくさんある場合は、CNNがこのタスクに適しています。

通常のCNNアーキテクチャは、入力に近い畳み込み層と、出力に完全に接続された層を持つことです。これらの完全に接続されたレイヤーでは、出力をさまざまな分類または回帰タスクに合わせて調整できます。画像を表すパラメーターの値を予測することは、回帰タスクです。

サイズの正確な測定が必要な場合は、最大プーリングレイヤーの使用を避ける必要がある場合があります。あなたは-残念ながら、プールを使用していないことは、列車へのネットワークが大きくなると難しくなります可能性があることがあなたのために問題がある場合は代わりにストライド畳み込みで逃げます。

入力画像が非常にシンプルで明確な場合（常にコンピューターで生成されるため）、他のアプローチの方が信頼性が高い可能性があります。画像生成をリバースエンジニアリングし、線、角、円、およびその他のフィルタリングしやすい画像コンポーネントを特定するなどの単純なルールを導き出し、直接測定できる場合があります。このデータを特徴として抽出し、それを使用して単純なNN（または他のMLモデル）をトレーニングすることで、優れたパフォーマンスが得られるという複雑さの中間点もあるかもしれません。

— ニール・スレーター
ソース