ニューラルネットワークを使用して画像からパラメーターを抽出したい。
例:
レンガの壁の画像が与えられた場合、NNはレンガの幅と高さ、色、粗さを抽出する必要があります。
特定のパラメーターの画像を生成してNNをトレーニングし、それを使用して実際の画像からパラメーターを抽出することができます。
CNNを調査しました。彼らと一緒にこのタスクを実行できますか?分類の代わりに複数のパラメーターを抽出するには、特別な学習アルゴリズムが必要ですか?そのようなタスク用に設計されたNNはありますか?
ニューラルネットワークを使用して画像からパラメーターを抽出したい。
例:
レンガの壁の画像が与えられた場合、NNはレンガの幅と高さ、色、粗さを抽出する必要があります。
特定のパラメーターの画像を生成してNNをトレーニングし、それを使用して実際の画像からパラメーターを抽出することができます。
CNNを調査しました。彼らと一緒にこのタスクを実行できますか?分類の代わりに複数のパラメーターを抽出するには、特別な学習アルゴリズムが必要ですか?そのようなタスク用に設計されたNNはありますか?
回答:
元の画像のスケールや回転照明などの変動が予想され、トレーニングデータもたくさんある場合は、CNNがこのタスクに適しています。
通常のCNNアーキテクチャは、入力に近い畳み込み層と、出力に完全に接続された層を持つことです。これらの完全に接続されたレイヤーでは、出力をさまざまな分類または回帰タスクに合わせて調整できます。画像を表すパラメーターの値を予測することは、回帰タスクです。
サイズの正確な測定が必要な場合は、最大プーリングレイヤーの使用を避ける必要がある場合があります。あなたは-残念ながら、プールを使用していないことは、列車へのネットワークが大きくなると難しくなります可能性があることがあなたのために問題がある場合は代わりにストライド畳み込みで逃げます。
入力画像が非常にシンプルで明確な場合(常にコンピューターで生成されるため)、他のアプローチの方が信頼性が高い可能性があります。画像生成をリバースエンジニアリングし、線、角、円、およびその他のフィルタリングしやすい画像コンポーネントを特定するなどの単純なルールを導き出し、直接測定できる場合があります。このデータを特徴として抽出し、それを使用して単純なNN(または他のMLモデル)をトレーニングすることで、優れたパフォーマンスが得られるという複雑さの中間点もあるかもしれません。