以下のオブジェクト検出タスクを扱った論文は文献にありますか?
タスクは次のように説明できます。
画像のセットが与えられた場合、ラベルは、検出したいオブジェクトの場所を表す単なる座標(x、y)です。座標はオブジェクトの中心にある必要はなく、オブジェクトのサイズは任意です。
タスクは、人、ボート、車のいずれかであるオブジェクトを検出することです。ただし、ラベルはオブジェクトのカテゴリを示しておらず、ラベルは対象のオブジェクトに近い座標にすぎません。
画像は1時間ごとに取得され、同じシーンのスナップショットです。したがって、バックグラウンド減算技術が役立つ場合があります。
同じシーンの約2000枚の画像があり、各画像には通常2つの対象オブジェクトがあります。
以前にそのような仕事に取り組んだことがあるのだろうか?
Hog機能とSVMは、画像内の人間の検出に大きな成功を収めています。ただし、関連する文献では、関心のあるオブジェクトが単一の座標ではなく境界ボックスを使用してラベル付けされているトレーニングデータを使用しています。
主な3つの課題は次のとおりです。
- オブジェクトのサイズは任意であるため、分類子の境界ボックスを選択することは困難です。
- シーンのスナップショットは1時間ごとに取得されます(カメラもわずかに動く可能性があります)。そのため、バックグラウンド減算の使用は簡単ではありません。
- ラベル付けされたデータはあまりありません。
人々がこれらの課題にどのように対処したかを見るのは興味深いでしょう。
ありがとう!