コンピュータービジョン:単一座標のラベルを使用したオブジェクト検出


7

以下のオブジェクト検出タスクを扱った論文は文献にありますか?

タスクは次のように説明できます。

  • 画像のセットが与えられた場合、ラベルは、検出したいオブジェクトの場所を表す単なる座標(x、y)です。座標はオブジェクトの中心にある必要はなく、オブジェクトのサイズは任意です。

  • タスクは、人、ボート、車のいずれかであるオブジェクトを検出することです。ただし、ラベルはオブジェクトのカテゴリを示しておらず、ラベルは対象のオブジェクトに近い座標にすぎません。

  • 画像は1時間ごとに取得され、同じシーンのスナップショットです。したがって、バックグラウンド減算技術が役立つ場合があります。

  • 同じシーンの約2000枚の画像があり、各画像には通常2つの対象オブジェクトがあります。

以前にそのような仕事に取り組んだことがあるのだろうか?

Hog機能とSVMは、画像内の人間の検出に大きな成功を収めています。ただし、関連する文献では、関心のあるオブジェクトが単一の座標ではなく境界ボックスを使用してラベル付けされているトレーニングデータを使用しています。

主な3つの課題は次のとおりです。

  • オブジェクトのサイズは任意であるため、分類子の境界ボックスを選択することは困難です。
  • シーンのスナップショットは1時間ごとに取得されます(カメラもわずかに動く可能性があります)。そのため、バックグラウンド減算の使用は簡単ではありません。
  • ラベル付けされたデータはあまりありません。

人々がこれらの課題にどのように対処したかを見るのは興味深いでしょう。

ありがとう!


オブジェクトの検出とローカリゼーションのように聞こえます。どのような研究をしましたか?それらの主題について読みましたか?これがその一例であると思わない理由がありますか、それとも質問に対する受け入れ可能な答えが見つからないと思いますか?
DW

このトピックについて調査しているときに、オブジェクトラベルが(1)バウンディングボックスまたは(2)ピクセル単位のラベルの代わりに座標として与えられているリサーチペーパーは見つかりませんでした。座標ラベル付けは、画像処理アルゴリズムがオブジェクトを認識するのを難しくしますが、人間がオブジェクトにラベル付けするのは簡単になります。しかし、交差検証を使用して、各ラベル付きオブジェクトの最適な境界ボックスを決定できると思います。データセットが同様のラベル付けメカニズムを持っている研究論文への参照があると役に立ちます。@nbubisには素晴らしい答えがありますが、彼が投稿した論文にはより良いデータセットがあります。
好奇心旺盛な

回答:


4

このような問題における最先端の技術は、最近、ディープニューラルネットワークを介して行われています。特に、オブジェクトの検出と位置特定の問題を解決するための最近の2つの一般的なアプローチは、YOLOペーパーと、画像内のさまざまなサイズのさまざまな領域に分類子を実行する高速RCNNです。

人間、ボート、車は人気のあるオブジェクトクラスなので、まず、既存の事前トレーニング済みネットワークが問題に対して何ができるかを確認し、必要に応じて、データを使用してそれらを再トレーニングします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.