上からの人の検出


16

私は、地上3メートルのカメラを1つだけ使用して、人を検出する方法を見つけようとしています。これはカメラによって返されるフレームです:

ここに画像の説明を入力してください

更新:ビデオテスト-> http://dl.dropbox.com/u/5576334/top_head_shadow.avi

そのためには、まず、バックグラウンドとフォアグラウンドのセグメンテーションを実行する必要があることを理解します。それは簡単な部分です。

前景マスクを使用すると、ハフ変換などの簡単な操作で円を見つけることができますが、この方法では、多くの誤検出を含む頭部の60%しか検出されません。

色分けのような他の簡単なテクニックを使用することもできますが、髪型、色、髪の量などのために、人々の頭は上とは大きく異なることがわかりました...

私がそれについて持っている他のオプションは、HOG記述子、またはHaarのような機能を使用する可能性ですが、モデルを訓練するには上から見た人々の広範なデータベースが必要です。私はそのようなものを見つけていません。

これは非常に頻繁に起こる問題だと思っていましたが、文学やインターネットではあまり見つけることができません。このタスクを解決するための助けをいただければ幸いです:-)

更新:詳細については、目標は歩行者の流れを追跡するための一般的な方法を実装することです。最初のプロトタイプはモールでテストされます。


1
ビデオを投稿できる場合、誰かがプロトタイプを作成する可能性があります。投稿してください。
アンドレイRubshtein

@Andrey、問題を示すビデオテストをアップロードしました。
-emepetres

@emepetresこの問題をテストするためのリソースがある場合、セカンダリカメラを見つけるためのリソースがあるかもしれません。2つのカメラからのビュー(1つのトップビュー、1つの正面または角度から)を組み合わせて、両方の音声からの情報を使用して、必要な精度に応じて歩行者の流れを追跡するためのもっともらしいアプローチのように聞こえます
ペネロペ

4
このタスクは、文学では「人数カウント」と呼ばれます。
mrgloom

このビデオのリンクを提供してください。それはもう提供されたリンクでは使用できません
Garvita Tiwariさん

回答:


11

人の横に移動できる他のオブジェクトはありますか?存在しない場合は、前景マスクでブロブ(接続されたコンポーネント)を見つけることができます。これらはあなたの人々です。

また、2つではなく1つのBLOBを作成して、互いに「衝突」させることもできます。この場合、軌跡と速度が滑らかであるという事実を使用して、モーショントラッキングを実行し、あいまいさを解決できます。

他のオブジェクト(犬、車など)がある場合、次のようなblobパラメーターを取得する分類子を作成する必要があります。

  • Blob統計(サイズ、堅牢性など)
  • エッジ情報
  • 速度(追跡の場合)

そして、正しいクラス(Human / No Human)を返します。


1
また、人間と非人間を区別できる堅牢な方法を探しています。そのように、あなたの答えを考えた後、私はあなたが提案したようにブロブパラメータを使用し、いくつかの機能追跡とブロブのいくつかの統計情報と組み合わせて十分に堅牢であると思います。
-emepetres

8

私は、「十分にテストされた方法を使用するには、「手に入らない」膨大な例のデータベースを必要とする」「非常に小さな会社」のポジションにいました。できるだけ多くのデータを取得するために必要なことを何もしなかったことを非常に残念に思います。最終的に彼らに世界の違いをもたらしたと思います。

どんな種類の現実世界の視覚検出にも、試してみて失敗するまで考えもしなかった無数のものがあります。それは古い問題であり、見かけよりもはるかに困難です。ニュートンの「巨人の肩の上に立つ」方法(または、ほぼ同様に、ドワーフの大きな山の上に立つ方法)に固執することをお勧めします。つまり、すでに機能し、堅牢であることがわかっている方法を使用します。それが「十分」であるように聞こえるすべてのものは、代わりに惨めに失敗します。

私が最後に知っていた歩行者検出の最新技術は、もともとまさにその設定でテストされたHOGでした。追跡したいので、それを見つけるためにグーグル学者で少し遊ぶ必要があります。私の主なポイントは、私は同様の位置にされているされており、そこから私は、あなたがしなければならないものは何でも、あなたのデータベースを取得をお勧めします、とあなたは既に知られている故障率でテストされた作品を、知っている利用何かでしょう購入ではないこと、何かいいですね。「機能するように聞こえる」コンピュータービジョンアルゴリズムの40年の死の行進は、あなたが参加したいものではありません。

PSコンピュータービジョンを批判しようとはしていません。私の好きな分野の一つです。しかし、それは歴史上、取るべき千の間違ったステップがあり、正しいステップはあまり多くないことを示唆しています。これらの正しい手順の一部を既に見つけた人をフォローする方が良いでしょう。


たぶんあなたは正しいです、そして私はHOG記述子を訓練してテストするために良いデータベースを作るのに少し時間を費やすべきです。その方法で、トレーニングを正しく行うために、このデータベースを使用する最小サイズを知っていますか?
-emepetres

1
私は知らない。可能な限り多種多様。また、HOGは検出器であり、イメージに対して「yes there a person」または「no person」応答を返しますが、それ以外は何も返しません。それは、人がどこにいるか(場所)、どのピクセルが人か(セグメンテーション)、または複数の人が1人に対しているかどうかについては何も言いません。HOGへの適応(特許取得)が行われたと思いますが、ポイントは人の追跡とHOGの現状です。HOGの現状は検出のみであり、場所さえもです。私はそれをやったことがありませんが、人の追跡は長年のトピックです。人の追跡に関する論文をご覧ください。
ジョンロバートソン

1
@John Robertson HOGは検出器ではなく、単なる記述子であり、何らかの分類器(たとえば、SVM + HOG)で使用され、オブジェクトの位置を返すことができます。
mrgloom

1
@mrgloomそのとおりです。ウィンドウ検索を実行して場所を返します。しかし、それは大企業が特許を取得した方法を使用した場合のみです。私はここで技術的な意味で単語検出器を使用することを意味していませんでした、ただそれが検出するものであるという単純な英語の意味で。それは、そのウィンドウ内にウィンドウのスケールの約80-90%の誰かがいるが、ウィンドウのどの部分がその人に属する可能性があるかを特定することなく、大まかな意味で位置を提供するだけです。記述子/検出器の技術的な違いに精通しています。
ジョンロバートソン

3

ここからいくつかの回答を組み合わせることで始めることができると思います。

この回答には2つの異なるアプローチがありますが、大きな違いは、顔が表示されないために顔検出を行うことができないことです。しかし、他のアプローチはまだ適用可能です:何かが歩行者であるか、その行動(動き)に基づいていないかを決定します。

これは、あなたが予測したように、前景と背景の何らかのセグメンテーションを使用することをお勧めします。非常に速いグーグルは、この最近の記事はかなり有望に見えましたが、私は個人的にこれをやったことがないので、このステップで使用する特定のアルゴリズムについてより良い提案があるかもしれません。

さて、私がリンクした最初の答えは、非常に一般的なアプローチのアイデアを示しています。ただし、この答えは次のステップについてのアイデアを与える可能性があります。オブジェクトを追跡し、速度または移動方向に基づいてそれらを区別しようとします。

最後に、私はあなたが抱えていた問題に取り組んだことがないので、おそらくあまり助けにはなりませんが、リンク先の答えからどこから始めればよいかについての一般的なアイデアが得られるかもしれません。また、あなたの問題に対する答えを検索するときに以前の作品や記事を見つけることができなかったことに驚きましたが、その後、この問題を説明する正しいキーワードを教えてくれる人が必要なだけかもしれません。


ご回答ありがとうございます。前景セグメンテーションに関する記事は非常に興味深いようです。あなたと@Andreyが示唆したように、私はブロブ分析のアプローチに従って、各ブロブの人間の数を決定します。
-emepetres

@emepetres結果について教えていただければ幸いです。試してみてテストしたアプローチがどれほど成功したか、
ペネロペ

1

ここで説明しているように、人を数える何らかのタスクがあります。しかし、私の要件は、カメラが頭の上ではなく、左側/右側から人に向いていることです。

そうは言っても、私の場合の可能な解決策を探りながら、あなたの場合の興味深い方法(オーバーヘッド検出)を見つけました。これらのソリューションはステレオカメラを使用しているため、深さを確認することでブロブ(近づきすぎている人)を処理できます(たとえば、平均的な人の頭部レベルでのみブロブを見る)。

この製品はあなたにもっと良い説明を与えるかもしれません: digiop。技術的な説明については、パンフレットをご覧ください。

PS私は会社を代表しておらず、よく文書化されたソリューションを指摘しているだけです


共有していただきありがとうございます、問題を解決するための興味深い方法のようです。
emepetres
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.