スケールおよび回転不変フィーチャ記述子


16

フィーチャ検出で使用するために、いくつかのスケールおよび回転不変フィーチャ記述子をリストできますか。

このアプリケーションは、マルチクラス分類器を使用して、UAVによってキャプチャされたビデオ内の車と人間を検出するためのものです。

これまでのところ、SIFTとMSER(アフィン不変)を見てきました。私もLESHを見ました、LESHはローカルエネルギーモデルに基づいていますが、回転不変ではない方法で計算され、ローカルエネルギーを利用して回転不変を構築する方法を考えようとしています機能記述子、私はここを読みます商用アプリケーションで使用できるSIFT / SURFの無料の代替手段は何ですか?、「関心点に方向を割り当て、それに応じて画像パッチを回転させると、回転不変性が無料で得られます」が、これがさらに当てはまるかどうか、またはこれを私の問題にどのように適用できるかわかりません感謝します、ありがとう


OpenCVライブラリのORB(Oriented FASTおよびRotated Brief)を使用します。
過酷なウォーダン

回答:


9

SIFT / SURFの代替案に関する限り、リンクした質問は非常に良い答えを提供します。

さらに2つの質問がありました。

  • 「有用な(回転不変などの)機能記述子を作成するにはどうすればよいですか?
  • 「リンクされた質問からの声明に関して、彼はどのように自由な回転不変性を達成するのですか?」

機能記述子の構築

これは有効な研究トピックです。優れた機能記述子は、誰でも午後に構築できるものではありません。人々は、望ましい特性を備えたフィーチャー記述子を正常にモデル化したときに記事を公開します。これが、現在ほんの一握りの最先端の記述子のみが使用されている理由であり、それはまたあなたが行うことをお勧めすることです。あなたのニーズに合った機能記述子を見つけること

「無料」で回転不変性を達成する

0|black->gray->white||white->gray->black|9090

この方法では、常に同じ支配的な方向を持つイメージパッチ(回転パッチ)で記述子を計算するため、回転不変性が達成されます。


4

回転不変性を無料で取得する別の方法は、回転不変のオブジェクトを選択することです。たとえば、円またはリングは回転に対して不変です。

特徴抽出:エッジ検出を実行します。NxNピクセルの各近傍について、エッジの方向と大きさの2Dヒストグラムを計算します。合計強度が高く、角度の広がりが大きいすべてのポイントを見つけます。放射対称性を持たないすべてのポイントを削除します。

特徴記述子:各円形オブジェクトの中心を見つけます。オブジェクトは円形であるため、支配的な勾配角はありません。すべての角度が等しい。したがって、放射状プロファイル(極座標のピクセル値の合計)は、角度不変の記述子です。


ところで、それは基準が電気回路基板上の円として製造される理由の1つです。

ここに画像の説明を入力してください


キーポイント(機能)記述子について説明しています。特徴(関心点)について話している場合、円形パッチの検出は有用かもしれません-それらはすべての記述子と組み合わせて回転不変です。しかし、円形パッチで計算された記述子はそうではありません-回転不変法が使用されない場合、水平直径が黒で、垂直直径の白い円は非常に異なる記述子を生成します
ペネロペ

@penelope、どうして?次の記述子を考慮してください-パッチのサムネイルであり、正規化相互相関を使用して他の記述子と比較します。この方法で他のオブジェクトと間違えることはできません。
アンドレイRubshtein

申し訳ありませんが、「パッチのサムネイル」の意味を理解できません。そして、記述子:パッチの正規化された相関関係は、パッチが回転不変になるものであり、パッチがリングまたは円であったという事実ではありません。
ペネロペ

@penelope、私は今十分に明確ではなかったと思います。明日、それを拡大しようとします。ご意見ありがとうございます。
アンドレイRubshtein

それを楽しみにしています:)
ペネロペ

1

KAZE / AKAZEを検討します。これらは、同等のパフォーマンスと大幅な高速化を実現します。変形ケースも許容されます。OpenCVは最近、GSoC 2014を通じて実装を取得しましたこちらで見つけることができます。


1

特徴点を中心とするローカルパッチを対数極座標(対象点を原点とする)に再マッピングすると、スケールの変化は対数半径軸に沿った平行移動に対応し、回転は平行移動に対応します(ラップアラウンド)角度軸に沿って。その後、2次元フーリエ変換を計算すると、放射方向と角度方向の平行移動が周波数領域で位相シフトになります。その後、フーリエ変換の絶対値を計算すると、位相は完全に消失し、元の画像パッチのスケールの変化と回転は目立たなくなります。そのため、対数プール座標での画像の2Dフーリエ変換の絶対値がフィーチャ記述子になります。

まあ、少なくとも理論的には。実際には、パッチの放射状の広がりを制限する必要があります。これは、フーリエ変換(実際にはフーリエ級数)を計算する前にデータの大部分を切り取る必要があることを意味します。周波数領域での位相シフトはもうないので、この方法は完全にスケール不変ではありません。対数半径の座標で(不連続性のない)ウィンドウ関数を使用し、それに色の強度を掛けると、この問題は多少緩和されると思います。

ただし、機能記述子は完全に回転不変である必要があります。

リファレンス:スケール選択なしのスケール不変性


0

FASTおよびBRISKも確認できます。


私が検索した限り、FASTは多くの異なる記述子の組み合わせで使用される検出器にすぎません。そして、FASTとBRISKはOP自身がリンクした質問ですでに言及されているので、これらのメソッドの存在に関する情報を既に持っていると思います。
ペネロペ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.