セグメンテーションによる画像登録


15

通常、画像レジストレーションアルゴリズムは、SIFT(Scale-Invariant Feature Transform)などのポイントフィーチャに基づいています。

ラインフィーチャへの参照をいくつか見ましたが、ポイントの代わりに画像セグメント一致させることが可能かどうか疑問に思っていました。たとえば、与えられたソースと変換された画像:

ここに画像の説明を入力してください

それぞれでエッジ検出、ぼかし、および流域変換を行うことができます:

ここに画像の説明を入力してください

残念ながら、セグメンテーションは、個々のセグメントに一致するには各画像であまりにも異なることが判明しました。

アフィン変換に不変のマッチング形状と形状記述子に関する論文を見たので、この分野は有望であるようです...

画像のアフィン(または射影)変形に対してより堅牢なセグメンテーション方法はありますか?


1
私の常識は、小さな地域ほどグローバルな変化に対してより堅牢であることを教えてくれます。したがって、セグメンテーションには多数の小さなセグメントが必要です。また、いくつかの特定の形状は、(回転の円のような)いくつかの変換に不変である
アンドレイRubshtein

MSER(最大安定極値領域)は、点ではなく領域です。そして、それらはアフィン変換に対して不変です。しかし、厳密に言えば、セグメンテーションの方法ではありません。
ニキエストナー

@nikieあなたがあなたのコメントを答えとして書いたなら、私はそれを受け入れます。領域の特徴には画像変換に関する情報が含まれており、画像間の変換の推測に使用できる可能性があるため、セグメンテーションに興味がありました。私は確かにMSERに関する論文を勉強します。
-Libor

現在、コンポーネントツリーを使用してCBIRに取り組んでいます。画像のコンポーネントツリー表現は、画像への変形(射影も)にあまり依存せず、異なるレベルで異なるレベルの詳細までの比較と操作が可能になり、低テクスチャの画像で現在の手法よりもうまく機能するはずです。まだ始まったばかりの研究テーマにすぎませんが、アプローチに何かがあることを願っています。そうでなければ、これを行うための助成金は与えられません。しかし、他の誰かがこれらの線に沿って何かをした場合、役に立つかもしれません。
ペネロペ

@penelope CBIRでのこれらの作業は、同様の機能を備えた一連の画像がある画像モザイク(特に興味がある)にも役立つ場合があります。現在の一般的なアプローチは、ポイント記述子(例:SIFT)を介した高次元検索です。これにより、ポイントではなく「領域」または「コンポーネント」で区別できる画像間で誤った一致が発生します。画像のコンポーネントツリー表現に関する論文への参照はありますか?どうもありがとう。
Libor

回答:


4

MSER(最大安定極値領域)は、点ではなく領域です。そして、それらはアフィン変換に対して不変です。しかし、厳密に言えば、それはセグメンテーション方法ではありません

非公式に言えば、アイデアは、さまざまなしきい値でブロブを見つけ、しきい値の範囲で形状/面積の変化が最も少ないブロブを選択することです。これらの領域は、広範囲のグレースケールおよび幾何学的変換に対して安定している必要があります。


4

現在、比較的新しいアイデアになるはずのコンポーネントツリーを使用してCBIRに取り組んでいます。コンポーネントツリーを使用して画像を記述することで期待される利点は次のとおりです。

  • 画像のコンポーネントツリー表現は、画像への変形(射影も)にそれほど依存しません。
  • ツリーのさまざまなレベルを調べると、さまざまな詳細レベルまでの比較と操作が可能になります
  • 差別化と説明は、低テクスチャ画像の現在の手法よりもうまく機能するはずです。

このトピックに関連する研究を始めたばかりであるため、コンポーネントツリーでイメージを表現し、ベクトル化表現を見つけることによって直接コンポーネントツリーを比較するという、私の目標の漠然としたアイデアしかありません。おそらく、数週間(または数か月)でさらに多くのことを話すことができるでしょうが、現時点では、コンポーネントツリーの紹介として推奨される論文のリストのみを提供できます(まだ読みませんでした)。

何か関連するものが見つかったら、答えを更新できます。

また、目的が単なる点ではなく画像領域をより正確に一致させることである場合、領域はより差別的である可能性があるため、J。SivicとA. Zissermanには、「Video Google:A Text Retrievalビデオでのオブジェクトのマッチングへのアプローチ」

空間的一貫性に関するセクションを参照しています。ここでは、特徴点間の一致のグループは、特徴点が両方の画像で同様の空間構成を保持している場合にのみ受け入れられます。したがって、マッチングは、抽出されたフィーチャのタイプ(DoG、MSERなど)または記述子(SIFT)に依存するだけでなく、フィーチャポイントのより広い周囲を調べて(少なくとも少し)作成します。地域依存。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.