最も一般的な現代の画像セグメンテーション技術


11

私は画像セグメンテーションテクニックについていくつか読んでいて、現代の最先端のセグメンテーションアルゴリズムについて疑問に思っていました。

「必読」である現在のセグメンテーション手法、つまり現在コミュニティで最も一般的に使用されているものは何ですか?どの技術に接触し、最も効果的かつ有用であると思いましたか(そしてどのアプリケーションについて)?


これまでにどこを見ましたか?
フォノン2013

1
レベルセットメソッドと高速マーチングメソッドに加えて、正規化カット、グラフカット、最小カットについてもいくつか読んでいます。
GamingX 2013

3
2012年11月より、簡潔で簡潔な説明:画像のセグメンテーション:レビュー
Emre、2013

(再販に関するこの質問に触発された編集、おそらくこの質問はセグメンテーション方法への同様の参照になる可能性があります)
ペネロペ

回答:


7

私は多くのセグメンテーション手法については知りませんが、満足のいくセグメンテーションを生成するためにさらに調査できるセグメンテーションピースの「選択肢」を提供する構造を扱ってきました。

うまくいけば、他の誰かが私があまり知らないいくつかの異なる最先端のセグメンテーション方法について書くことができます。

別の画像に対してセグメンテーションの選択、つまりレベルを設定するのが良い理由についての簡単な紹介:セグメンテーションは明確に定義されていない問題です。グランド真実は存在しません:望ましい結果は、常にユーザーの要求や仕様によって異なります。いい引用:

固定画像の場合でも、セグメンテーションの品質を定義する基準はアプリケーションに依存するため、「最良の」セグメンテーションが複数存在する場合があります。これは、特定のユーザー要件を満たすセグメンテーションを生成するために使用できる(...)「パズルのピース」提供する画像分割技術に私たちの研究を集中させる動機になりました。

P. Soille:階層的なイメージの分割と簡略化のための制約付き接続(2008)

あり、階層構造、階層的な画像分解、様々な複雑さを持つイメージパーティションを提案します。これらの構造は最も単純にツリー構造として表され、各ノードは画像内の領域を表します。構造を持つアイデア:

  • 構造の葉は、細かいパーティションの領域、または画像のオーバーセグメンテーションです(例:ピクセル、フラットゾーン-同じ強度の接続領域、流域
  • ツリー内のリンクは、(隣接する)リージョンのマージまたはユニオンを表し、より複雑なリージョンを形成し、オブジェクトに対応するリージョンを生成する可能性が最も高い方法で構築されます(うまくいけば:))
  • リージョンの複雑さはノードからツリーのルートに向かって各ブランチに沿って増加します
  • ツリーのすべてのレベル(また、すべてのカット)は、イメージのパーティション化/セグメンテーションです(ルートに近いほど粗くなります)。
  • ツリーのルートは画像ドメイン全体をカバーします

よりセグメンテーションは構成されために、領域およびそれらの提案された組合を調べた決定ツリー内の領域又は木のカット必要に応じた精度、または関心の対象、またはその他の事前定義されたユーザの仕様に関するいくつかの既知の特性を。

このようなプロパティを持つツリー(つまり、階層的な画像分解)は次のとおりです。

すでに提供されている論文へのリンクに加えて、これらの種類のセグメンテーション手法に関するいくつかのより具体的で具体的でない現在の論文:

(より実用的):


1
「モダン」な(そしてトレンディな)セグメンテーションアルゴリズムファミリーの場合、スーパーピクセルを追加します。今期のグーグルは本当に印象的です。
sansuiso 2013年

まあ@sansuiso、答えとして、それを追加します:)うまくいけば、我々はいくつかの興味深い最先端のセグメンテーションはこの質問に近づき収集することができます
ペネロペ

6

Penelopeの回答の補遺として、人気のある2つのアルゴリズムファミリー(およびトレンディなアルゴリズム)。

スーパーピクセル

スーパーピクセルと呼ばれる非常に人気のあるアルゴリズムファミリーは、現在非常にトレンディです(CV会議にはスーパーピクセルセッションもいくつかあります)。スーパーピクセルは、オーバーセグメンテーション(ウォーターシェッドが提供するものなど)によく似ているため、いくつかの後処理が必要です。

スーパーピクセルは、小さな均一な画像領域として見ることができます。ピクセル間の距離は、バイラテラルフィルタリングのように評価されます。つまり、ピクセル間の距離と視覚的類似性の混合であり、ピクセルが接近して類似している場合は0になり、そうでない場合は大きな値になります。
次に、スーパーピクセルメソッドは、この基準に関して小さな均一な領域を形成するためにさまざまな基準を試みます。それらの多く(グラフベース、モードシーク/クラスタリングベース...)があるので、この技術レポートを参照するのが最善だと思います。

(編集:)公開されたピアレビュー済みの作品を探している場合、この記事は同じ著者によるものであり、技術レポートと同じ資料をカバーしています 。R。Achanta、A。Shaji、K。Smith、A。Lucchi、 P. Fua、S。Susstrunk:SLICスーパーピクセルと最先端のスーパーピクセルメソッドの比較

回答の最初のバージョンを書いたので、視覚的に結果は分水界オーバーセグメンテーションが提供するものと非常に似ていることに注意してください。これは、関連する作業部分に流域を含む技術レポートの作成者によって確認されています。したがって、同じ後処理も行う必要があります。スーパーピクセルはピクセルの代わりに使用する便利な機能ですが、オブジェクトを追跡/検出する必要がある場合は、より高いレベルの領域を形成するためにグループ化する必要があります。

グラフベースのセグメンテーション方法

もう1つの一般的なアルゴリズムファミリは、ピクセルの関係の分析、つまり、ピクセルの外観がどのように近いかを分析したものです。これにより、正規化されたカット(J. Shi、J。Malik:正規化されたカットと画像のセグメンテーションなどのセグメンテーション手法のグラフ理論ベースのファミリが生成されます。

このアプローチの直感は次のとおりです。ピクセルが高次元グラフのポイント(頂点)であるとします。
グラフでは、2つの頂点をエッジで接続できます。エッジの重みは、頂点間の距離に反比例します。典型的には、重み関数は、それらの空間距離とバイラテラルフィルタリングにおけるそれらの視覚的類似性の間の混合の何らかの逆数になります8)。
次に、このグラフ与えられ、セグメント化アルゴリズムは、頂点の最良のクラスターを探すことができ、小さな持つ頂点すなわち、グループ内のグループの距離と大エクストラグループ距離を。

正規化されたカットのアプローチでは、クラスターの異なる母集団サイズによって導入されるバイアスを回避するために、いくつかの追加の注意が払われます。さらに、グラフ理論では接続性行列としても知られている、重み行列のSVDを計算することにより、グラフ探索を回避できます。


回答に感謝しましたが、少し時間がかかりましたが、あなたが言及した2つのテクニックについて、少しだけ詳しく教えていただけますか?ここで詳細に説明するつもりはありませんが、それぞれについて1つまたは2つの説明文をいただければ幸いです。
ペネロペ2013年

答えを広げました。少し混乱しますが、回答にリンクする技術レポートを参照することをお勧めします(私はスーパーピクセルの人間ではないことを認めなければなりませんが、彼らの関心についてはまだ少し懐疑的ですが、本当にトレンディです)。
sansuiso 2013年

グラフベースの分割方法については、私はこの作品は芸術の成果の最高の状態のいずれかを示唆していると思う: research.microsoft.com/pubs/167600/jmiv_bnm_final.pdfは、 それは、直感的な紙とコードが利用可能です。
Tolga Birdal 2014年

3

最新の調査を探すために必要なセグメンテーションのための最先端のアルゴリズムのグローバルな概観を推測します。Szeliski's Bookには、課題に関する優れたグローバルな概要が示されています。

ここに画像の説明を入力してください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.