私は画像セグメンテーションテクニックについていくつか読んでいて、現代の最先端のセグメンテーションアルゴリズムについて疑問に思っていました。
「必読」である現在のセグメンテーション手法、つまり現在コミュニティで最も一般的に使用されているものは何ですか?どの技術に接触し、最も効果的かつ有用であると思いましたか(そしてどのアプリケーションについて)?
私は画像セグメンテーションテクニックについていくつか読んでいて、現代の最先端のセグメンテーションアルゴリズムについて疑問に思っていました。
「必読」である現在のセグメンテーション手法、つまり現在コミュニティで最も一般的に使用されているものは何ですか?どの技術に接触し、最も効果的かつ有用であると思いましたか(そしてどのアプリケーションについて)?
回答:
私は多くのセグメンテーション手法については知りませんが、満足のいくセグメンテーションを生成するためにさらに調査できるセグメンテーションピースの「選択肢」を提供する構造を扱ってきました。
うまくいけば、他の誰かが私があまり知らないいくつかの異なる最先端のセグメンテーション方法について書くことができます。
別の画像に対してセグメンテーションの選択、つまりレベルを設定するのが良い理由についての簡単な紹介:セグメンテーションは明確に定義されていない問題です。グランド真実は存在しません:望ましい結果は、常にユーザーの要求や仕様によって異なります。いい引用:
固定画像の場合でも、セグメンテーションの品質を定義する基準はアプリケーションに依存するため、「最良の」セグメンテーションが複数存在する場合があります。これは、特定のユーザー要件を満たすセグメンテーションを生成するために使用できる(...)「パズルのピース」を提供する画像分割技術に私たちの研究を集中させる動機になりました。
(P. Soille:階層的なイメージの分割と簡略化のための制約付き接続(2008))
あり、階層構造、階層的な画像分解、様々な複雑さを持つイメージパーティションを提案します。これらの構造は最も単純にツリー構造として表され、各ノードは画像内の領域を表します。構造を持つアイデア:
よりセグメンテーションは構成されために、領域およびそれらの提案された組合を調べた決定ツリー内の領域又は木のカット必要に応じた精度、または関心の対象、またはその他の事前定義されたユーザの仕様に関するいくつかの既知の特性を。
このようなプロパティを持つツリー(つまり、階層的な画像分解)は次のとおりです。
すでに提供されている論文へのリンクに加えて、これらの種類のセグメンテーション手法に関するいくつかのより具体的で具体的でない現在の論文:
(より実用的):
Penelopeの回答の補遺として、人気のある2つのアルゴリズムファミリー(およびトレンディなアルゴリズム)。
スーパーピクセル
スーパーピクセルと呼ばれる非常に人気のあるアルゴリズムファミリーは、現在非常にトレンディです(CV会議にはスーパーピクセルセッションもいくつかあります)。スーパーピクセルは、オーバーセグメンテーション(ウォーターシェッドが提供するものなど)によく似ているため、いくつかの後処理が必要です。
スーパーピクセルは、小さな均一な画像領域として見ることができます。ピクセル間の距離は、バイラテラルフィルタリングのように評価されます。つまり、ピクセル間の距離と視覚的類似性の混合であり、ピクセルが接近して類似している場合は0になり、そうでない場合は大きな値になります。
次に、スーパーピクセルメソッドは、この基準に関して小さな均一な領域を形成するためにさまざまな基準を試みます。それらの多く(グラフベース、モードシーク/クラスタリングベース...)があるので、この技術レポートを参照するのが最善だと思います。
(編集:)公開されたピアレビュー済みの作品を探している場合、この記事は同じ著者によるものであり、技術レポートと同じ資料をカバーしています 。R。Achanta、A。Shaji、K。Smith、A。Lucchi、 P. Fua、S。Susstrunk:SLICスーパーピクセルと最先端のスーパーピクセルメソッドの比較
回答の最初のバージョンを書いたので、視覚的に結果は分水界オーバーセグメンテーションが提供するものと非常に似ていることに注意してください。これは、関連する作業部分に流域を含む技術レポートの作成者によって確認されています。したがって、同じ後処理も行う必要があります。スーパーピクセルはピクセルの代わりに使用する便利な機能ですが、オブジェクトを追跡/検出する必要がある場合は、より高いレベルの領域を形成するためにグループ化する必要があります。
グラフベースのセグメンテーション方法
もう1つの一般的なアルゴリズムファミリは、ピクセルの関係の分析、つまり、ピクセルの外観がどのように近いかを分析したものです。これにより、正規化されたカット(J. Shi、J。Malik:正規化されたカットと画像のセグメンテーション)などのセグメンテーション手法のグラフ理論ベースのファミリが生成されます。
このアプローチの直感は次のとおりです。ピクセルが高次元グラフのポイント(頂点)であるとします。
グラフでは、2つの頂点をエッジで接続できます。エッジの重みは、頂点間の距離に反比例します。典型的には、重み関数は、それらの空間距離とバイラテラルフィルタリングにおけるそれらの視覚的類似性の間の混合の何らかの逆数になります8)。
次に、このグラフ与えられ、セグメント化アルゴリズムは、頂点の最良のクラスターを探すことができ、小さな持つ頂点すなわち、グループ内のグループの距離と大エクストラグループ距離を。
正規化されたカットのアプローチでは、クラスターの異なる母集団サイズによって導入されるバイアスを回避するために、いくつかの追加の注意が払われます。さらに、グラフ理論では接続性行列としても知られている、重み行列のSVDを計算することにより、グラフ探索を回避できます。
最新の調査を探すために必要なセグメンテーションのための最先端のアルゴリズムのグローバルな概観を推測します。Szeliski's Bookには、課題に関する優れたグローバルな概要が示されています。