スケール空間理論の理解


10

スケール空間理論の信号のスケール空間表現、(画像の場合には、D = 2)のように与えられる: L X y ; t = g x y ; t f x y ここでg x f(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y)はパラメーター tのガウスカーネルで、 *はたたみ込みです。tパラメータを変更することにより、多かれ少なかれ平滑化された画像を受け取ります。その結果、粗い表現(パラメーター t)には小さなオブジェクトやノイズが含まれなくなります。g(x,y;t)ttt

主なポイントは、スケール不変の特徴検出の方法を見つけることですよね?そのため、一部の画像のサイズが縮小された場合、他のノイズキーポイントを見つけることなく、キーポイントなどの機能がサイズが異なっていても正しく検出されます。

  1. この論文では、彼らは正規化導関数を使用しています。 δ ξ γ - N 、O 、R 、M = T γ / 2 δ Xγ正規化導関数を使用する意味は何ですか、それはスケール不変性にどのように役立ちますか?γδξ,γnorm=tγ/2δxγ

  2. この画像から、同じ位置の近くで異なるサイズのキーポイントが見つかったことがわかります。そんなことがあるものか?

検出された機能

スケール不変の特徴検出の段階的なアルゴリズムを説明できれば、これは素晴らしいことです。実際に何が行われますか?導関数は、またはtによって取得できます。ブロブは、x y 変数によるLの導関数を取ることで検出できます。tによる導関数はここでどのように役立ちますか?x,ytL(x,y)t

私が読んでいた論文は:自動スケール選択による特徴検出

回答:


3
  1. γtt

  2. キーポイントは、同じ場所の複数のスケールで見つけることができます。あなたが探しているからである地元のスケールを超える最大値。ここに直感があります:顔の画像を考えてください。細かいスケールで、鼻に対応するブロブを取得します。コーススケールでは、顔全体に対応するブロブを取得します。2つのblobは同じポイントの中心にありますが、スケールが異なります。

  3. アルゴリズム全体は次のとおりです。

    • 関心のある画像機能を決定します(ブロブ、コーナー、エッジなど)。
    • 導関数、たとえばブロブのラプラシアンについて、対応する「検出器関数」を定義します。
    • さまざまなスケールで検出器機能に必要な導関数を計算します。
    • tmγ/2m
    • スケール空間全体で検出器関数を計算します。
    • x,y,t
    • これらはあなたの興味のポイント、またはキーポイントです。

編集:

  1. tγ/2
  2. txytxy
  3. 同じ場所に異なるサイズの画像特徴がある場合があるので、スケール全体の極大値を見つけたいと思います。ブルズアイのような同心円のイメージを考えてください。それはあなたにいくつかのスケールでラプラシアンの高い応答を与えます。または、ある範囲のスケールでラプラシアンによってフィルタリングされた実際の人間の目の画像を考えてみてください。瞳孔は細かいスケールで高応答、虹彩は中程度のスケールで高応答、目全体は粗いスケールで高応答になります。

重要な点は、関心のある機能がどのスケールで事前にあるかがわからないということです。だからあなたはすべてのスケールを見てください。


tγ/2tttx,y

x,y,tt

@maximus回答の編集をご覧ください。
ディマ

@マキシムス、私は以前にそれを間違っていました。ガンマはスケールレベルではありません。答えを修正しました。
ディマ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.