なぜガウス分布の違いは空間スケール不変ですか?


15

ここでは例として、スケール不変の特徴変換アルゴリズムを使用します。SIFTは、画像のスケーリングされたガウスフィルタリングに基づいてスケール空間を作成し、ガウスの差を計算して潜在的な関心点を検出します。これらの点は、ガウス分布の差全体の局所的な最小値と最大値として定義されます。

このアプローチは(他の不可解な不変性の中でも)スケール不変であると主張されています。どうしてこれなの?なぜそうなのかははっきりしていません。


SIFTとは何かわからない、wiki en.wikipedia.org/wiki/Scale-invariant_feature_transformでこれを見つけました。「Loweの画像特徴生成方法は、画像を特徴ベクトルの大きなコレクションに変換します。各特徴ベクトルは、画像の変換、スケーリング、回転に不変であり、照明の変化に部分的に不変で、局所的な幾何学的歪みにロバストです。」それは説明ですか?
ナイアレン

はい、それは私が話していることです

SIFTはスケール空間理論を使用します。しかし、その理論の「スケール」不変性が何を意味するのか理解できません。トニー・リンデバーグの
maximus

回答:


7

ここで、「スケール不変」という用語は以下を意味します。画像Iがあり、ある位置(x、y)とあるスケールレベルsで特徴(別名、関心点)fを検出したとしましょう。今、あなたがイメージI 'を持っているとしましょう。これは、Iのスケーリングされたバージョンです(たとえば、ダウンサンプリングされています)。次に、特徴検出器がスケール不変である場合、対応する位置(x '、y')および対応するスケールs 'I'の対応する特徴f 'を検出できるはずですここで(x、y、s)および(x '、y'、s ') 適切なスケーリング変換によって関連付けられます。

つまり、スケール不変検出器が誰かの顔に対応する特徴点を検出し、同じシーンでカメラでズームインまたはズームアウトした場合でも、その顔の特徴点を検出する必要があります。

もちろん、2つの機能を一致させることができる「機能記述子」も必要になります。これはまさにSIFTが提供するものです。

したがって、さらに混乱を招く恐れがありますが、ここではスケール不変の2つのことがあります。1つは、スケールに関係なく特定の種類の画像特徴(ブロブ)を検出するため、スケール不変のDoG関心点検出器です。言い換えれば、DoG検出器はあらゆるサイズのブロブを検出します。もう1つの縮尺不変なものは、特徴の記述子です。これは、勾配の方向のヒストグラムであり、縮尺が変わっても同じ画像の特徴に対してほぼ同じままです。

ちなみに、ここでは、ガウス分布の差が、ガプラシアンのラプラシアンフィルターの近似値として使用されています。


スケール空間理論からいくつかの情報を取得しました。スケール空間理論を使用して、2つの信号の比較で正確に何が起こるかを説明してください。Lindebergの論文:csc.kth.se/~tony/earlyvision.htmlは、ブロブなどの検出の例をいくつか作成しました。実際には、スケールパラメーターによる微分の取得は、スケールの不変性にどのように役立ちますか?
マキシマス

あなたは正しいです。私は単にスケール空間理論の背後にある直感を説明しようとしていました。あなたが尋ねていることは別の質問であるべきです。:)あなたが話しているのは、異なるスケールで得られた導関数を適切に正規化する必要があるということです。より粗いスケールに進むと、信号が平滑化されるため、振幅が減少します。つまり、導関数の大きさも減少します。したがって、スケール全体で微分応答を比較するには、それらを乗算する必要があります
Dima

シグマの適切な力:シグマによる一次導関数、シグマ^ 2による二次導関数など
Dima

@maximus、おっと、私は@を忘れました。:)
ディマ

お返事ありがとうございます!それは私を助けましたが、ここで別の質問として尋ねたいくつかの質問がまだあります:dsp.stackexchange.com/questions/570/…–
maximus

5

ガウス分布の差はスケール不変ではありません。SIFT(限られた程度まで)スケール不変。スケール空間全体でDoG極値を探します。これは、DoG極値でスケールを空間的に、および隣接するスケールに対して相対的に見つけているためです。出力DoGはこの固定スケール(入力スケールの関数ではない)で取得されるため、結果はスケールに依存せず、スケールに不変です。


1
正しい。ただし、隣接するスケールに沿って極値のみを探します。誤解しない限り、これはすべての尺度ではありません。それがすべてのスケールであったとしても、それがどのようにスケールに依存しないかはまだ明らかではありません

@water、まさにその通りです。すべてのスケールで極値が必要なわけではなく、局所的な極値が必要です。これにより、ネストされた構造、たとえば灰色の背景にある大きな明るい円の中の小さな暗い円を検出できます。
ディマ

DoGを計算する方が速いため、LoGの代わりにDoGが使用されます。
マキシマス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.