ここでは例として、スケール不変の特徴変換アルゴリズムを使用します。SIFTは、画像のスケーリングされたガウスフィルタリングに基づいてスケール空間を作成し、ガウスの差を計算して潜在的な関心点を検出します。これらの点は、ガウス分布の差全体の局所的な最小値と最大値として定義されます。
このアプローチは(他の不可解な不変性の中でも)スケール不変であると主張されています。どうしてこれなの?なぜそうなのかははっきりしていません。
ここでは例として、スケール不変の特徴変換アルゴリズムを使用します。SIFTは、画像のスケーリングされたガウスフィルタリングに基づいてスケール空間を作成し、ガウスの差を計算して潜在的な関心点を検出します。これらの点は、ガウス分布の差全体の局所的な最小値と最大値として定義されます。
このアプローチは(他の不可解な不変性の中でも)スケール不変であると主張されています。どうしてこれなの?なぜそうなのかははっきりしていません。
回答:
ここで、「スケール不変」という用語は以下を意味します。画像Iがあり、ある位置(x、y)とあるスケールレベルsで特徴(別名、関心点)fを検出したとしましょう。今、あなたがイメージI 'を持っているとしましょう。これは、Iのスケーリングされたバージョンです(たとえば、ダウンサンプリングされています)。次に、特徴検出器がスケール不変である場合、対応する位置(x '、y')および対応するスケールs 'でI'の対応する特徴f 'を検出できるはずです(ここで(x、y、s)および(x '、y'、s ') 適切なスケーリング変換によって関連付けられます。
つまり、スケール不変検出器が誰かの顔に対応する特徴点を検出し、同じシーンでカメラでズームインまたはズームアウトした場合でも、その顔の特徴点を検出する必要があります。
もちろん、2つの機能を一致させることができる「機能記述子」も必要になります。これはまさにSIFTが提供するものです。
したがって、さらに混乱を招く恐れがありますが、ここではスケール不変の2つのことがあります。1つは、スケールに関係なく特定の種類の画像特徴(ブロブ)を検出するため、スケール不変のDoG関心点検出器です。言い換えれば、DoG検出器はあらゆるサイズのブロブを検出します。もう1つの縮尺不変なものは、特徴の記述子です。これは、勾配の方向のヒストグラムであり、縮尺が変わっても同じ画像の特徴に対してほぼ同じままです。
ちなみに、ここでは、ガウス分布の差が、ガプラシアンのラプラシアンフィルターの近似値として使用されています。
ガウス分布の差はスケール不変ではありません。SIFT(限られた程度まで)スケール不変。スケール空間全体でDoG極値を探します。これは、DoG極値でスケールを空間的に、および隣接するスケールに対して相対的に見つけているためです。出力DoGはこの固定スケール(入力スケールの関数ではない)で取得されるため、結果はスケールに依存せず、スケールに不変です。