ガウスのラプラス
画像のガウスのラプラス(LoG)は、f
∇2(f∗ g)= f∗ ∇2g
ガウシアンカーネルと畳み込み。つまり、ガウスカーネルで平滑化された画像のラプラスは、ガウスカーネルのラプラスで畳み込まれた画像と同じです。この畳み込みは、2Dの場合、次のようにさらに拡張できます。∗g∗
f∗∇2g=f∗(∂2∂x2g+∂2∂y2g)=f∗∂2∂x2g+f∗∂2∂y2g
したがって、ガウスカーネルの2次導関数を使用した入力画像の2つの畳み込みの加算として計算できます(3Dでは、これは3つの畳み込みなどです)。これは、ガウスカーネルとその派生物が分離可能であるため興味深いものです。あれは、
f(x,y)∗g(x,y)=f(x,y)∗(g(x)∗g(y))=(f(x,y)∗g(x))∗g(y)
つまり、2D畳み込みの代わりに、2つの1D畳み込みを使用して同じことを計算できます。これは多くの計算を節約します。考えられる最小のガウスカーネルでは、各次元に5つのサンプルがあります。2Dたたみ込みには25の乗算と加算が必要で、2つの1Dたたみ込みには10が必要です。カーネルが大きいほど、または画像の次元が多いほど、これらの計算上の節約は大きくなります。
したがって、LoGは4つの1D畳み込みを使用して計算できます。ただし、LoGカーネル自体は分離できません。
画像が最初にガウスカーネルで畳み込まれ、次にが有限差分を使用して実装されるという近似があります。これにより、中央が-4、隣接する4つのエッジが1の3x3カーネルになります。∇2
リッカーウェーブレットまたはメキシカンハットオペレーターは、スケーリングと正規化まで、LoGと同じです。
ガウシアンの違い
画像のガウス(DoG)の差は、f
f∗g(1)−f∗g(2)=f∗(g(1)−g(2))
したがって、LoGと同様に、DoGは単一の分離不可能な2D畳み込み、または2つの分離可能な畳み込みの合計(この場合は差分)と見なすことができます。このように見ると、LoGよりもDoGを使用する方が計算上の利点がないように見えます。ただし、DoGは調整可能なバンドパスフィルターであり、LoGは同じ方法で調整できないため、微分演算子と見なす必要があります。DoGは、画像が多くのスケール(シグマが異なるガウシアン)でフィルターされるスケールスペース設定でも自然に表示されます。後続のスケールの違いはDoGです。
分離可能で、計算コストを半分に削減できるDoGカーネルの近似がありますが、その近似は等方性ではないため、フィルターの回転依存性につながります。
2つのガウスカーネル間のシグマの差が非常に小さい(スケーリングまで)DoGの場合、LoGとDoGの同等性を(自分自身で)一度示しました。これまでの記録はありませんが、見せることは難しくありませんでした。
これらのフィルターを計算する他の形式
ローランの答えは再帰フィルタリングに言及しており、OPはフーリエドメインでの計算に言及しています。これらの概念は、LoGとDoGの両方に適用されます。
ガウスおよびその誘導体が原因と反因果IIRフィルタを用いて計算することができます。したがって、上記のすべての1D畳み込みは、シグマに対して一定の時間で適用できます。これはより大きなシグマに対してのみ効率的であることに注意してください。
同様に、任意の畳み込みをフーリエドメインで計算できるため、DoGカーネルとLoG 2Dカーネルの両方をフーリエドメインに変換(またはそこで計算)して、乗算によって適用できます。
結論として
これら2つのアプローチの計算の複雑さに大きな違いはありません。DoGを使用してLoGを概算する正当な理由はまだわかりません。