その式の意味は本当に簡単です。画像の2つの同じサイズの小さな領域、青の領域と赤の領域を撮影するとします。
ウィンドウ関数は、赤い長方形の外側では0に等しくなります(簡単にするために、ウィンドウは単純に赤い長方形内で一定であると仮定できます)。そのため、ウィンドウ関数は、見たいピクセルを選択し、各ピクセルに相対的な重みを割り当てます。(最も一般的なのはガウスウィンドウです。回転対称で、ウィンドウの中心付近のピクセルを計算して強調するのが効率的だからです。)青い長方形は(u、v)だけシフトされます。
次に、赤と青でマークされた画像部分の差の二乗和を計算します。つまり、ピクセルごとにそれらを減算し、差を二乗し、結果を合計します(簡単にするため、探している領域のウィンドウ= 1 at)。これにより、すべての可能な(u、v)-> E(u、v)に対して1つの番号が与えられます。
u / vの異なる値に対してそれを計算するとどうなるか見てみましょう。
最初にv = 0を維持:
これは驚くべきことではありません。画像部分間の差は、それらの間のオフセット(u、v)が0のときに最も小さくなります。
u = 0を維持:
プロットは似ていますが、エッジの方向に青い長方形をシフトすると、2つの画像部分間の平方差の合計は非常に小さくなります。
E(u、v)の完全なプロットは次のようになります。
プロットは「キャニオン」のように見えます。キャニオンの方向に画像をシフトした場合、わずかな違いしかありません。これは、この画像パッチが支配的な(垂直)方向を持っているためです。
別のイメージパッチに対しても同じことができます。
ここで、E(u、v)のプロットは異なります。
どの方法でパッチをシフトしても、見た目は常に異なります。
したがって、関数E(u、v)の形状は、イメージパッチについて何かを教えてくれます
- E(u、v)がどこでも0に近い場合、見ている画像パッチにテクスチャはありません
- E(u、v)が「キャニオン型」の場合、パッチの向きは支配的です(エッジまたはテクスチャの可能性があります)
- E(u、v)が「円錐形」の場合、パッチにはテクスチャがありますが、支配的な方向はありません。それは、コーナー検出器が探している種類のパッチです。
多くの参考文献は、それがウィンドウ「w」がシフトする大きさだと言っています...それで、ウィンドウはどれだけシフトされますか?1ピクセル... 2ピクセル?
通常、E(u、v)はまったく計算しません。興味があるのは、(u、v)=(0,0)の近傍での形状のみです。そのため、E(u、v)のテイラー展開を(0,0)近くにしたいだけです。これは、その「形状」を完全に記述します。
ピクセル位置の合計はウィンドウでカバーされていますか?
数学的に言えば、すべてのピクセルにわたって合計範囲を設定する方がよりエレガントです。実際には、ウィンドウが0であるピクセルを合計しても意味がありません。