回答:
どうして?カーネルが1x2(つまり、幅2ピクセル、高さ1ピクセル)の最も単純なケースを見てみましょう。
以下は、垂直エッジを検出するエッジ検出器のカーネルマトリックスです。
次に、垂直エッジも検出するエッジ検出器の別のマトリックスを示します。
特に、畳み込みは、垂直でエッジの右側の輝度が高く、左側の輝度が低い(右側が白く、左側が黒くなる)エッジに強く応答します。 は、反対の強度変化(左が白く、右が黒)を持つ垂直エッジに強く応答します。
他の例でも同じことが言えます。たとえば、
これは、出力での再スケーリングを除いて、とほぼ同じように動作します。
簡単にするために、それらのエントリの合計がゼロになるように正規化された畳み込みカーネルに焦点を当てましょう。(実際に使用する多くの畳み込みカーネルは、このような形式を持っています。なぜなら、それらには素晴らしい特性があるからです。)
ランダムな1x2マトリックスはどうですか?まあ、それが正規化されていれば、必然的に次のような形になります。
いくつかの定数(はランダム)の場合。が何であるかに関係なく、これはまたはように動作することがわかります。
結論:ランダムな正規化された1x2畳み込みフィルターは、高い確率で、垂直エッジ検出器のように動作します。
これは、他のサイズのカーネルに一般化できます。ランダムな正規化された2x1カーネルの場合、基本的には水平エッジ検出器を取得します。ランダムな正規化された2x2カーネルは、ある方向のエッジに反応する可能性があります(ある角度である可能性があります。特定の方向は行列のエントリによって異なります)。
マトリックスがどんどん大きくなるにつれて、この効果は減少します(私はそう思います)。ただし、実際には通常、比較的小さなたたみ込みカーネル(かなり小さな受容野)を使用するため、小さなたたみ込みカーネルでの動作をほとんど気にします。
正規化はどうですか?これまでは、ランダムに生成され、合計がゼロになるように正規化された行列について説明してきました。正規化ステップをスキップするとどうなりますか?
まあ、これはあまり変わりません。正規化を使用しない場合、ランダム行列はに分解できますここでは正規化され、そのエントリの合計はゼロになり、は定数、はすべてのエントリ。
入力画像をたたみ込むことは、基本的にエッジ検出フィルターを入力画像に適用する可能性が高いです(前述のとおり)。入力画像をで畳み込むと、基本的に画像がぼやけてから乗算され。したがって、出力画像は、これら2つの(重み付けされた)合計です。エッジ検出フィルターと画像のぼかされたバージョンの(重み付けされた)合計です。
ランダム行列の場合、が比較的小さくなる可能性があり(ランダムな変数の束の合計の平均はかなり小さいことが多いため)を乗算すると、出力画像がエッジ検出器によってより決定されます。ぼかしによって。が小さい場合、基本的に合計の2番目の項を無視し、エッジ検出フィルターの結果として出力画像を近似できます。
そのため、ランダムマトリックスを使用したたたみ込みでは、ある種のエッジ検出器を入力画像に適用したように見える可能性があります。
これらのページのサンプル画像を見ると、最初の画像はエッジ検出器のように見え、2番目の画像はぼかし演算子のように見えます。これは上記の分析と一致しています。