カーネルサイズとはどういう意味ですか?


12

人々がニューラルネットワークについて話すとき、彼らが「カーネルサイズ」と言うとき、彼らはどういう意味ですか?カーネルは相似関数ですが、カーネルサイズについてはどうでしょうか。


1
CNNのコンテキストでは、畳み込みフィルターのサイズを意味するために「カーネルサイズ」を使用することがあり、同様に「カーネル」はフィルター自体です。
Sycorax氏は、モニカ

回答:


17

ディープニューラルネットワーク、より具体的には畳み込みニューラルネットワーク(CNN)は、基本的に、入力に対するいくつかのフィルターの作用によって定義されるレイヤーのスタックです。これらのフィルターは通常カーネルと呼ばれます。

たとえば、たたみ込み層のカーネルはたたみ込みフィルターです。実際には畳み込みは行われませんが、相互相関が行われます。ここでのカーネルサイズは、フィルターマスクのwidthxheightを指します。

たとえば、最大プーリングレイヤーは、マスク(カーネル)内のピクセルのセットから最大値を持つピクセルを返します。そのカーネルは入力をスイープして、サブサンプリングします。

したがって、サポートベクターマシンや正則化ネットワークのカーネルの概念とは何の関係もありません。あなたはそれらを特徴抽出器と考えることができます。


14

ここに画像の説明を入力してください

上記からわかるように、カーネルはカーネルマトリックスとも呼ばれ、その中間の関数であり、そのサイズ、ここでは3がカーネルサイズです(カーネルの幅はカーネルの高さに等しい)。

カーネルは必ずしも対称的である必要はないことに注意してください。TensorflowのConv2Dドキュメントからこのテキストを引用することで確認できます。

kernel_size:2D畳み込みウィンドウの高さと幅を指定する整数または2つの整数のタプル/リスト。単一の整数で、すべての空間次元に同じ値を指定できます。

ただし、通常は、幅と高さを等しくするだけです。そうでない場合、カーネルサイズは2のタプルにする必要があります。また、カーネルサイズは2より大きい数値にすることができます。たとえば、Conv3Dの下の例では(4、4、3)

ここに画像の説明を入力してください

素晴らしいgifはここここから来てます


カーネルサイズは対称である必要がありますか?
Ben

1
@Benいいえ、それは必要ないので、カーネルサイズは1、2、または3の数値のタプルにすることができます。
Lerner Zhang
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.