Krizhevskyの'12 CNNは、最初のレイヤーで253,440個のニューロンをどのように取得しますか?
でアレックスKrizhevskyら。深い畳み込みニューラルネットワークを使用したImagenet分類では、各層のニューロン数が列挙されます(下図を参照)。 ネットワークの入力は150,528次元で、ネットワークの残りの層のニューロンの数は253,440–186,624–64,896–64,896–43,264– 4096–4096–1000で与えられます。 3Dビュー 最初のレイヤー以降のすべてのレイヤーのニューロンの数は明らかです。ニューロンを計算する1つの簡単な方法は、そのレイヤーの3つの次元を単純に乗算することです(planes X width X height): レイヤー2: 27x27x128 * 2 = 186,624 レイヤー3: 13x13x192 * 2 = 64,896 等 ただし、最初のレイヤーを見ると: レイヤー1: 55x55x48 * 2 = 290400 これは論文で指定されているものではない ことに注意してください253,440! 出力サイズの計算 畳み込みの出力テンソルを計算する他の方法は次のとおりです。 入力画像が3DテンソルのnInputPlane x height x width場合、出力画像のサイズは次のようnOutputPlane x owidth x oheightになります owidth = (width - kW) / dW + …