ボトルネックアーキテクチャは、[2つの3x3 convレイヤー]が[1x1 conv、1つの3x3 conv、および1x1 convレイヤー]に置き換えられたResNet論文で見つかったタイプとして定義されます。
1x1のconvレイヤーは、次元削減(および復元)の形式として使用されることを理解しています。これについては、別の投稿で説明しています。ただし、この構造が元のレイアウトと同じくらい効果的である理由についてはわかりません。
いくつかの良い説明が含まれる場合があります:どのストライド長が使用され、どのレイヤーで?各モジュールの入力および出力の寸法の例は何ですか?上記の図で56x56の機能マップはどのように表されますか?64-dはフィルターの数を指しますが、なぜこれが256-dフィルターと異なるのですか?各レイヤーで使用されるウェイトまたはフロップの数は?
どんな議論も大歓迎です!