完全に接続されたレイヤーのたたみ込みレイヤーへの変換について読むときは、http://cs231n.github.io/convolutional-networks/#convertに投稿されています。
次の2つのコメントについて混乱しているだけです。
この変換により、元のConvNetを大きな画像内の多くの空間位置にわたって単一の順方向パスで非常に効率的に「スライド」できることがわかります。
標準のConvNetは、任意のサイズの画像で機能する必要があります。たたみ込みフィルターは画像グリッドを横切ってスライドできるので、元のConvNetをより大きな画像の任意の空間位置でスライドする必要があるのはなぜですか?
そして
32ピクセルのストライドで384x384画像の224x224クロップ全体で元のConvNet(FCレイヤー付き)を個別に評価すると、変換されたConvNetを1回転送するのと同じ結果が得られます。
ここで「32ピクセルのストライド」とはどういう意味ですか?それはフィルターサイズを指していますか?384 * 384画像の224 * 224作物について話すとき、それは224 * 224の受容野を使用することを意味しますか?
元のコンテキストでは、これら2つのコメントを赤でマークしました。