CNNでは、各新しいフィルターは各入力チャンネルに対して異なる重みを持っていますか、または各フィルターの同じ重みが入力チャンネル全体で使用されていますか?
私の理解では、畳み込みニューラルネットワークの畳み込み層には、input_channels、filter_height、filter_width、number_of_filtersの4つの次元があります。さらに、各新しいフィルターは、すべてのinput_channels(または前のレイヤーの機能/アクティベーションマップ)で複雑になるだけであると理解しています。 ただし、CS231の次の図は、チャネル全体で使用されている同じフィルターではなく、単一フィルターに適用されている各フィルター(赤)を示しています。これは、各チャンネルに個別のフィルターがあることを示しているようです(この場合、入力画像の3つのカラーチャンネルであると仮定していますが、すべての入力チャンネルに同じことが当てはまります)。 これは紛らわしいです-入力チャンネルごとに異なるユニークなフィルターがありますか? ソース:http : //cs231n.github.io/convolutional-networks/ 上記の画像は、O'reillyの"Fundamentals of Deep Learning"からの抜粋と矛盾しているようです。 「...フィルタは、単一の機能マップで動作するだけではありません。特定のレイヤーで生成された機能マップのボリューム全体で動作します...その結果、機能マップはボリューム上で動作できなければなりません。エリアだけでなく」 ...また、これらの画像は以下を示しているというのが私の理解ですSAMEだけ(CS231グラフィック上記に示しているものと矛盾)すべての3つの入力チャネルを介して畳み込まれるフィルタは: