回答:
バイアスは仮想ニューロンごとに動作するため、単一の出力がある場合に複数のバイアス入力を持つことに価値はありません。これは、異なるバイアスの重みを単一のバイアスに加算することと同じです。
最初の非表示レイヤーの出力であるフィーチャマップでは、色が分離されなくなりました*。事実上、各フィーチャマップは次のレイヤーの「チャネル」ですが、通常は別々に視覚化され、チャネルを組み合わせて入力が視覚化されます。これについてのもう1つの考え方は、元の画像の個別のRGBチャネルが入力の3つの「機能マップ」であるということです。
前のレイヤーにあるチャネルまたはフィーチャの数は関係ありません。次のレイヤーの各フィーチャマップへの出力は、そのマップの単一の値です。1つの出力値は1つの仮想ニューロンに対応し、1つのバイアス重みが必要です。
CNNでは、質問で説明したように、同じ重み(バイアスの重みを含む)が出力フィーチャマップの各ポイントで共有されます。したがって、各フィーチャマップには、独自のバイアスの重みとprevious_layer_num_features x kernel_width x kernel_height
接続の重みがあります。
したがって、はい、(3 x (5x5) + 1) x 32
最初のレイヤーの合計重みになる結果は、最初の非表示レイヤーがRGB入力を32の個別のフィーチャマップに処理するCNNに適しています。
*動作するカラーチャネルに分離できるCNN ウェイトの視覚化を見て混乱するかもしれません。
同じ特徴を検出するために共有の重みとバイアス(レイヤー内のすべての非表示ニューロンに同じ重みとバイアス)を使用するのはCNNの特性です。これは、単純なニューラルネットワークと比較してより深い学習につながります。これを参照として読むことができます:
http://deeplearning.net/tutorial/lenet.html
http://neuralnetworksanddeeplearning.com/chap6.html#introducing_convolutional_networks