CNNの畳み込み演算子の数を決定する方法は?


10

オブジェクト分類などのコンピュータービジョンタスクでは、畳み込みニューラルネットワーク(CNN)を使用して、ネットワークが魅力的なパフォーマンスを提供します。しかし、畳み込みレイヤーでパラメーターを設定する方法がわかりません。たとえば、グレースケール画像(480x480)では、最初のたたみ込み層はのようなたたみ込み演算子を使用できます11x11x10。ここで、10はたたみ込み演算子の数を意味します。

問題は、CNNの畳み込み演算子の数をどのように決定するかです。

回答:


11

私は11x11x10、あなたが10、11x11フィルターを備えたレイヤーがあると言っていると想定しています。したがって、実行する畳み込みの数は、フィルターバンク内のフィルターごとに10個の2D離散畳み込みです。それで、あなたがネットワークを持っているとしましょう:

480x480x1    # your input image of 1 channel
11x11x10     # your first filter bank of 10, 11x11 filters
5x5x20       # your second filter bank of 20, 5x5 filters
4x4x100      # your final filter bank of 100, 4x4 filters    

実行するのは、マルチチャネル2D畳み込みで、それぞれ深さが1、10、20です。ご覧のとおり、各畳み込みの深さは、前のレイヤーからの入力ボリュームの深さの関数として変化します。10+20+100=130

10+200+2000=2,210

今、これが唯一のあなたは、各コンボリューションではありませんどのように計算集約、やっているどのように多くの単一チャネルの2D畳み込みを示しています、各コンボリューションの計算強度は、以下を含むさまざまなパラメータに依存しimage_sizeimage_depthfilter_size、あなたstride(あなたは、個々の間の段差どこまでフィルター計算)、所有しているプーリングレイヤーの数など

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.