10

畳み込みの説明を読んである程度理解しました。誰かがこの操作がたたみ込みニューラルネットのたたみ込みにどのように関連しているかを理解するのを手伝ってくれませんか？gウェイトをかけるフィルターのような機能ですか？

machine-learning neural-network deep-learning cnn convolution machine-learning ensemble-modeling machine-learning classification data-mining clustering machine-learning feature-selection convnet pandas graphs ipython machine-learning apache-spark multiclass-classification naive-bayes-classifier multilabel-classification machine-learning data-mining dataset data-cleaning data machine-learning data-mining statistics correlation machine-learning data-mining dataset data-cleaning data beginner career python r visualization machine-learning data-mining nlp stanford-nlp dataset linear-regression time-series correlation anomaly-detection ensemble-modeling data-mining machine-learning python data-mining recommender-system machine-learning cross-validation model-selection scoring prediction sequential-pattern-mining categorical-data python tensorflow image-recognition statistics machine-learning data-mining predictive-modeling data-cleaning preprocessing classification deep-learning tensorflow machine-learning algorithms data keras categorical-data reference-request loss-function classification logistic-regression apache-spark prediction naive-bayes-classifier beginner nlp word2vec vector-space-models scikit-learn decision-trees data programming

— ウラジミールレーニン
ソース

1

ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets

— ホッブズ

それはまさに私が読んでいることであり、CNNのたたみ込みは行列演算であることがそこからわかります。そして、「機能的」畳み込みはそこで決して使われませんか？これは同じ名前の2つの異なる操作だけですか？

— VladimirLenin

2

おそらく、表示されている違いは、畳み込みの離散ビューと連続ビューの違いです。これは基本的に同じ操作ですが、これら2つの異なる空間で異なる方法で実行する必要があります。CNNは離散たたみ込みを使用します。そして、それは接続の数学を表現する便利な方法であるため、それを行うだけです（これは両方向に当てはまります-これは、設計が与えられた数学的便宜であり、この設計がウェルにきちんとマップされるため、人気がある理由の1つであると考えられます

— Neil Slater

2

ウィキペディアのページの表記を使用すると、CNNでの畳み込みは、必要な情報を抽出し、おそらくアクティベーション関数を適用するためにいくつかの重みを学習するカーネルになります。 $g$

離散畳み込み

ウィキペディアのページから、畳み込みは次のように説明されています

$(f * g)[n] = \sum_{m=-\inf}^{\inf} f[m]g[n-m]$

たとえば、が関数あり、がたたみ込み関数であると仮定と、 $a$ $f$ $b$ $g$

これを解決するために、我々は機能フリップ最初の方程式を使用することができ起因して、垂直式に表示されます。次に、各値の合計を計算します。変更している間、元の関数は移動しませんが、畳み込み関数はそれに応じてシフトします。から始まり、 $b$ $-m$ $n$ $n$ $n=0$

$c[0] = \sum_m a[m]b[-m] = 0 * 0.25 + 0 * 0.5 + 1 * 1 + 0.5 * 0 + 1 * 0 + 1 * 0 = 1$

$c[1] = \sum_m a[m]b[-m] = 0 * 0.25 + 1 * 0.5 + 0.5 * 1 + 1 * 0 + 1 * 0 = 1$

$c[2] = \sum_m a[m]b[-m] = 1 * 0.25 + 0.5 * 0.5 + 1 * 1 + 1 * 0 + 1 * 0 = 1.5$

$c[3] = \sum_m a[m]b[-m] = 1 * 0 + 0.5 * 0.25 + 1 * 0.5 + 1 * 1 = 1.625$

$c[4] = \sum_m a[m]b[-m] = 1 * 0 + 0.5 * 0 + 1 * 0.25 + 1 * 0.5 + 0 * 1 = 0.75$

$c[5] = \sum_m a[m]b[-m] = 1 * 0 + 0.5 * 0 + 1 * 0 + 1 * 0.25 + 0 * 0.5 * 0 * 1 = 0.25$

ご覧のとおり、それはまさにプロット得られるものです。私たちは、関数の周りにシフトして機能を超える。 $c[n]$ $b[n]$ $a[n]$

2D離散畳み込み

たとえば、マトリックスが緑色の場合

畳み込みフィルター

次に、結果として生じる演算は、以下に示すように、要素ごとの乗算と項の加算です。ウィキペディアのページが示すように、このカーネル（オレンジの行列）は、関数（緑の行列）全体にわたってシフトされます。 $g$ $f$

$g$

— JahKnows
ソース

1

はい、それらは関連しています。例として、ガウス値のカーネルとのたたみ込みであるガウス平滑化（en.wikipedia.org/wiki/Gaussian_blur）を考えます。CNNはフィルター（つまりカーネル）の重みを学習するため、必要に応じて平滑化の実行を学習できます。

— MD004
ソース

1

CNN畳み込みニューラルネットワークの略で、彼らがやっていることは、畳み込み数学の相互相関の名前とされていません。見てください、ここを。

さて、次に進む前に、畳み込みニューラルネットワークを実装するために何をしなければならないかという事実について、相互相関と畳み込みについて技術的なコメントをしたいと思います。異なる数学の教科書や信号処理の教科書を読んでいる場合、表記法に矛盾が生じる可能性があります。それは、典型的な数学の教科書を見ると、要素Yの積を計算して合計する前に畳み込みを定義する方法です。実際にはもう1つのステップ...

— メディア
ソース

数学の畳み込みとCNNの関係

離散畳み込み

2D離散畳み込み