ニューラルネットワークでの1D畳み込み


9

たたみ込みの仕組みは理解していますが、1Dたたみ込みが2Dデータにどのように適用されるのかわかりません。

2D畳み込み

この例では、2Dデータの2Dたたみ込みを確認できます。しかし、1Dコンボリューションだったらどうなるでしょうか?同じようにスライドする1Dカーネルだけですか?そして、ストライドが2だったとしたら?

ありがとうございました!


1
各マトリックスの最初の行を見てください。
Piotr Migdal

例を挙げてもらえますか?
Gustavo

1D畳み込みは、厳密な2D画像には実際には役立ちません。非グレースケール画像は、3つのカラーチャンネルを備えているため、技術的には3Dです。
イーサン

1
@Gustavoこのように:toto-share.com/wp-content/uploads/2011/11/…1x1畳み込み(ニューラルネットワークの意味で)を意味しない限り、これは別のことです。
Piotr Migdal 2016年

私の問題は次のような畳み込みです:d3kbpzbmcynnmx.cloudfront.net/wp-content/uploads/2015/11/…2 つの畳み込みがあります。1つはカーネルサイズ3で、もう1つはサイズ2です...しかし、これらのカーネルは1Dまたはサイズxkです?
Gustavo

回答:


2

ましょうベクター(例えば、単語ベクトル)のシーケンスです。たたみ込み層を適用することは、すべてのnグラムに同じ重み行列を適用することと同じです。ここで、はフィルターの高さです。たとえば、場合、次のように視覚化できます。x1,,xnnn=3

ここに画像の説明を入力してください

もう少し数学的な説明については、Ji Young Lee、Franck Dernoncourtをチェックしてください リカレントおよび畳み込みニューラルネットワークを使用した逐次的なショートテキスト分類」。NAACL 2016。セクション2.1.2:

ここに画像の説明を入力してください


1

1Dたたみ込みは、フィルター次元でのダウンサンプリングとアップサンプリングのたたみ込みネットワークで使用されます。たたみ込みネットワークは、ネットワークを通過するときにこれらのフィルターマップを構築します。これらを3番目の次元と考えることができます。フィルターマップディメンションの通常のベースケースのサイズは3です。これは、RGBイメージがネットワークを通過することが多いためです。

これらの1Dたたみ込みは、ダウンサンプリング、いくつかの操作の実行、および同じ次元へのアップサンプリングに役立ちます。これは、パフォーマンス上の理由から非常に役立ちます。

本当に直感的に理解するには、以下を読むことをお勧めします。

ネットワーク内ネットワーク-http://arxiv.org/abs/1312.4400

畳み込みをさらに深くする-https ://www.google.com/url? sa= t& source= web& rct= j& url= http://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf&ved=0ahUKEwi89oeuxqnLAhXhuIMKHZrTCe0QFggkMAE&usg=AFQjCnGenEnc rrECNQ72wI3PH1Qw&sig2 = VhjfaMvuskNIDVKhFfNiqQ


4
1Dのたたみ込みではなく、(ニューラルネットワークの意味での)1x1のたたみ込みについて話しているように見えます。
Piotr Migdal 2016年

そうですね、ニューラルネットワークが関わっていると思いました。redditの/ r / MLQuestionsでこの質問へのリンクを見つけたので、それはML関連であると思いました。しかし、単純な畳み込みの場合、これはそれほど重要ではありません。
イーサン、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.