畳み込みの2番目の引数の意味は何ですか?


8

私は工学における畳み込みとその数学的特性および解釈(特にコンピュータービジョンのコンテキスト)をよりよく理解しようとしていました。畳み込みを思い出してください:

s(t)=(xw)(t)=x(a)w(ta)da

(畳み込みへの)最初の引数は通常入力と呼ばれますが、(畳み込みへの)2番目の引数は通常「カーネル」と呼ばれます。ただし、コンピュータビジョンと畳み込みニューラルネットワークでは、2番目の引数は通常「テンプレート」と呼ばれます(エッジやホイールの画像、オブジェクトの一部など)。しかし、他の分野では、信号とシステムであると思います。これは通常「フィルター」と呼ばれます。xw

コンピュータソフトウェアエンジニアとして、ネーミングは特定の概念について考える力を与えるため、非常に重要であると思います。悪い名前を付けると、ずさんな考えにつながる可能性があります。したがって、私はこれらの技術名がおそらくこれらのアイデアを念頭に置いて選択されたと想定していました。これらの名前がたたみ込みの2番目の引数に使用された理由を誰かが知っているか理解していますか?

私が知っている具体的な名前は次のとおりです。

  1. カーネル(純粋な数学から?)
  2. フィルター(信号とシステム?)
  3. テンプレート(コンピュータービジョン/機械学習)

不足しているものがあるかどうかはわかりませんが、これらのネーミングをよりよく理解し、たぶん(うまくいけば)たたみ込み演算子の機能と、工学および数学におけるその解釈を直感的に理解したいと思います。

回答:


6

2番目の引数の名前の多様な範囲は、畳み込み演算が非常に多くの異なる分野で非常に有用であるという事実から生じていると思います。

特定の用語に取り組む前に、畳み込み演算が何をするかを思い出すことは役に立ちます。Wolfram Mathworldからの引用によれば、「たたみ込みは、ある関数が別の関数シフトされるときの、その関数オーバーラップの量を表す積分です。」別の方法で表現すると、畳み込みは、ある関数が別の関数内にどれだけ存在しているかを確認する数学的方法です。ウィキペディアの畳み込み視覚的な例には、それがどのように機能するかについての素晴らしい説明があります。 gf

  1. カーネル:これは最も一般的な用語であり、数学に由来します。数学では、積分変換定義される 一般的な変換この積分変換の関数はカーネルと呼ばれます。畳み込み演算は、このより一般的な変換のサブクラスにすぎないため、2番目の関数は当然ながらカーネルと呼ばれます。残念ながら、一般的な積分変換におけるカーネルという用語の起源はわかりません。

    g(α)=abf(t)K(α,t)dt.
    K(α,t)
  2. フィルター:デジタル信号処理では、「既知の信号またはテンプレートを未知の信号と相関させて、未知の信号内のテンプレートの存在を検出することによって、一致したフィルターが得られます。」この意味で、2番目の関数は最初の関数のフィルターとして機能し、最初の関数のどの部分に2番目のプロパティがあるかを通知します。

  3. テンプレート:これは私にはあまり馴染みのないものですが、「フィルター」という用語と同じ場所からどのように発生するかを理解できると思います。テンプレートは、未知の信号で検索するアプリオリな既知の信号です。2つの畳み込みは、未知の信号のどの部分がテンプレートと同じ特性を持っているかを示します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.