「ディープノーザーの定理」:対称制約の構築


9

固有の対称性が必要な学習問題がある場合、学習を強化するために学習問題に対称制約を適用する方法はありますか?

たとえば、画像認識を行う場合、2D回転対称性が必要になる場合があります。つまり、画像の回転されたバージョンは元の画像と同じ結果になるはずです。

または、私が三目並べをプレイすることを学んでいる場合、90度回転させると同じゲームプレイが得られます。

これについて何か研究が行われましたか?



@Emreありがとう!CNN以外の仕事について知っていますか?
aidan.plenert.macdonald 2017

いいえ、私はこのニッチの表面的な知識しか持っていません。それにもかかわらず、CNNは自然な設定のように見えます...
Emre

3
Risi Kondorの博士論文、機械学習におけるグループ理論的手法(pdf)
Emre

回答:


8

上記のEmreのコメントから、Risi Kondorによる機械学習のグループ理論的手法のセクション4.4には、本質的に対称性のあるカーネルメソッドの作成に関する詳細な情報と証明があります。うまくいけば直感的な方法で要約します(私は数学者ではなく物理学者です!)。

、のようなほとんどのMLアルゴリズムは、行列の乗算を持っている

si=jWij xj=jWij (ejx)
xが入力し、Wij、我々は電車に希望の重みです。

カーネル法

カーネルメソッドの領域を入力し、s iを介してアルゴリズムに入力を処理させる

si=jWij k(ej, x)
今、私たちは一般にx,ejX

グループ検討Gに作用するXを介してxTg(x)のためのgG。このグループの下でアルゴリズムを不変にする簡単な方法は、カーネル

kG(x,y)=1|G|gGk(x,Tg(y))
k(x,y)=k(Tg(x),Tg(y))

したがって、

kG(x,Th(y))=1|G|gGk(x,Tgh(y))=1|G|gGk(x,Tg(y))=1|G|gGk(Tg(x),y)

k(x,y)=xy

kG(x,Th(y))=[1|G|gGTg(x)]y

これは、アルゴリズムへの入力を対称化できる変換行列を提供します。

SO(2)の例

実際、マップするグループだけπ2

(xi,yi)R2×R

minWji12(yiy~i)2y~i=jWjkG(ej,xi)+bi

k(x,y)=xy2k(x,y)=k(Tg(x),Tg(y))k(x,y)=xy

kG(ej,xi)=14n=14R(nπ/2) ejxi2=14n=14(cos(nπ/2)xi1)2+(sin(nπ/2)xi2)2=14[2xi12+2xi22+(1xi1)2+(1xi2)2+(1+xi1)2+(1+xi2)2]=xi12+xi22+1

Note that we needn't sum over j because it is the same for both. So our problem becomes,

minWi12(yiy~i)2y~i=W[xi12+xi22+1]+bi

Which yields the expected spherical symmetry!

Tic-Tac-Toe

Example code can be seen here. It shows how we can create a matrix that encodes the symmetry and use it. Note that this is really bad when I actually run it! Working with other kernels at the moment.


Good job, Aidan! If you have time, you can write a more detailed blog post. The community will be most interested.
Emre

1
Not sure what community you are referring to, but I started writing more. I wanted to find a way to estimate the optimal kernel given a set of data. So I optimized entropy on kernel space to intuitively get a new set of features that are symmetrically constrained and also maximally entropic (ie. informative). Now whether that it the right approach. I can't say. Just a warning, the math is a bit of a hack job right now and kind of straight out of stat mech. overleaf.com/read/kdfzdbyhpbbq
aidan.plenert.macdonald

Is there any meaningful approach when the symmetry group is not known?
leitasat

@leitasat How do you know it's symmetric if you don't know the group?
aidan.plenert.macdonald

@aidan.plenert.macdonald from the data. Let's say we have 1000 sets of 100 pictures each, and within each set there are pictures of one object from different viewpoints. Can any algorithm "learn the idea" of SO(3) symmetry and use it on previously unseen objects?
leitasat

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.