どのようなものがあり


12

最近、スパース表現に関する多くの論文を目にしており、それらのほとんどはノルムを使用し、いくつかの最小化を行っています。私の質問は、ノルムと混合ノルムとは何ですか?そして、それらは正則化にどのように関連していますか?のp ℓのP Qppp,q

ありがとう

回答:


13

pノルムは、ベクトルを取り、非負の数を返す関数です。これらは、として定義されます。p= ​​2の場合、これはユークリッドノルムと呼ばれます。ユークリッド距離を\ | \ vec x-\ vec y \ | _2として定義できます。とき、P = \ inftyの、これだけの手段\ | \ VEC X \ | _ \ inftyの= \ sup_i X_I(または\ MAX_I X_I)。厳密に言えば、\ | \ vec x \ | _pノルムであるためには、pは少なくとも1でなければなりません。もし0 <p <1 、その後、\ | \ VEC X \ | _p

xp=(i=1d|xi|p)1/p
p=2xy2p=x=supiximaxixipxp0<p<1xp ノルムは三角形の不等式を満たす必要があるため、実際にはノルムではありません。

(ベクトルやシーケンスの代わりに関数を除いて、同様に定義されるノルムもあります-ベクトルは有限領域を持つ関数なので、これは実際には同じことです。)Lp

私は、を除いて、である機械学習アプリケーションでのノルムの使用法を知りません。通常、または。または、場合を緩和したい場所でになることもあります。はで厳密に凸ではありませんが、は凸です。これにより、特定の場合にソリューションを「より簡単に」見つけることができます。p>2p=p=2p=11<p<2p=1x1xxp1<p<

正則化のコンテキストで、目的の関数にを追加すると、がスパースである、つまり、ほとんどがゼロで構成されると期待していることになります。それは少し技術的ですが、基本的に、密なソリューションがある場合、同じ基準のスパースソリューションが存在する可能性があります。ソリューションの密度が高いことが予想される場合は、を目的に追加でき ます。これは、その導関数での作業がはるかに簡単になるためです。どちらも、解が重すぎないようにする目的に役立ちます。x1xx22

複数のソースを統合しようとすると、混合基準が入ります。基本的には、解ベクトルをいくつかの部分で構成する必要があります。ここで、はソースのインデックスです。ノルムだけである全てのノルムベクトルに収集-norms。つまり、xjjp,qqp

xp,q=(j=1m(i=1d|xij|p)q/p)1/q

これの目的は、たとえばを使用して、ソリューションのセットを「過剰分散」することではありません。個々の部分はまばらですが、すべての解のノルムを取ることで、解ベクトル全体を無理に操作するリスクはありません。したがって、代わりに外側でノルムを使用します。x1,212

お役に立てば幸いです。

詳細については、このペーパーを参照してください。


1
混合基準の説明については+1。自分では理解できませんでした。
Suresh Venkatasubramanian 2012

(+1)いい答えです。ジョン、CrossValidatedへようこそ。
MånsT
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.