回答:
ノルムは、ベクトルを取り、非負の数を返す関数です。これらは、として定義されます。p= 2の場合、これはユークリッドノルムと呼ばれます。ユークリッド距離を\ | \ vec x-\ vec y \ | _2として定義できます。とき、P = \ inftyの、これだけの手段\ | \ VEC X \ | _ \ inftyの= \ sup_i X_I(または\ MAX_I X_I)。厳密に言えば、\ | \ vec x \ | _pがノルムであるためには、pは少なくとも1でなければなりません。もし0 <p <1 、その後、\ | \ VEC X \ | _p
(ベクトルやシーケンスの代わりに関数を除いて、同様に定義されるノルムもあります-ベクトルは有限領域を持つ関数なので、これは実際には同じことです。)
私は、を除いて、である機械学習アプリケーションでのノルムの使用法を知りません。通常、または。または、場合を緩和したい場所でになることもあります。はで厳密に凸ではありませんが、は凸です。これにより、特定の場合にソリューションを「より簡単に」見つけることができます。
正則化のコンテキストで、目的の関数にを追加すると、がスパースである、つまり、ほとんどがゼロで構成されると期待していることになります。それは少し技術的ですが、基本的に、密なソリューションがある場合、同じ基準のスパースなソリューションが存在する可能性があります。ソリューションの密度が高いことが予想される場合は、を目的に追加でき ます。これは、その導関数での作業がはるかに簡単になるためです。どちらも、解が重すぎないようにする目的に役立ちます。
複数のソースを統合しようとすると、混合基準が入ります。基本的には、解ベクトルをいくつかの部分で構成する必要があります。ここで、はソースのインデックスです。ノルムだけである全てのノルムベクトルに収集-norms。つまり、
これの目的は、たとえばを使用して、ソリューションのセットを「過剰分散」することではありません。個々の部分はまばらですが、すべての解のノルムを取ることで、解ベクトル全体を無理に操作するリスクはありません。したがって、代わりに外側でノルムを使用します。
お役に立てば幸いです。
詳細については、このペーパーを参照してください。