ただし、エントリが正で合計がになるという条件に従ってを最小化すると、項は効果がありません( by fiat)。結果のがスパースであることを促進するためにこの場合に機能する類似のタイプの正規化はありますか?
ただし、エントリが正で合計がになるという条件に従ってを最小化すると、項は効果がありません( by fiat)。結果のがスパースであることを促進するためにこの場合に機能する類似のタイプの正規化はありますか?
回答:
スパースソリューションを作成する一般的な方法は、未知の分散を伴うゼロ平均法線を使用したMAP推定です。
次に、ゼロのモードを持つ前を割り当てると、通常、事後モードはスパースになります。指数混合分布をとることによって、このアプローチから生じます。
その後、あなたは得る
いくつかの代替案は、一般化されたダブルパレート、ハーフコーシー、逆ベータです。ある意味では、これらは大きな値を縮小しないため、なげなわよりも優れています。実際、一般化されたダブルパレートは、指数の混合として記述できると確信しています。つまり、と記述してから、ガンマの前に ます。我々が得る:
良いグローバルパラメータを選択するのに役立つように、定数を正規化しました。範囲制限を適用すると、シンプレックスで正規化する必要があるため、より複雑な問題が発生します。
スパース性を誘発するペナルティのもう1つの一般的な特徴は、ゼロでは区別できないことです。通常、これは左と右の制限が反対の符号であるためです。
これは、ニコラスポルソンとジェームズスコットによるTIRLS(非常に大きなクラスの損失ペナルティの組み合わせへの最小二乗の大規模な拡張)の開発に使用される分散平均混合表現に関する素晴らしい研究に基づいています。
別の方法として、シンプレックスで定義された事前分布を使用することもできますが、周辺分布にゼロのモードがあります。1つの例は、すべてのパラメーターが0〜1のディリクレ分布です。暗黙のペナルティは次のようになります。
ここで、です。ただし、ペナルティには特異点があるため、数値的に最適化する場合は注意が必要です。より堅牢な推定プロセスは、事後平均を使用することです。正確なスパース性は失われますが、ゼロに近い多くの事後平均が得られます。
2つのオプション: