圧縮センシングでは、 が一意のスパースソリューションcを持つという定理が保証され (詳細は付録を参照)。
投げ縄に同様の定理はありますか?そのような定理がある場合は、投げ縄の安定性を保証するだけでなく、投げ縄にさらに意味のある解釈を提供します。
lassoは、y = Xcによって応答yを生成するために使用されるスパース回帰係数ベクトルを明らかにできます。
この質問をする理由は2つあります。
「lassoはスパースソリューションを優先する」とは、選択した機能の利点が何であるかさえわからないため、機能選択にlassoを使用する理由に対する答えではないと思います。
なげなわは機能選択が不安定であることで有名です。実際には、その安定性を評価するためにブートストラップサンプルを実行する必要があります。この不安定性を引き起こす最も重要な理由は何ですか?
付録:
X_ {N \ times M} =(x_1、\ cdots、x_M)が与えられます。は -sparse vector()です。プロセスは応答yを生成します。場合オーダーのNSP(ヌル空間プロパティ)を有するとの共分散行列ゼロへの固有値近いを持っていない、に固有のソリューションが存在することになる
この定理が伝えていることは、が次数 NSPを持たない場合でも、を解くことはできません。
編集:
これらの素晴らしい答えを受け取った後、私はこの質問をしているときに混乱していることに気付きました。
この質問が混乱する理由:
私は、デザインマトリックスがいくつのフィーチャ(列)を持つかを決定する必要がある研究論文を読みました(補助フィーチャは主フィーチャから作成されます)。これは典型的な問題であるため、は適切に構築され、ラッソの解が実際のスパース解の良い近似になることが期待されます。
推論は、付録で述べた定理に基づいて行われます。 -sparse solutionを見つけることを目的とする場合、は、次数が NSPである方が適切です。
一般的な行列の場合、に違反すると、
とからのの安定したロバストな回復は不可能
はに対応し、は対応します
...関係から予想されるように、記述子の選択はより不安定になります。つまり、異なるトレーニングセットの場合、選択された記述子はしばしば異なります...
2番目の引用は私を混乱させる部分です。不平等が破られたとき、それはおそらく一意ではない解決策かもしれない(言及されていない)だけでなく、記述子もより不安定になります。