回帰におけるデータのセンタリングと標準化の必要性


16

いくつかの正則化を伴う線形回帰を考えてみましょう:例えばを最小化するを見つけますx||Axb||2+λ||x||1

通常、Aの列は平均と単位ノルムがゼロになるように標準化され、は平均がゼロになるように中央揃えされます。標準化とセンタリングの理由についての私の理解が正しいかどうかを確認したいと思います。b

と列の平均をゼロにすることにより、切片項はもう必要ありません。そうでなければ、目的はます。Aの列のノルムを1にすることにより、Aの1つの列が非常に高いノルムを持っているために係数が低くなり、その列が誤って結論付けられる可能性を排除します。 Aはxをうまく「説明」しません。Ab||Axx01b||2+λ||x||1xx

この推論は厳密ではありませんが、直感的には正しいと思いますか?

回答:


14

Abの列の平均をゼロにすることは正しいbです。

ただし、Aの列のノルムの調整Aについては、ノルムのAから始めてxのAすべての要素がほぼ同じ大きさだった場合にどうなるかを考えてください。次に、1列に、たとえば10 ^ {-6}を掛けます。xの対応する要素は、正規化されていない回帰では、10 ^ 6の係数で増加します。正則化用語がどうなるか見てみましょう。正則化は、すべての実用的な目的のために、その1つの係数にのみ適用されます。 x106x106

の列を標準化することにより、直感的に記述して、すべてを同じスケールにします。その結果、の要素の大きさの違いは、説明関数()の「ウィグリグリネス」に直接関係します。これは、大まかに言って、正規化が制御しようとするものです。それなしでは、例えば、0.1対10.0の係数値は、についての知識がない場合、どの係数が「ウィグリグリネス」に最も寄与していたかを教えてくれません。(ような線形関数の場合、 "wiggliness"は0からの偏差に関連しています。)AxAxAAxAx

説明に戻りますが、 1つの列のノルムが非常に高く、何らかの理由で係数が低い場合、の列がうまく「説明」していないと結論付けません。 はを「説明」しません。 AxAxAx


という$x$ does not ''explain'' $A$ well意味x does not ''explain'' $A$ at allですか?この場合、はデータであり、はモデルです。Ax
ユーザー3813057

@ user3813057-これは正則化に関する質問であり、説明力とは関係ありません。 は通常ラベルが付けられ、は通常ラベルが付けられ、はラベルが付けられます。 はを説明ではありません。xβAXbyxA
jbowman
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.