と仮定します。
正確にはわかりませんが、各予測子との相関関係のみがわかります。
通常の最小二乗(OLS)解はであり、問題はありません。
しかし、がほぼ特異(多重共線性)であり、最適なリッジパラメーターを推定する必要があるとします。すべてのメソッドは正確な値を必要とするようです。
がわかっている場合、代替方法はありますか?
と仮定します。
正確にはわかりませんが、各予測子との相関関係のみがわかります。
通常の最小二乗(OLS)解はであり、問題はありません。
しかし、がほぼ特異(多重共線性)であり、最適なリッジパラメーターを推定する必要があるとします。すべてのメソッドは正確な値を必要とするようです。
がわかっている場合、代替方法はありますか?
回答:
これは興味深い質問です。驚くべきことに、特定の仮定の下で何かを行うことは可能ですが、残差分散に関する情報が失われる可能性があります。に依存します。
のは、以下の特異値分解を考えるのと AN正規直交列を有する行列、正の特異値を持つ対角行列対角および a直交行列の次に、の列は、および の列空間の正規直交基底を形成します。 で展開されたときに、この列スペースにを投影するための係数のベクトル X U N × P D D 1 ≥ D 2 ≥ 。。。≥ D P > 0 V P × P U X Z = U T Y = D - 1 V T V D U T Y = D - 1 V T X T Y Y U Z X
所与のためのリッジ回帰予測のでように計算することができる 列ベースの リッジ回帰予測子の係数は ここで、は次元の平均と共分散行列があるという分布の仮定を立てます。その後、有する次元の平均および共分散行列。独立した人を想像するとY = X (X T X + λ I )- 1 X T Y = U D (D 2 + λ I )- 1 D U T Y = U D (D 2 + λ I )- 1 D Z U Z = D (D 2 + λ I )-
標準計算による ここでは、パラメーターを使用したリッジ回帰の有効自由度として知られています。の不偏推定量は、
我々は(公平)と組み合わせる推定 の、わかっている場合は、最小化する必要があります。私たちが知っている場合は明らかに、これはのみ行うことができますまたは合理的に推測かの推定持つ。
推定には、より問題があります。示すことが可能である したがって、二乗バイアスを無視できるほど小さいを選択できる場合は、をとして 推定することができ これが機能するかどうかは、大きく依存します。
質問のようにを定義し、をさまざまなパラメーターに設定し、サンプルラベルのを設定します。次いで、不明ので計算可能であるの両方を展開するときにドロップアウト規範。
これは、次のアルゴリズムにつながります。