これは、ベイジアンフレームワークで非常に優れた直感を持っています。正規化されたコスト関数Jは、観測X、yが与えられた場合のパラメーター構成\ thetaの確率と同様の役割があると考えてください。ベイズの定理を適用すると、次のようになります。θX,y
P(θ|X,y)=P(X,y|θ)P(θ)P(X,y).
式のログを取ると、次のことがわかります。
logP(θ|X,y)=logP(X,y|θ)+logP(θ)−logP(X,y).
ここで、が負の1対数後のます。最後の項はに依存しないため、最小値を変更せずに省略できます。1)尤度項はおよび依存し、2)はのみに依存します。これらの2つの用語は、式のデータ用語と正則化用語に正確に対応しています。J(θ)−logP(θ|X,y)θlogP(X,y|θ)XylogP(θ)θ
さらに進んで、投稿した損失関数が次のモデルに正確に対応することを示すことができます。
P(X,y|θ)=N(y|θX,σ21),
P(θ)=N(θ|0,σ22),
ここで、パラメータはゼロ平均ガウス分布に由来し、観測はゼロ平均ガウスノイズを持ちます。詳細については、この回答を参照してください。θy
1確率は最大にするがコストは最小にするため、負の値。