タグ付けされた質問 「gradient-descent」

2
ニューラルネットワークのコンテキストでは、平均二乗誤差は常に凸形ですか?
私が言及した複数のリソースは、MSEは凸型であるため優れていると述べました。しかし、特にニューラルネットワークのコンテキストでは、その方法がわかりません。 次のものがあるとします。 バツXX:トレーニングデータセット YYY:ターゲット ΘΘ\Theta:モデルfΘfΘf_\Thetaパラメータのセット Θ(非線形性を持つニューラルネットワークモデル) 次に: MSE(Θ )= (fΘ(X)− Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 なぜこの損失関数は常に凸型になるのでしょうか?これはに依存しないfΘ(X)fΘ(X)f_\Theta(X)?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.