カーネルの初期化に関するいくつかの論文を読みましたが、多くの論文では、カーネルのL2正則化(多くの場合、)を使用していると述べています。
定数ゼロでバイアスを初期化し、それを正規化しないのとは違う人がいますか?
カーネル初期化ペーパー
- Mishkin and Matas:必要なのは良い初期化だけです
- Xavier GlorotとYoshua Bengio:ディープフィードフォワードニューラルネットワークのトレーニングの難しさを理解する
- 彼他:整流器を深く掘り下げる:ImageNet分類で人間レベルのパフォーマンスを超える