ディープニューラルネットワークモデルがあり、約100,000のサンプルで構成されるデータセットで検証する必要があります。検証データには約1000のサンプルが含まれています。各例のトレーニングには時間がかかり(例ごとに約0.5秒)、過剰適合を避けるために、不要な計算を防ぐために早期停止を適用したいと思います。しかし、ニューラルネットワークを早期に停止して適切にトレーニングする方法がわかりません。今では理解できないことがいくつかあります。
適切な検証頻度は何ですか?各エポックの終わりに検証データでモデルをチェックする必要がありますか?(私のバッチサイズは1です)
最初のいくつかのエポックが、より良い価値に収束し始める前に、より悪い結果をもたらすかもしれませんか?その場合、早期停止をチェックする前に、いくつかのエポックについてネットワークをトレーニングする必要がありますか?
検証の損失が上下する可能性がある場合の対処方法 その場合、早期に停止すると、モデルがさらに学習できなくなる可能性がありますよね?
前もって感謝します。