SGDでは、エポックはトレーニングデータの完全なプレゼンテーションであり、エポックごとにN個の重み更新があります(トレーニングセットにN個のデータ例がある場合)。
代わりにミニバッチを実行する場合、たとえば20のバッチで実行します。1つのエポックはN / 20の重みの更新で構成されますか、それとも同じ数の重みの更新が含まれるように20ずつ「延長」されるエポックですか?
いくつかの論文のように私はこれを尋ねます学習は述べられた時代の数に対して速すぎるようです。
ニューラルネットワークをトレーニングするため
—
フランクダーノンコート
質問は慣例に関するものです。つまり、誰かが20のミニバッチを使用して10エポックのネットワークをトレーニングしたと述べた場合、これは10 * Nの重みの更新、または10 * N / 20があったことを意味しますか?
—
ジェームズ
わかりました。混乱してしまいました。多分stats.stackexchange.com/a/164875/12359があなたの質問に答えますか?
—
フランクダーノンコート