2つのデータセットD1とD2があるとします。両方とも同じ基礎となる分布Xからサンプリングされています。ニューラルネットワークをトレーニングするためにそれらを使用したいと思います。特徴はすべて範囲[0;の符号なし整数です。2 ^ 64]。
機能のスケールが大きく異なるため、シグモイド関数と組み合わせてzスコアの正規化を使用することにしました。つまり、Zスコアの正規化されたデータをロジスティック関数に送り、特徴を[0; 1]範囲。
この時点では、どの時点でデータを正規化するかわかりません。
1.)D1を使用して、D1のみを考慮して得られるmean_1とstd_dev_1で正規化します。D2のプロセスを繰り返し、mean_2とstd_dev_2を使用して正規化します。次に、2つのデータセットを使用してネットワークを順次トレーニングします。
2.)D1とD2を追加してセットD3を取得し、データセット全体(mean_3とstd_dev_3)を計算して正規化します(D1 + D2)。次に、それを使用してネットワークをトレーニングします。
ここで2つの質問:
a)2つの方法で同様の結果が得られますか?D2がD1より後に利用可能になる可能性があり、データセット全体でネットワークを再トレーニングする必要があるかどうかを知る必要があるため、私にとって特に重要です。
b)訓練されたネットワークで推論を行う場合、新しい入力を正規化するためにどのパラメーターを使用する必要がありますか?たとえば、mean_3とstd_dev_3を使用する必要がありますか?
編集:2つのデータセットの組み合わせの平均と標準偏差は、元のデータセットの平均と標準偏差から計算できることがわかりました。つまり、(理論的には)それらを順次トレーニングし、それらの分布パラメーターを組み合わせて推論の入力を正規化することができます。