すべてのデータまたはフォールド(CVが適用されている場合)を同時に変換しますか?例えば
(allData - mean(allData)) / sd(allData)
trainsetとtestsetを別々に変換しますか?例えば
(trainData - mean(trainData)) / sd(trainData)
(testData - mean(testData)) / sd(testData)
または、トレインセットを変換し、テストセットで計算を使用しますか?例えば
(trainData - mean(trainData)) / sd(trainData)
(testData - mean(trainData)) / sd(trainData)
3は正しい方法だと思います。3が正しい場合、平均が0でないこと、または範囲が[0;の間にないことを心配する必要があります。1]または[-1; 1]テストセットの(正規化)?
R
ますか?この質問を参照してください:stackoverflow.com/questions/49260862/…–