私のデータは、いくつかの連続測定と、測定が行われた年を表すいくつかのダミー変数で構成されています。今、私はデータを使ってニューラルネットワークを学びたいです。したがって、ダミー変数を含むすべての変数をzScoreで正規化しています。ただし、ダミー変数を正規化するとその範囲が変更されるため、これが妥当な方法であるかどうか疑問に思います。これは、分布が異なる場合に比較可能性を低くするためです。一方、ダミー変数を正規化しないと、ネットワーク出力への影響が最適化されない可能性があるため、疑わしいかもしれません。
ダミー変数を処理し、それらを正規化(zScore)するか、そのままにしておくための最良のアプローチは何ですか?
4
A. Gelmanによるこの論文は興味深いかもしれません。興味深いstat.columbia.edu/~gelman/research/published/standardizing7.pdf
—
boscovich