3
ダミー変数のセンタリングとスケーリング
カテゴリ変数と連続変数の両方を含むデータセットがあります。カテゴリ変数を各レベルのバイナリ変数(A_level1:{0,1}、A_level2:{0,1}など)に変換することをお勧めしました-一部の人はこれを「ダミー変数」と呼んでいると思います。 そうは言っても、新しい変数を使用してデータセット全体を中央に配置してスケーリングするのは誤解を招くでしょうか?変数の「オン/オフ」の意味を失うかのようです。 誤解を招く場合、それは連続変数を個別に中央揃えおよびスケーリングし、それをデータセットに再度追加する必要があることを意味しますか? TIA。