を使用して読んでいたときStandardScaler
、推奨事項のほとんどは、データを電車/テストStandardScaler
に分割する前に使用する必要があると言っていましたが、オンラインで投稿されたコードの一部をチェックするときに(sklearnを使用して)2つの主要な用途がありました。
1- StandardScaler
すべてのデータで使用。例えば
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_fit = sc.fit(X)
X_std = X_fit.transform(X)
または
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X = sc.fit(X)
X = sc.transform(X)
または単に
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_std = sc.fit_transform(X)
2- StandardScaler
分割データで使用。
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform (X_test)
データを標準化したいのですが、どの方法が最適なのかわかりません!