Pythonの特徴選択方法のコードは次のとおりです。
from sklearn.svm import LinearSVC
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target
X.shape
(150, 4)
X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y)
X_new.shape
(150, 3)
しかし、新しいX(依存変数-X_new)を取得した後、どの変数が削除され、どの変数がこの新しい更新された変数で考慮されるかをどのようにして知ることができますか?(どれが削除されたか、どれがデータに存在するか。)
この識別情報を取得するのは、新しいテストデータに同じフィルタリングを適用するためです。