プログラミング neuraxle

scikit-learnの複数の列にわたるラベルエンコーディング

文字列ラベルのLabelEncoderパンダをエンコードするためにscikit-learnを使用しようとしていますDataFrame。データフレームには多数（50以上）の列があるLabelEncoderため、列ごとにオブジェクトを作成しないようにします。私はむしろ、データのすべての列LabelEncoderにわたって機能する1つの大きなオブジェクトが欲しいだけです。全体DataFrameをにLabelEncoderスローすると、以下のエラーが発生します。ここではダミーデータを使用していることに注意してください。実際には、文字列でラベル付けされたデータの約50列を扱っているため、名前で列を参照しないソリューションが必要です。 import pandas from sklearn import preprocessing df = pandas.DataFrame({ 'pets': ['cat', 'dog', 'cat', 'monkey', 'dog', 'dog'], 'owner': ['Champ', 'Ron', 'Brick', 'Champ', 'Veronica', 'Ron'], 'location': ['San_Diego', 'New_York', 'New_York', 'San_Diego', 'San_Diego', 'New_York'] }) le = preprocessing.LabelEncoder() le.fit(df) トレースバック（最後の最後の呼び出し）：ファイル ""、行1、ファイル "/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/preprocessing/label.py"、行103、フィットy = column_or_1d（y、warn = True）ファイル "/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/utils/validation.py"、line 306、in column_or_1d raise ValueError（ "bad …

216 python pandas scikit-learn neuraxle

Python-正確にはsklearn.pipeline.Pipelineとは何ですか？

どのようにsklearn.pipeline.Pipeline動作するのか正確に理解できません。ドキュメントにいくつかの説明があります。たとえば、次の意味は何ですか。最終的な推定量を使用した変換のパイプライン。私の質問をより明確にするために、何stepsですか？それらはどのように機能しますか？編集する回答のおかげで、質問をより明確にすることができます：パイプラインを呼び出して、ステップとして、2つのトランスフォーマーと1つの推定器を渡します。例： pipln = Pipeline([("trsfm1",transformer_1), ("trsfm2",transformer_2), ("estmtr",estimator)]) これを呼び出すとどうなりますか？ pipln.fit() OR pipln.fit_transform() 推定器を変圧器にする方法や、変圧器を取り付ける方法を理解できません。

117 python machine-learning scikit-learn neuraxle

タグ付けされた質問 「neuraxle」

タグ付けされた質問「neuraxle」