タグ付けされた質問 「neuraxle」

20
scikit-learnの複数の列にわたるラベルエンコーディング
文字列ラベルのLabelEncoderパンダをエンコードするためにscikit-learnを使用しようとしていますDataFrame。データフレームには多数(50以上)の列があるLabelEncoderため、列ごとにオブジェクトを作成しないようにします。私はむしろ、データのすべての列LabelEncoderにわたって機能する1つの大きなオブジェクトが欲しいだけです。 全体DataFrameをにLabelEncoderスローすると、以下のエラーが発生します。ここではダミーデータを使用していることに注意してください。実際には、文字列でラベル付けされたデータの約50列を扱っているため、名前で列を参照しないソリューションが必要です。 import pandas from sklearn import preprocessing df = pandas.DataFrame({ 'pets': ['cat', 'dog', 'cat', 'monkey', 'dog', 'dog'], 'owner': ['Champ', 'Ron', 'Brick', 'Champ', 'Veronica', 'Ron'], 'location': ['San_Diego', 'New_York', 'New_York', 'San_Diego', 'San_Diego', 'New_York'] }) le = preprocessing.LabelEncoder() le.fit(df) トレースバック(最後の最後の呼び出し):ファイル ""、行1、ファイル "/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/preprocessing/label.py"、行103、フィットy = column_or_1d(y、warn = True)ファイル "/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/utils/validation.py"、line 306、in column_or_1d raise ValueError( "bad …

3
Python-正確にはsklearn.pipeline.Pipelineとは何ですか?
どのようにsklearn.pipeline.Pipeline動作するのか正確に理解できません。 ドキュメントにいくつかの説明があります。たとえば、次の意味は何ですか。 最終的な推定量を使用した変換のパイプライン。 私の質問をより明確にするために、何stepsですか?それらはどのように機能しますか? 編集する 回答のおかげで、質問をより明確にすることができます: パイプラインを呼び出して、ステップとして、2つのトランスフォーマーと1つの推定器を渡します。例: pipln = Pipeline([("trsfm1",transformer_1), ("trsfm2",transformer_2), ("estmtr",estimator)]) これを呼び出すとどうなりますか? pipln.fit() OR pipln.fit_transform() 推定器を変圧器にする方法や、変圧器を取り付ける方法を理解できません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.