プログラミング pandas

21

Scikit-learnデータセットをPandasデータセットに変換する方法は？

Scikit-learn BunchオブジェクトからPandas DataFrameにデータを変換するにはどうすればよいですか？ from sklearn.datasets import load_iris import pandas as pd data = load_iris() print(type(data)) data1 = pd. # Is there a Pandas method to accomplish this?

106 dataset scikit-learn pandas

5

Seaborn Boxplotにタイトルを追加する方法

かなりGoogleに対応しているようですが、動作するオンラインのものが見つかりませんでした。との両方sns.boxplot('Day', 'Count', data= gg).title('lalala')を試しましたsns.boxplot('Day', 'Count', data= gg).suptitle('lalala')。どれもうまくいきませんでした。私はmatplotlibも使用しているためと思われます。

106 pandas matplotlib seaborn

6

Qlikのようにパンダデータフレームの列の一意の値を数えますか？

このようなテーブルがある場合： df = pd.DataFrame({ 'hID': [101, 102, 103, 101, 102, 104, 105, 101], 'dID': [10, 11, 12, 10, 11, 10, 12, 10], 'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'], 'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C'] }) count(distinct hID)Qlikで、一意のhIDのカウントを5にすることができます。パンダのデータフレームを使用してPythonでそれを行うにはどうすればよいですか？それとも、厄介な配列ですか？同様に、もしcount(hID)そうするとしたら、Qlikで8を取得します。パンダでそれを行うための同等の方法は何ですか？

106 python pandas numpy qlikview qliksense

4

パンダのdtype（ 'O'）とは何ですか？

パンダにデータフレームがあり、その値のタイプが何であるかを理解しようとしています。カラムのタイプがわかりません'Test'。しかし、を実行するとmyFrame['Test'].dtype、次のようになります。 dtype('O') これは何を意味するのでしょうか？

105 python pandas numpy dataframe types

5

Pandasデータフレーム内の列を整数から文字列に変換する

intとstrデータ列が混在するパンダのデータフレームがあります。最初にデータフレーム内の列を連結したいと思います。そのためには、int列をに変換する必要がありますstr。私は次のようにしようとしました： mtrx['X.3'] = mtrx.to_string(columns = ['X.3']) または mtrx['X.3'] = mtrx['X.3'].astype(str) しかし、どちらの場合も機能せず、「「str」オブジェクトと「int」オブジェクトを連結できない」というエラーが表示されます。2つのstr列を連結しても問題なく機能します。

105 python string pandas dataframe int

6

2つのデータフレームを結合するにはどうすればよいですか？

Pandasデータフレームを使用しています。最初のデータフレームがありますD。次のようにして、2つのデータフレームを抽出します。 A = D[D.label == k] B = D[D.label != k] 次に、ラベルを変更しA、B A.label = 1 B.label = -1 AとBを結合して、それらを1つのデータフレームとして、ユニオン演算のようなものにしたいと考えています。データの順序は重要ではありません。ただし、DからAとBをサンプリングすると、Dからのインデックスが保持されます。

105 python pandas

4

リストのインデックスに基づいてパンダの行を選択します

私はデータフレームdfを持っています： 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 次に、リストに示されている特定のシーケンス番号を持つ行を選択します。ここが[1,3]であるとします。 20061231 15.915 NaN 15.915 12.686 20070630 7.907 NaN 7.907 6.459 どのように、またはどのような機能でそれを行うことができますか？

105 python pandas

2

パンダのforループは本当に悪いのですか？いつ気にすべきですか？

あるforループは、実際には「悪いですか」？そうでない場合、どのような状況で、従来の「ベクトル化された」アプローチを使用するよりも優れていますか？1 私は「ベクトル化」の概念と、パンダが計算を高速化するためにベクトル化された手法をどのように使用するかをよく知っています。ベクトル化された関数は、シリーズ全体またはDataFrame全体に操作をブロードキャストし、従来のデータの反復よりはるかに高速化します。しかし、forループとリスト内包表記を使用してデータをループすることを含む問題の解決策を提供する多くのコード（Stack Overflowでの回答を含む）を提供していることに驚いています。ドキュメントとAPIは、ループは「悪い」ものであり、配列、系列、またはデータフレームを反復することは「決して」すべきではないと述べています。それで、ループベースのソリューションを提案しているユーザーを時々見るのはなぜですか？ 1-質問がいくぶん広範に聞こえることは事実ですが、forループは通常、従来のデータの反復よりも優れているという非常に特殊な状況があります。この投稿は、後世のためにこれを捉えることを目的としています。

105 python pandas iteration vectorization list-comprehension

6

Pythonパンダはセルにリストを挿入します

私はリスト「abc」とデータフレーム「df」を持っています： abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN リストをセル1Bに挿入したいので、次の結果が必要です。 A B 0 12 NaN 1 23 ['foo', 'bar'] どうすればいいですか？ 1）これを使用する場合： df.ix[1,'B'] = abc 次のエラーメッセージが表示されます。 ValueError: Must have equal len keys and value when setting with an iterable これは、リスト（2つの要素を持つ）を行/列に挿入しようとしますが、セルには挿入しないためです。 2）これを使用する場合： df.ix[1,'B'] = [abc] 次に、 …

105 python list pandas insert dataframe

7

Ipythonノートブック/ Jupyterでは、パンダがプロットしようとするグラフを表示していません

Ipython Notebookのパンダを使用していくつかのデータをプロットしようとしていますが、オブジェクトを取得できますが、実際にはグラフ自体はプロットされません。したがって、次のようになります。 In [7]: pledge.Amount.plot() Out[7]: <matplotlib.axes.AxesSubplot at 0x9397c6c> グラフはその後に続くはずですが、表示されません。私はmatplotlibをインポートしましたので、それは問題ではありません。インポートする必要がある他のモジュールはありますか？

104 python pandas ipython jupyter-notebook

3

インデックスとオブジェクトタイプではなく、Pandas DataFrameから値を取得する方法

次のDataFrameがあるとしましょう文字番号 A 1 B 2 C 3 D 4 これは次のコードで取得できます import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) 次に、文字列から値Cを取得します。コマンドライン df[df.Letters=='C'].Letters 戻ります 2 C 名前：文字、dtype：オブジェクト 2行全体ではなく、値Cのみを取得するにはどうすればよいですか？

104 python pandas dataframe

5

パンダのデータフレームに列を追加する

これはおそらく簡単ですが、次のデータがあります。データフレーム1： index dat1 0 9 1 5 データフレーム2： index dat2 0 7 1 6 次の形式のデータフレームが必要です。 index dat1 dat2 0 9 7 1 5 6 このappend方法を試してみましたが、クロス結合（つまり、デカルト積）を取得しました。これを行う正しい方法は何ですか？

104 python pandas

8

パンダ：名前がXで始まるすべての列を選択する最良の方法

私はデータフレームを持っています： import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, 4, 1, 0, 0, 5], 'nas.foo': ['NA', 0, 1, …

104 python pandas dataframe selection

7

パンダを使用して2つの列を比較する

これを出発点として使用する： a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 ifパンダの中でステートメントのようなものを使いたいです。 if df['one'] >= df['two'] and df['one'] <= df['three']: df['que'] = df['one'] 基本的に、ifステートメントを介して各行を確認し、新しい列を作成します。ドキュメントは使用すると言っています.allが、例はありません...

104 python pandas if-statement dataframe

2

特定の列でNaNを含む行を選択するにはどうすればよいですか？

このデータフレームを前提として、「Col2」がNaN？に等しい行のみを選択するにはどうすればよいですか？ In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"]) In [57]: df Out[57]: 0 1 2 0 0 1 2 1 0 NaN 0 2 0 0 NaN 3 0 1 2 4 0 1 2 結果は次のようになります。 Out[57]: 0 1 2 1 …

104 python pandas

タグ付けされた質問 「pandas」

タグ付けされた質問「pandas」