タグ付けされた質問 「pandas」

Pandasは、データの操作と分析のためのPythonライブラリです。たとえば、データフレーム、多次元時系列、統計、実験科学の結果、計量経済学、金融などでよく見られる断面データセットです。Pandasは、Pythonの主要なデータサイエンスライブラリの1つです。


5
Seaborn Boxplotにタイトルを追加する方法
かなりGoogleに対応しているようですが、動作するオンラインのものが見つかりませんでした。 との両方sns.boxplot('Day', 'Count', data= gg).title('lalala')を試しましたsns.boxplot('Day', 'Count', data= gg).suptitle('lalala')。どれもうまくいきませんでした。私はmatplotlibも使用しているためと思われます。

6
Qlikのようにパンダデータフレームの列の一意の値を数えますか?
このようなテーブルがある場合: df = pd.DataFrame({ 'hID': [101, 102, 103, 101, 102, 104, 105, 101], 'dID': [10, 11, 12, 10, 11, 10, 12, 10], 'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'], 'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C'] }) count(distinct hID)Qlikで、一意のhIDのカウントを5にすることができます。パンダのデータフレームを使用してPythonでそれを行うにはどうすればよいですか?それとも、厄介な配列ですか?同様に、もしcount(hID)そうするとしたら、Qlikで8を取得します。パンダでそれを行うための同等の方法は何ですか?

4
パンダのdtype( 'O')とは何ですか?
パンダにデータフレームがあり、その値のタイプが何であるかを理解しようとしています。カラムのタイプがわかりません'Test'。しかし、を実行するとmyFrame['Test'].dtype、次のようになります。 dtype('O') これは何を意味するのでしょうか?

5
Pandasデータフレーム内の列を整数から文字列に変換する
intとstrデータ列が混在するパンダのデータフレームがあります。最初にデータフレーム内の列を連結したいと思います。そのためには、int列をに変換する必要がありますstr。私は次のようにしようとしました: mtrx['X.3'] = mtrx.to_string(columns = ['X.3']) または mtrx['X.3'] = mtrx['X.3'].astype(str) しかし、どちらの場合も機能せず、「「str」オブジェクトと「int」オブジェクトを連結できない」というエラーが表示されます。2つのstr列を連結しても問題なく機能します。
105 python  string  pandas  dataframe  int 

6
2つのデータフレームを結合するにはどうすればよいですか?
Pandasデータフレームを使用しています。最初のデータフレームがありますD。次のようにして、2つのデータフレームを抽出します。 A = D[D.label == k] B = D[D.label != k] 次に、ラベルを変更しA、B A.label = 1 B.label = -1 AとBを結合して、それらを1つのデータフレームとして、ユニオン演算のようなものにしたいと考えています。データの順序は重要ではありません。ただし、DからAとBをサンプリングすると、Dからのインデックスが保持されます。
105 python  pandas 

4
リストのインデックスに基づいてパンダの行を選択します
私はデータフレームdfを持っています: 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 次に、リストに示されている特定のシーケンス番号を持つ行を選択します。ここが[1,3]であるとします。 20061231 15.915 NaN 15.915 12.686 20070630 7.907 NaN 7.907 6.459 どのように、またはどのような機能でそれを行うことができますか?
105 python  pandas 

2
パンダのforループは本当に悪いのですか?いつ気にすべきですか?
あるforループは、実際には「悪いですか」?そうでない場合、どのような状況で、従来の「ベクトル化された」アプローチを使用するよりも優れていますか?1 私は「ベクトル化」の概念と、パンダが計算を高速化するためにベクトル化された手法をどのように使用するかをよく知っています。ベクトル化された関数は、シリーズ全体またはDataFrame全体に操作をブロードキャストし、従来のデータの反復よりはるかに高速化します。 しかし、forループとリスト内包表記を使用してデータをループすることを含む問題の解決策を提供する多くのコード(Stack Overflowでの回答を含む)を提供していることに驚いています。ドキュメントとAPIは、ループは「悪い」ものであり、配列、系列、またはデータフレームを反復することは「決して」すべきではないと述べています。それで、ループベースのソリューションを提案しているユーザーを時々見るのはなぜですか? 1-質問がいくぶん広範に聞こえることは事実ですが、forループは通常、従来のデータの反復よりも優れているという非常に特殊な状況があります。この投稿は、後世のためにこれを捉えることを目的としています。

6
Pythonパンダはセルにリストを挿入します
私はリスト「abc」とデータフレーム「df」を持っています: abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN リストをセル1Bに挿入したいので、次の結果が必要です。 A B 0 12 NaN 1 23 ['foo', 'bar'] どうすればいいですか? 1)これを使用する場合: df.ix[1,'B'] = abc 次のエラーメッセージが表示されます。 ValueError: Must have equal len keys and value when setting with an iterable これは、リスト(2つの要素を持つ)を行/列に挿入しようとしますが、セルには挿入しないためです。 2)これを使用する場合: df.ix[1,'B'] = [abc] 次に、 …

7
Ipythonノートブック/ Jupyterでは、パンダがプロットしようとするグラフを表示していません
Ipython Notebookのパンダを使用していくつかのデータをプロットしようとしていますが、オブジェクトを取得できますが、実際にはグラフ自体はプロットされません。したがって、次のようになります。 In [7]: pledge.Amount.plot() Out[7]: <matplotlib.axes.AxesSubplot at 0x9397c6c> グラフはその後に続くはずですが、表示されません。私はmatplotlibをインポートしましたので、それは問題ではありません。インポートする必要がある他のモジュールはありますか?

3
インデックスとオブジェクトタイプではなく、Pandas DataFrameから値を取得する方法
次のDataFrameがあるとしましょう 文字番号 A 1 B 2 C 3 D 4 これは次のコードで取得できます import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) 次に、文字列から値Cを取得します。 コマンドライン df[df.Letters=='C'].Letters 戻ります 2 C 名前:文字、dtype:オブジェクト 2行全体ではなく、値Cのみを取得するにはどうすればよいですか?
104 python  pandas  dataframe 

5
パンダのデータフレームに列を追加する
これはおそらく簡単ですが、次のデータがあります。 データフレーム1: index dat1 0 9 1 5 データフレーム2: index dat2 0 7 1 6 次の形式のデータフレームが必要です。 index dat1 dat2 0 9 7 1 5 6 このappend方法を試してみましたが、クロス結合(つまり、デカルト積)を取得しました。 これを行う正しい方法は何ですか?
104 python  pandas 


7
パンダを使用して2つの列を比較する
これを出発点として使用する: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 ifパンダの中でステートメントのようなものを使いたいです。 if df['one'] >= df['two'] and df['one'] <= df['three']: df['que'] = df['one'] 基本的に、ifステートメントを介して各行を確認し、新しい列を作成します。 ドキュメントは使用すると言っています.allが、例はありません...

2
特定の列でNaNを含む行を選択するにはどうすればよいですか?
このデータフレームを前提として、「Col2」がNaN?に等しい行のみを選択するにはどうすればよいですか? In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"]) In [57]: df Out[57]: 0 1 2 0 0 1 2 1 0 NaN 0 2 0 0 NaN 3 0 1 2 4 0 1 2 結果は次のようになります。 Out[57]: 0 1 2 1 …
104 python  pandas 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.