タグ付けされた質問 「pandas」

Pandasは、データの操作と分析のためのPythonライブラリです。たとえば、データフレーム、多次元時系列、統計、実験科学の結果、計量経済学、金融などでよく見られる断面データセットです。Pandasは、Pythonの主要なデータサイエンスライブラリの1つです。

10
Pandasシリーズ/ DataFrame全体をきれいに印刷する
端末でSeriesとDataFrameをよく使用します。__repr__Series のデフォルトは、いくつかの頭と尾の値を含む減少したサンプルを返しますが、残りは欠落しています。 Series / DataFrame全体をきれいに印刷する組み込みの方法はありますか?理想的には、列間の境界線や、異なる列の色分けなど、適切な配置をサポートします。
654 python  pandas  dataframe 

3
iloc、ix、locの違いは何ですか?
誰かがこれらの3つのスライス方法がどのように異なるか説明できますか? 私はドキュメントを見て、これらの 答えを見ましたが、それでも私は3つがどのように違うのか説明することができません。私にとっては、スライスのレベルが低いため、それらは大部分が交換可能に見えます。 たとえば、の最初の5行を取得するとしDataFrameます。これら3つすべてがどのように機能するのですか? df.loc[:5] df.ix[:5] df.iloc[:5] 誰かが使用の区別がより明確な3つのケースを提示できますか?

15
パンダでSettingWithCopyWarningを処理する方法?
バックグラウンド パンダを0.11から0.13.0rc1にアップグレードしました。現在、アプリケーションは多くの新しい警告を表示しています。それらの1つはこのような: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE どういう意味か知りたいのですが?何かを変更する必要がありますか? 使用を主張した場合、警告を一時停止する必要がありますquote_df['TVol'] = quote_df['TVol']/TVOL_SCALEか? エラーを出す関数 def _decode_stock_quote(list_of_150_stk_str): """decode the webpage and return dataframe""" from cStringIO import StringIO str_of_all = "".join(list_of_150_stk_str) quote_df …

16
出力表示を展開して、pandas DataFrameの列をさらに表示するにはどうすればよいですか?
対話モードまたはスクリプト実行モードで出力の表示を広げる方法はありますか? 具体的にはdescribe()、パンダでこの関数を使用していますDataFrame。ときにDataFrame広い5列(ラベル)ですが、私は私が欲しい記述統計を取得します。ただし、DataFrameさらに列がある場合、統計は抑制され、次のようなものが返されます。 >> Index: 8 entries, count to max >> Data columns: >> x1 8 non-null values >> x2 8 non-null values >> x3 8 non-null values >> x4 8 non-null values >> x5 8 non-null values >> x6 8 non-null values >> x7 8 non-null values 「8」の値は、列が6つあるか7つあるかを示します。「8」は何を意味しますか? 私はすでにIDLEウィンドウを大きくドラッグし、「IDLEの構成」幅オプションを増やして、役に立たないようにしました。 パンダを使用する私の目的は、describe()基本的なデータ操作と調査を行うためにStataのような2番目のプログラムを使用しないようにすることです。

10
列の値に基づいてパンダのDataFrame行を削除する
次のDataFrameがあります。 daysago line_race rating rw wrating line_date 2007-03-31 62 11 56 1.000000 56.000000 2007-03-10 83 11 67 1.000000 67.000000 2007-02-10 111 9 66 1.000000 66.000000 2007-01-13 139 10 83 0.880678 73.096278 2006-12-23 160 10 88 0.793033 69.786942 2006-11-09 204 9 52 0.636655 33.106077 2006-10-22 222 8 66 0.581946 38.408408 2006-09-29 …
511 python  pandas 

9
Pandas GroupBy出力をSeriesからDataFrameに変換する
私はこのような入力データから始めています df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) 印刷すると次のようになります。 City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory グループ化は非常に簡単です: g1 = df1.groupby( …


21
Pandas DataFrameで値がNaNかどうかを確認する方法
Python Pandasで、DataFrameに1つ(または複数)のNaN値があるかどうかを確認する最良の方法は何ですか? 私は関数について知っていますpd.isnanが、これは各要素に対してブール値のDataFrameを返します。この投稿はここでも私の質問に正確に答えるものではありません。
483 python  pandas  dataframe  nan 

20
インデックスを使用して、pandas DataFrameの特定のセルに値を設定します
Pandas DataFrameを作成しました df = DataFrame(index=['A','B','C'], columns=['x','y']) そしてこれを手に入れました xy NaN NaN B NaN NaN C NaN NaN 次に、特定のセル、たとえば行「C」と列「x」に値を割り当てたいと思います。私はそのような結果を得ることを期待していました: xy NaN NaN B NaN NaN C 10 NaN このコードで: df.xs('C')['x'] = 10 の内容はdf変更されていません。これもNaNDataFrameにのみ存在します。 助言がありますか?
478 python  pandas  dataframe 

10
パンダのマップ、applymap、applyメソッドの違い
基本的な例でこれらのベクトル化方法をいつ使用するか教えてもらえますか? 私は見mapているSeries残りの部分であるのに対し、法DataFrame方法。applyとapplymap方法について混乱しました。関数をDataFrameに適用する方法が2つあるのはなぜですか?繰り返しになりますが、使用法を説明する簡単な例はすばらしいでしょう。

15
パンダデータフレームをNumPy配列に変換
パンダのデータフレームをNumPy配列に変換する方法を知りたいです。 データフレーム: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan] df = pd.DataFrame({'A': a, …

5
空のPandas DataFrameを作成して、それを埋めますか?
私はここでpandas DataFrameドキュメントから始めています:http ://pandas.pydata.org/pandas-docs/stable/dsintro.html DataFrameに、時系列の計算の値を繰り返し入力します。したがって、基本的には、DataFrameを列A、B、およびタイムスタンプ行ですべて0またはすべてNaNで初期化したいと思います。 次に、初期値を追加し、このデータを調べて、前の行から新しい行を計算します。 row[A][t] = row[A][t-1]+1ます。 私は現在以下のコードを使用していますが、それはちょっと見苦しい感じがします。DataFrameを使用してこれを直接実行する方法、または一般的にはより良い方法が必要です。注:Python 2.7を使用しています。 import datetime as dt import pandas as pd import scipy as s if __name__ == '__main__': base = dt.datetime.today().date() dates = [ base - dt.timedelta(days=x) for x in range(0,10) ] dates.sort() valdict = {} symbols = ['A','B', 'C'] for symb …
461 python  dataframe  pandas 

24
Pandas DataFrameの列のNaN値をカウントする方法
私はの数を見つけたいデータを持っているNaNので、あるしきい値よりも小さい場合は、この列を削除します。私は見ましたが、このための機能を見つけることができませんでした。はありますがvalue_counts、ほとんどの値は別個であり、カウントNaNのみを必要とするため、私には時間がかかります。
461 python  pandas  dataframe 

12
パンダデータフレームの列ですべてのNaN値をゼロに置き換えるにはどうすればよいですか
以下のようなデータフレームがあります itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 75 485 2012-09-30 00:00:00 113702 76 …
457 python  pandas  dataframe 


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.