タグ付けされた質問 「dataframe」

データフレームは表形式のデータ構造です。通常、これには行が観測で列がさまざまなタイプの変数であるデータが含まれます。「データフレーム」または「データフレーム」は、いくつかの言語(R、Apache Spark、deedle、Maple、Pythonのpandasライブラリ、およびJuliaのDataFramesライブラリ)でこの概念に使用される用語ですが、「テーブル」は、 MATLABおよびSQL。

15
変数の値からpandas DataFrameを作成すると、「ValueError:すべてのスカラー値を使用する場合は、インデックスを渡す必要があります」
これは簡単な質問かもしれませんが、これを行う方法がわかりません。次のように2つの変数があるとしましょう。 a = 2 b = 3 これからDataFrameを構築したい: df2 = pd.DataFrame({'A':a,'B':b}) これはエラーを生成します: ValueError:すべてのスカラー値を使用する場合は、インデックスを渡す必要があります 私もこれを試しました: df2 = (pd.DataFrame({'a':a,'b':b})).reset_index() これにより、同じエラーメッセージが表示されます。

6
シリーズの真理値があいまいです。a.empty、a.bool()、a.item()、a.any()またはa.all()を使用します
or条件付きの結果データフレームのフィルタリングに問題があります。私の結果は、0.25を超え、-0.25未満のdfすべての列のvar値を抽出する必要があります。 以下のこのロジックは、あいまいな真理値を与えますが、このフィルタリングを2つの個別の操作に分割すると機能します。ここで何が起きてるの?提案された使用する場所がわからないa.empty(), a.bool(), a.item(),a.any() or a.all()。 result = result[(result['var']>0.25) or (result['var']<-0.25)]

12
Pandasデータフレームの2つの列に関数を適用する方法
のdf列を持つがあるとします'ID', 'col_1', 'col_2'。そして私は関数を定義します: f = lambda x, y : my_function_expression。 次に、の2つの列を要素ごとに適用しfて、新しい列を計算します。df'col_1', 'col_2''col_3' df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments (1 given)' 実行する方法 ? ** 以下のように詳細サンプルを追加します *** import pandas as pd df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]}) mylist = ['a','b','c','d','e','f'] def get_sublist(sta,end): return mylist[sta:end+1] #df['col_3'] …
368 python  pandas  dataframe 

10
データフレームから特定の列を抽出する
6列のRデータフレームがあり、列が3つだけの新しいデータフレームを作成します。 私のデータフレームをされたと仮定するとdf、私は列を抽出したいA、Bと、Eこれが唯一の私が把握することができますコマンドです: data.frame(df$A,df$B,df$E) これを行うよりコンパクトな方法はありますか?
365 r  dataframe  r-faq 

15
グループごとに変数を合計する方法
2列のデータフレームがあります。最初の列には「First」、「Second」、「Third」などのカテゴリが含まれ、2番目の列には「Category」から特定のグループを見た回数を表す数値が含まれています。 例えば: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 データをカテゴリ別に並べ替え、すべての頻度を合計したい: Category Frequency First 30 Second 5 Third 34 Rでこれをどのように実行しますか?
357 r  dataframe  aggregate  r-faq 

17
data.frame列を因子から文字に変換する
データフレームがあります。彼を呼んでみましょうbob: > head(bob) phenotype exclusion GSM399350 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399351 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399352 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399353 3- 4- 8- 25+ 44+ 11b- 11c- 19- …
352 r  dataframe 

11
データフレームのセルから値を取得するにはどうすればよいですか?
データフレームから1行だけを抽出する条件を作成しました。 d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] ここで、特定の列から値を取得したいと思います。 val = d2['col_name'] しかし、結果として、1つの行と1つの列(つまり 1つのセル)を含むデータフレームが得られます。それは私が必要とするものではありません。1つの値(1つの浮動小数点数)が必要です。パンダでどうすればいいですか?
344 python  pandas  dataframe 

9
データフレームのリストを1つのデータフレームに変換する
ある場所で、実際に単一のビッグデータフレームに変換したいデータフレームのリストが作成されるコードがあります。 似たような、しかしもっと複雑なことをしようとしていた以前の質問から、いくつかの指針を得ました。 これは私が始めているものの例です(これは説明のために大幅に簡略化されています): listOfDataFrames <- vector(mode = "list", length = 100) for (i in 1:100) { listOfDataFrames[[i]] <- data.frame(a=sample(letters, 500, rep=T), b=rnorm(500), c=rnorm(500)) } 私は現在これを使用しています: df <- do.call("rbind", listOfDataFrames)
336 list  r  dataframe 


14
パンダ:演算子チェーンを使用してDataFrameの行をフィルター処理する
でほとんどの操作pandasオペレータチェーン(で達成することができgroupby、aggregate、apply、など)が、私は、フィルタ行に見つけた唯一の方法は、通常のブラケットのインデックス経由で df_filtered = df[df['column'] == value] df値にフィルターをかける前に変数に割り当てる必要があるため、これは魅力的ではありません。次のようなものはありますか? df_filtered = df.mask(lambda x: x['column'] == value)
329 python  pandas  dataframe 



7
パンダのread_csv low_memoryおよびdtypeオプション
電話するとき df = pd.read_csv('somefile.csv') 私は得る: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130:DtypeWarning:列(4、5、7、16)には型が混在しています。インポート時にdtypeオプションを指定するか、low_memory = Falseを設定します。 dtypeオプションがに関連しているのはなぜですかlow_memory、なぜFalseこの問題を解決するのですか?

11
パンダを使用してデータフレームを保存する方法
現在CSV、スクリプトを実行するたびにかなり大きなデータフレームをインポートしています。スクリプトが実行されるのを待つためにすべての時間を費やす必要がないように、実行間でそのデータフレームを常に利用できるようにするための良い解決策はありますか?
317 python  pandas  dataframe 


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.